电信大数据关键技术挑战

电信大数据核心资产是海量用户的7个维度信息。如图3所示,这些数据可以支撑对内和对外服务优化,如全生命周期的用户管理和基于位置的服务。用户洞察的核心是围绕用户回答7个W的问题:who(用户ID)、when(时间)、where(空间)、what(行为结果)、how(行为过程)、why(行为根本原因)、Web(社交)。通过7D用户数据建模实现7W洞察是电信大数据分析的核心需求。

 

 

图 3 7 维度用户数据建模和 7W 洞察

大数据时代,建模思维逐渐从研究各种映射算法到研究数据本身,如从丰富的数据中抽取更加合理的特征表示、从数据中根据业务规则自动定义标签和训练数据以及利用用户营销反馈数据,自动化整个营销流程等。从数据出发,寻求合适、好用的算法是建模的核心。清晰定义训练数据,熟悉业务流程,才能将挖掘算法的价值发挥到最大。用户和基站联接行为将BSS和OSS数据打通,因此通用的用户模型可以用二分图表示,即一层节点是用户,另一层节点是网络,两层节点之间的边表示用户联接网络的时间。总体而言,可以通过电信大数据的二分图表示实现用户洞察、网络洞察和数据开放3个业务目标。