2 电信大数据分析
电信大数据平台是一个提供统一数据存储、分析处理、数据服务的云计算平台。如图2所示,平台需要融合并存储来自BSS(B域)和OSS(O域)系统的数据,提供6种通用数据的处理。BSS是商业支撑系统,包括客户关系、计费、营销和传统商业智能系统,记录用户的话单、账单、基础信息和营销反馈记录。BSS数据特点是量小(约占电信大数据总量的3%)、汇总、离线(非实时更新)、贴近用户行为。OSS是网络运营支撑系统,包括基站、传输、固网和核心网等网络单元(CS系统负责语音/短信、PS系统负责上网流量),记录大量信令数据,包括用户联接网络体验、互联网内容和位置信息。OSS数据特点是量大(约占电信大数据总量97%,主要是位置数据和互联网内容数据)、精细、实时和贴近网络行为。以600万个活跃用户为例,每天产生大约14 TB数据,这些数据大部分来自OSS,通过扩展,可估算中国12亿用户每天产生的数据量。尽管数据来源不同,但所有数据可抽象为六大通用数据类型,分别是时空数据、图数据、表数据、流数据、多媒体数据和文本数据。建模算法可以面向这六大类通用数据类型进行设计和部署。
图 2 融合 BSS 和 OSS 数据