近日,由中国电子学会主办,中国电子学会云计算专家委员会和中国云计算技术与产业联盟承办的“云计算与大数据”专题研讨会在北京京西宾馆隆重召开。中国电子学会名誉理事长、原信息产业部吴基传部长,以及工业和信息化部周子学总经济师先后致辞,对中国电子学会精准把握新一代信息技术发展特征表示肯定,对召开大数据方向具有前瞻性、基础性的研讨会表示祝贺。出席本次研讨会的领导和嘉宾还有:工业和信息化部软件与服务业司陈伟司长、李未院士、李德毅院士、倪光南院士、中国电子学会副理事长刘汝林、中国电子学会秘书长徐晓兰、中国电子学会副秘书长林润华以及中国电子学会云计算专家委员会和中国云计算技术与产业联盟的专家代表共50余人。
研讨会由中国电子学会云计算专家委员会主任委员李德毅院士主持,李未院士、李德毅院士、百度公司技术委员会理事长陈尚义博士、中科院计算所何清研究员、中国移动通信研究院钱岭研究员、北京友友天宇系统技术有限公司总经理姚宏宇博士分别就云计算与大数据话题发表了精彩的主题演讲。
“四面体模型实现非结构化数据管理”
在李未院士看来,软件产业面临了三次浪潮,第一是结构化数据+算法,其主要基础软件是操作系统如Windows与数据库;第二是半结构化数据+搜索,形成了诸多搜索引擎如百度、Google还有电子商务如亚马逊;第三是非结构化数据服务+即时服务,代表是非结构化数据管理系统和集成的各种服务。
大数据时代,数据模型变得更为重要,增加了智能化处理、关联化检索以及知识挖掘等数据模型要实现深度提取和共享,需要新的改变。李未院士带领团队自2009年开始,特别研发了高级非结构化数据——四面体模型,以统一数据模型为突破口,结合文本图象,图形、音频、视频的特性实现新型非结构化数据的管理系统。
李未院士指出,未来90%的数据将是非结构化数据,而且增长迅猛,针对非结构化数据建立新型数据模型是非结构化数据管理系统的关键,李未院士提出四面体模型(即基本属性刻面、语义特征刻面、底层特征刻面、原始数据刻面),四面体模型具有完备、关联、集成、可扩展等特性,易于实现对超量的非结构化数据创建、维护与管理,可以成为非结构化数据模型的标准,必须使用群体软件工程的理念和技术来生成、管理和维护非结构化数据。四面体模型已经在500万个非机构化样例中得到了广泛测试,未来还将进一步从传感器开始,更多地通过群体软件来完善非结构化数据中的四面体。
“宽带不宽制约大数据发展”
李德毅院士:宽带不宽依然是制约云计算与大数据发展的瓶颈
在第四届中国云计算大会上,李德毅院士曾明确指出“宽带不宽”制约了云计算的发展。如今面对大数据,李德毅院士仍然表示:“互联网和云计算是大数据产生的基础,宽带不宽依然是制约云计算与大数据发展的瓶颈。”
围绕“什么是大数据,如何处理大数据”,李德毅院士列举了数据具有低密度价值的特征,需求特点是用户驱动型,并着重以位置云服务为例,说明目前大数据在行业中的应用现状。而通过科学发展与目前大数据技术的关联,以及大数据发展中存在的技术限制,李德毅院士表示:“现在不一定先有科学后又技术,很可能是技术中有科学,科学中有技术。大数据时代的科学价值(正在一步步体现)。”
“大数据带来产业变革”
陈尚义博士从百度大数据特征入手,分析了大数据带来的技术和产业变革,认为目前数据规模及增长速度超越了处理能力,在数据智能成为现实的同时也引发新的安全危机,改变了学术研究和技术革新的思路,而且创新模式发生了根本改变。
何清研究员从大数据的演化、数据挖掘发展历程、大数据挖掘云服务实践三个方面指出大数据挖掘算法往往是高复杂度甚至是NP难题,需要尽量把全局最优问题转化成局部最优的问题,需要采用高效并行策略等。钱岭研究员回顾了大数据处理技术发展概况,指出电信运营商对大数据的需求点,最后通过大云2.0阐述了中国移动在大数据应用实践方面的创新。姚宏宇博士分析大用户特征在于增长爆发性、使用突发性、需求易变性、关联网络效应;大数据特征在于数据量(Volume)、数据多样性(Variety)、数据吞吐量(Velocity)、数据内容(Value);大系统特征在于系统高可用性、管理压力与维护成本、性能线性延展、需求多样性等,并对大用户、大数据、大系统所面临的机遇与挑战进行了详尽的阐述。与会嘉宾纷纷对云计算与大数据技术、商业模式及未来的融合创新趋势展开了热烈的讨论。
大数据正影响着企业商业模式的转变,对大数据进行处理、分析及整合正成为提升企业核心竞争力的有效方式。2012年3月,美国政府更是拨款2亿美元启动“大数据研究和发展倡议”计划。本次研讨会正是在此背景下,邀请国家相关部委主管领导、云计算及大数据领域的著名院士专家,针对云计算与大数据等重要问题进行探讨研究,为推动国内大数据技术发展与产业变革做出积极探索。