其三是人才不足限制了大数据产业创新发展的成效。清华大学计算机系教授武永卫透露的数据显示,未来3至5年,中国需要180万数据人才,但截至目前,中国大数据从业人员只有约30万人。
同时,大数据行业选才的标准也在不断变化。初期,大数据人才的需求主要集中在ETL研发、系统架构开发、数据仓库研究等偏硬件领域,以IT、计算机背景的人才居多。随着大数据往各垂直领域延伸发展,对统计学、数学专业的人才,数据分析、数据挖掘、人工智能等偏软件领域的需求加大。
其四,行业应用不深入。赛迪顾问股份有限公司大数据产业研究中心提供的数据显示,互联网、金融和电信三大领域的大数据应用在各行业总规模中所占比重超过70%;健康医疗领域和交通领域近年不断“上架”新应用,但行业规模占比相对较小;而在其他众多民生领域,大数据应用仍处于浅层次信息化层面,行业发展水平参差不齐。
“目前,大数据在多个行业尚未与业务实现深度融合,应用场景创新不足,大数据技术人员需要提升行业业务知识和经验。”百分点首席数据科学家杜晓梦表示,国内很多行业仍仅在局部业务上使用大数据技术,仅掌握数据挖掘和分析技术,如不能将技术与业务全面、深度地融合,则无法完全发掘出数据应用的真正价值。
顶层设计牵引产业发展
对于数据开放和共享,工信部赛迪研究院软件所所长潘文建议,应建立完善大数据发展协调机制,加快政府数据开放共享,稳步推动公共数据资源开放。同时,统筹规划大数据基础设施建设,推动制定公共信息资源保护和开放的制度性文件,并加强大数据标准化顶层设计,逐步完善标准体系。
在数据共享方面,贵阳大数据交易所已经做出成功的尝试。贵阳市政府有关人士表示,若想打通城市现存的信息壁垒,就要让城市多方资源联动起来,搭建城市数据共享的平台,从而激活大数据价值,充分发挥数据资源整合的优质效应,用信息化手段辅助科学决策。
潘文表示,国家层面应支持大数据共性关键技术研究,加强海量数据存储、数据清洗、数据分析发掘、数据可视化等领域关键技术攻关,并支持自然语言理解、机器学习、深度学习等人工智能技术创新。
记者注意到,在高端人才稀缺的现实情况下,目前国内企业多选择从海外和传统行业挖掘跨界人才,但仍然无法满足国内市场的大量需求。针对大数据人才供应不足的现象,各种培训机构和各大高校也开始强化大数据人才的培养。但培养大数据人才需要时间,短期内大数据领域的高端人才仍然会呈现供不应求的状态。
对于大数据人才建设,多位业内专家表示,应建立适应大数据发展需求的人才培养和评价机制,并建立健全多层次、多类型的大数据人才培养体系。同时,还要完善配套措施,培养大数据领域创新型领军人才,吸引海外大数据高层次人才来华就业、创业。
去年,教育部公布了第二批获准开设“数据科学与大数据技术”的高校名单,加上第一批获批的北京大学、对外经济贸易大学、中南大学,一共有35所高校获批开设该专业。今年开始,部分院校将招收第一届大数据专业本科生。
在行业应用方面,《大数据产业发展规划(2016—2020)》提出,到2020年,大数据相关产品和服务业务收入突破1万亿元,年均复合增长率保持30%左右,大数据在创新创业、政府管理和民生服务等方面广泛深入应用。未来如何在搜集、储存大数据的基础上更好地整合、分析和应用,将成为优化“数据大脑”的重点课题。
清华大学新闻与传播学院教授沈阳表示,目前国内的大数据应用侧重于数据收集,在基础统计分析、风险感知和预测方面还有较大提升空间。同时,也不能在尚未明晰具体业务应用场景的情况下盲目追求大数据,而要以应用场景为牵引,只汇集不分析或者片面追求大而全,都不利于大数据发挥其对生产力提升的促进作用。此外,在大数据广泛运用于创新创业、政府管理和民生服务等方面的同时,也应认识到,大数据对社会的冲击有多大,社会对于大数据发展的回应、规范和约束就应有多大。