新产业倒逼新环境 ——“大数据时代的上海机遇”

从大数据产业掘金,对于上海的重要意义不言而喻。最近,不少政府委办、高校,纷纷研讨“大数据产业”,希望加快产业推进步伐。但在一片热闹声中,我们是否意识到,大数据产业之“新”不仅在于技术,更在于它将深刻影响产业链和社会运行模式,倒逼我们营造适应新产业的新环境。

培养“数据科学家”正当时

据统计,当今世界在24小时之内,就可以产生出相当于16.8亿张DVD容量的数据;产生2940亿封电子邮件,相当于全美国在2年中产生的纸质邮件。人类至今获得的全部数据,有90%是在过去两年产生的。在如此庞大的数据海洋里寻找有用信息,如同在一堆干草垛中找寻一根针。简言之,并不是拥有海量的数据就能“自然而然”地挖掘出背后的价值,其带来的“干草垛”负面效应,足够让无准备者手忙脚乱。

从数据海洋中寻找有价值的信息和应用,提高数据资源挖掘利用效率的新技术显得尤为迫切。复旦大学计算机学院教授朱扬勇认为,眼下相比于大数据产业的热门,对于数据学科的一些基础研究却乏人问津。他认为有必要建立一个专门的学科,可以叫数据科学或数据学,它为许多学科和领域的大数据研究提供基础理论和方法,在此基础上,再逐步形成细分领域的数据学,如:生物信息学、气象数据学、金融数据学、地理数据学,等等。

这意味着传统的按学科分类培养人才的模式也需要创新。大数据产业需要这样一批善于融合多学科知识的人才:既能立足于信息科学,探索大数据的获取、存储、处理、挖掘等创新技术与方法,也能从管理的角度探讨大数据对于现代企业生产管理和商务运营决策等带来的变革和冲击。多年来,有识之士一直建议,上海应加快跨学科人才的培养。此类人才不仅精通技术,更懂得如何将技术应用于商业决策。如果培养“数据科学家”的提议得到落实,将是上海创新人才培养模式的一个契机。

数据分享利用需要立法

如果说“干草垛”效应的解决之道,还能依靠新技术的研究、跨学科人才的培养来解决;那么合理规范使用大数据,更会倒逼互联网法律规范的完善。

大数据价值的体现,离不开共享,但由于相当一部分数据涉及普通人隐私,因此数据的使用,尤其是商业使用,应该有权益边界。比如,数据收集原本应该告知客户其商业目的,但大数据时代来临后,挖掘出的数据很可能转换为其他的应用。上海交大媒体与设计学院教师、新媒体专家魏武挥举例,目前相当一部分个人数据,已经掌握在不同机构、公司手中。例如,公安交警部门有驾照信息、银行有信用卡账单信息、医院有健康信息。设想有一天,一些商业机构以“提供更精准服务”为名,同时拥有了这些原本分散在各个机构间的数据,挖掘出潜在商业价值,推送更多商品广告……作为消费者是否会不胜其扰?

再如,以前数据的保存有时效性,过了规定的时间,数据自然会销毁。但在大数据时代,数据即使在A公司被销毁,也有可能继续留存于B公司的数据库中。换言之,数据会一直保留着,使用界限也随之模糊,从而造成更可怕的潜在威胁。

市科委信息技术处正酝酿组建大数据产业联盟。据相关负责人介绍,联盟中大多数成员仍以科技企业为主,“我们特别希望有法律界人士参与进来,一起规范数据的属性。依法用好数据,是大数据产业不可回避的问题。”越来越多的业内人士正在形成共识:对数据分享利用设定法律约束,已刻不容缓。中国互联网协会法律专家胡钢律师认为,对于商业机构来说,数据的保存、共享,应当遵循“最少、够用”标准;从社会的角度来说,互联网法律法规重要性凸显,急需做出相应的调整。只有多管齐下,才能应对隐私问题的挑战。

关注大数据潜在风险

大数据突然“大热”,也令不少IT企业跃跃欲试,但理性来看,大数据产业的成熟,离不开“分步走”战略。商业数据处理与分析公司邓韩贝中国区商务总监李焕民认为,第一步是企业对自己内部拥有的数据做前期整合与应用,例如在企业内建立数据仓库等,满足企业通用性决策的需求。第二步是走出企业,做企业内外部数据的融合与分析。比方说,对一家银行来讲,由于信用卡支付涉及到不同行业的零售商或品牌,只是分析自有的信用卡数据,很可能无法完全理解客户的真实需求,这就需要整合不同商家的信息进行分析。第三步是成为一家以数据驱动的、以顾客为中心的新型公司,这会涉及到管理思路的变革。