“因为他们抓住了机遇!”尽管已经过去了1年,当于渌讲起中国科研团队在中微子领域取得的科研成就时仍表现得十分激动,“当时的国际竞争非常激烈,要不是中国团队提前开始采集数据,也不会提前其他国家研究组几个星期得到这个结果。”
这位中国科学院院士以此来说明重大科研任务面前作出“战略判断”的重要性。今天,中国科学院在京对外发布了《科技发展新态势与面向2020年的战略选择》战略研究报告(以下简称报告),这是包括于渌在内的中国科学院200多名专家耗时1年多研究得出的。
4年前,几乎是同一群专家费时两年时间绘制出一份中国到2050年的科技发展路线图即《创新2050:科学技术与中国的未来》研究报告,随即轰动国内外。时任中科院院长路甬祥以“人无远虑,必有近忧”来形容这份报告,如今,这一研究组的专家在研究“远虑”后将目标瞄向“近忧”,针对未来5~10年即2020年科技发展新态势进行研究。
“瞄向未来的7年,时间尺度更近,更紧。”中科院院长白春礼如是描述两者的区别,更为重要的是,在第六次科技革命的前夜,中国科研人员乃至科研机构怎么走,“如何实现我们的创新跨越发展”,这份发展图或能给出一个参考。
集成电路领域正在进入“后摩尔时代”,计算机逐步进入“后PC时代”,“Wintel”平台正在瓦解,互联网必将进入“后IP时代”……今天,中科院院士、计算技术研究所研究员李国杰用一连串以“后”开头的名词介绍了未来5~10年信息网络领域将有的科技突破。而这只是报告涉及的10个领域的一部分,也是当天报告预测和描述未来5~10年重要领域科技发展图景的一小块。
在报告的总论部分,提出了世界可能发生的重大科技事件、中国可能产生的重大科技突破以及需要加强或加快布局的科技战略重点。其中最引人注目的莫过于未来5~10年世界可能发生的22个重大科技事件,如中微子振荡实验有望加快破解“反物质消失之谜”,量子信息技术将成为下一代信息技术的先导和基础,石墨烯将成为“后硅时代”的新潜力材料,基于干细胞的新的生命繁衍方式将会出现,等等。
报告称,这其中有七大领域和方向,需要中国加强布局,分别是江门中微子实验、暗物质和暗能量的研究与探测,大数据科学平台研究,脑认知科学重大问题,“人造生命”与合成生物学,光合作用机理,“人造叶绿体”研究和青藏高原地球系统的可持续研究。
大数据科学或成科学研究的最新范式,但国内部署几近空白
尤其值得注意的是大数据科学研究,“不光是搞统计的,搞代数的,乃至做拓扑的科学家都关注大数据。”李国杰如是说。报告也专门将这一分领域的变化拎到总论中作如下表述:与实验科学、理论分析和计算机模拟这三种经典科研范式相比,大数据科学将成为一种全新的科研范式。
数据无处不在,麦肯锡全球研究院预测,到2020年,全球数据使用量预计相对于2011年将暴增44倍,达到35ZB。具体而言,数字信息从各种各样的传感器、测试仪器、模拟实验室、文化娱乐企业和个人使用的数字终端中源源不断地涌出。报告称,超过传统数据库系统处理能力的海量数据即大数据隐含巨大价值,以网络数据为例,报告称,网络数据之间的相互关系其实是人与人的相互关系。
然而,这其中许多数据缺失、重复或是没有价值。对科学家而言,未来的主要任务不是获取越来越多的数据,而是进行数据的去冗分类,去粗取精,从数据中挖掘知识。报告称,几百年来,科学研究一直在做“从薄到厚”的事情,把“小数据”变成“大数据”,而现在要做的事情是“从厚到薄”,要把“大数据”变成“小数据”。
尽管学术界已经注意到大数据带来的机遇和挑战,但对大数据提出的科学挑战问题还没有形成共识。2007年,已故的图灵奖获得者吉姆·格雷在他的最后一次演讲中描绘了科研“第四范式”的愿景,将大数据科学从第三范式即计算机模拟中分离出来。谷歌公司研究部主任皮特的一句名言可以概括两者的区别:“所有的模型都是错误的,没有这些模型反而增加你成功的机会。”报告认为,谷歌的广告优化配置、战胜人类的“IBM沃森问答系统”都是这样实现的,而这就是“第四范式”的魅力。