尽管计算性能、存储容量以及分析技术一直在不断进步,但某些现实挑战对于大数据而言仍然过于庞大以至于无法应对。
目前,仍有几大世界性难题等待着我们攻克。在某些情况下,分析所需要的数据根本无迹可寻。在其他情况下,足以应对如此庞大数据量的计算机还没有被发明出来。
健康记录
大多数人都拥有一份电子健康记录(简称HER),不过其中的内容颇为有限,甚至只包含最近一次健康检查的基本结果。目前足以支撑全世界健康记录资料库的工具与技术已经到位。这样的全球性数据库一旦出现,制药企业就能对其进行分析以开发大众最急需的疫苗和药物,也就是说,根据供应链的实际需要进行优先选择。
既然前景一片光明,为什么我们还没有感受到由此带来的益处呢?这是由于目前还缺乏一套访问全球数据的可行机制。健康记录被保存在一大堆彼此隔离的系统当中,而资料持有者没有足够的动力来分享这些信息。即使我们真的把所有数据都归拢在一起,也仍然需要通过机器学习算法及实时分析对其进行全面优化。
人脑图谱
人类大脑模型能够为科学研究带来巨大帮助。医生可以查看肿瘤的生长情况或者了解大脑如何通过一系列功能控制身体的其他器官。目前已经有包括欧洲人类大脑项目在内的多个科研项目尝试在未来十年之内创建出大脑模拟系统。
障碍何在?要完成这项工作,我们需要一台运算速度千倍于当前水平的超级计算机。大脑当中存在数以百万计的神经递质,而且它们彼此之间互相连通,共同构成我们所接触到的“数据”。
从直观角度看,分子计算在数据管理方面的运算速度比传统硅芯片高750倍,只有这样的机制才能探知颅腹脑体系当中的关系,认知其奥秘。
全球实时犯罪数据
很多地方性执法机构已经掌握了非常丰富的犯罪数据,警务人员可以在自己的警车内轻松访问犯罪记录数据库,从而根据犯罪嫌疑人的具体情况作出反应。但这些数据只包含过往的罪行,其中无法体现刚刚发生或者正在进行中的犯罪活动。由于无法在犯罪活动进行的过程中实施阻止,警方只能被迫采取更为被动的应对措施。
实时犯罪数据所带来的益处并不局限于执法领域,TruliaLocal热点地图能够提供犯罪活动报告,从而帮助住房买家选择更友善、更安全的生活环境。
追踪儿童行踪
时至今日,我们已经拥有很多种通报失踪儿童的方式,不过这些通告机制的最大问题在于,只能在事后发起提醒。追踪儿童位置所必要的技术已经存在,当下大部分智能手机都能通过谷歌位置报告功能将儿童当前所在地的信息发送给父母。与此同时,大众汽车的Car-Net以及福特汽车的MyKey应用也能在青少年驾车到达特殊地理位置时发送报告。
大数据厂商能够分析儿童的行为模式,当然前提是家长愿意分享相关数据。只要满足警示条件,信息会被实时发出,这能有效阻止重大事故的发生。