谷歌地图背后的故事:连接真实世界与网络世界

在每张Google地图的背后,都有一张肉眼不可见的地图,正是这张隐藏地图隐含着真实地理位置的逻辑:哪些地方不能左转,哪些是高速公路匝道,限速要求和实时路况等等。正是这些数据让Google为你提供导航成为可能。上周,Google请我去参观这张隐藏地图背后的构建机制,这是Google首次向外界披露这项名为Ground Truth或者GT(地面实况)的计划到底是怎么回事。

Google是以搜索引擎起家的,但是随着移动互联网时代的来临,你在那儿搜索的重要性开始同你搜索什么不相上下。如果Google的使命是组织全世界的信息,那么最大的挑战不是为网络设立检索,而是将这个世界的物理信息整合成可用的信息系统。

“看看我们真实生活所处的线下世界,你就会发现很多信息其实都是在线下的,网络无法涵盖一切,”Manik,Google地图的高级产品经理如是说,“我们希望能填补真实世界和网络世界的鸿沟,地图就是其中的重要一环。”

Google用于构建完美展示真实世界的地图的办公室其实很普通,像其他办公室一样,也有免费美食和健身娱乐,但是真说起来也只是山景城郊区的一栋挺矮的办公楼而已。我在那儿见到了Manik和他的得力干将Michael,前NASA工程师,他会把20%的工作时间花在Google火星项目上,此外还有一名叫Nick负责处理地图数据的操作员。

Michael给我详细介绍了制作一个地图的具体过程:首先你得从合作伙伴那儿获得原始数据,然后通过工程处理将这些数据整理成合适的格式并同其他源头获得的数据进行整合,之后还需要一些列人工处理,最后才能生成一张高质量的地图——远胜过简单拼凑所得的效果。

具体来讲,首先是从美国审计局拿到最初的TIGER数据,如下图:


乍一看这些数据非常完美,但是如果你仔细看的话,会发现有些地方是同真实世界有差别的,我用红圈标出了几个地方:

除开同卫星图片比较之外,Google还有其他的处理方法,比如同其他数据库如美国地质调查局获得的数据做比较。另外一个重要数据源则是Google的街景车,据称街景车每两周发布的图片数据要比2006年Google处理的数据总和还多。

让搭载着定制相机的街景车走遍全世界,这个主意值得大家致以敬意。目前Google的街景车已经行驶了500多万英里,这些里程为地图制作提供了两类有价值的信息:其一是街景车实地走过的路径,这意味着到底那些路是走的通的;其二是拍摄的照片,通过它们Google可以利用算法分离出其中的交通信号,并将这些信息嵌入到Google地图的深层中去。如此处理后,旧金山的某个闹市区就成了这个样子:

Google街景的初衷并不是为了制作地图,但是Google的地理团队很快就意识到可以利用街景的数据来充实地图。你可以把街景车想象成在网页上搜寻字符的网络爬虫,它们可以发现街道上的各种标志和地址,帮助Google地图更好的理解人类的交通系统。随着计算机视觉和光学字符识别技术的发展,路上的每一个字符都会成为Google为现实世界制作的索引的一部分。

也许将来有一天计算机视觉可以直接将街景图片完美转化成地理上可理解的信息,但现在依然需要人工进行很多处理,比如要判断某个交叉口是否可以左转,最好的办法还是派人去看一眼,不管是实地驾驶观测或者是通过街景车传来的图像进行判断。

这一点同Google另一个伟大的产品Google Translate有相似之处,同样看起来是机器的智慧,实则是人类智慧的集合。Google Translate依赖海量的人类语言翻译素材,之后通过算法将各种词汇短语进行配对,相比起算法,海量的语言库扮演着更关键的角色。

Google地图有着相似的策略,人类对路况信息进行编码,之后电脑就可以简单的复制粘贴。这也意味着地图的制作需要大量的人工,据Michael称,为一个国家编制地图一般都要几百个操作员。实际上你看到的每一张地图都是经过很多人工处理的,每天Google地图都得处理上千份用户反馈报告,地图团队都会在数分钟内进行相应的处理。

如果你认真想想为全世界提供如此详实的地图服务,标注出每个交叉口的行车方向,随时对路况进行更正修改,就会发现这真不是随便哪家公司就能做到的,你需要的远不仅仅是几个聪明的工程师,还需要对数据的掌控和处理,以及支持你做这项事业的决心和财力。Google地图最终展示给用户的其实是人类的智慧,正是这类智慧才能让Google的电脑告诉你从旧金山到波士顿最好走的路到底是哪条。

谈到未来地图时,我们也许会想起博尔赫斯式的同真实世界完美一致的地图。既然我们已经有了真实世界,似乎再做一个一模一样的地图会是一个很奇怪的念头。但是如果考虑下Nathan关于增强现实的定义,你就会发现如他所言,每一寸真实的物理空间,都是被信息渗透的。物理空间实质上也是信息空间。我们每个人在脑中都有一个完美地图,指导我们在现实中前行。Google的策略就是将每个人的脑中地图集合到一快,处理成每人都可使用的形式。

MapMaker这款产品清晰的解释了Google的野心。通过MapMaker,每个用户都可以将自己世界里的信息添加到Google地图中去。这也是一种将人类大脑中的信息抓取到因特网的方式,类似的竞争者还有Open Street Map,也是通过众包的方式来制作地图。

随着这个世界在线上线下都变得越来越后现代,Google的地理数据正在成为它最宝贵的资产。不单单是因为这些地理数据本身,还在于这些数据能让Google正在做的和已经做的事情更有价值。也许就像我一个朋友Robin所说:“我坚信地图才是Google的核心资产。50年内,Google就会成为一家自动驾驶汽车公司(依靠的就是对这个世界真正的理解),哦对了,它应该还会留着搜索引擎吧。”