11月28日消息,不久之前,人们认为图像识别将会是另一个引领未来之浪潮,如今这样的想法已经不常见了。但是现在,由于拍摄及存储的照片之规模愈发庞大,而且又需要即快且易地找到它们,摄影技术便把图像识别技术推到了发展之前沿,舞台的中心。而且随着技术不断进步,图像识别技术也加入了其他技术来巩固搜索运算和搜索结果。
近日,雅虎旗下的Flickr以及实验室小组利用一个多元合一策略,把计算机视觉、地理信息以及人际互动结合在一起,摆脱了对元数据的依赖,从而已经发展出了一套可行的搜索算法。开发这一技术的初衷是,帮助优化Flickr照片软件以及为照片软件的用户服务,同时也着眼于雅虎软件和电子商务服务的当前及未来之商业需求。
雅虎天气软件为试验这一技术提供了一个好机会。该软件搜集元数据、地理位置以及人们对Flickr照片的互动,以为该软件选择那些最有趣味的图片。雅虎实验室的高级科研主管David表示,“天气软件是一个很好的例子,因为它涉及到很多照片,而且我们可以在不同的地理位置检索这些图片,不仅检索地理坐标,而且检索时间和天气状况,然后再把这些图片还原到软件中,从而发现你喜欢什么样的城市风貌。”雅虎没有完全依赖于诸如标签、照片名称等来自于用户的内容,而且借助于计算机视觉和深度学习技术来识别图片上的物体。计算机视觉和社会视觉的结合增强了搜索结果的质量。
社会计算方法产生出了大约600万张天气图片。经过对不准确的地理位置和时间、低分辨率以及错误内容的修正,大约有150万张照片保留在了天气软件上。“这一方法加强了人工智能,而且加入人的因素,”雅虎实验室的高级研究科学家Jia Li说。“基于深度学习,照片归类算法分析一张照片到底是暴风图、多云图还是雪景图,是白天还是黑夜。”
这并非Flickr第一次公开分析其图像识别技术进展的细枝末节。另一个最近的博客帖子也描述了该小组正在尝试改善图片搜索以及图片寻找技术。雅虎和Flickr把社会计算(social computing)、地理方位以及电脑视觉融合起来,推动图像识别技术的发展。雅虎也加入其它公司共同研发图像识别技术,分享自己搜集的一亿多张照片来提供足够多的数据供研究人员使用。
最终,图片识别技术成熟之时,会有助于提高改善人们的私生活。Garrigues说,“图像识别还没有怎么影响到寻常百姓的生活。我手机上有一万张照片,而且我需要花很多时间来滑动屏幕,但还是找不到想要的照片。我们认为,在把这一技术带给人们以及让它帮助人们改善生活上,还缺少一环。”(编译:曹建峰)