AI革命:深度学习缘何突然改变你的生活

科技讯10月4日消息,《财富》近日撰文讲述深度学习的历史,探讨该技术为何能够被应用于越来越多的科技产品,忽然之间改变人们的日常生活。文章称,该领域数十年的研究成果如今正在刺激整个计算行业,不久之后将会改变美国的公司。

以下是文章主要内容:

在过去的4年里,读者们毫无疑问都注意到了各类日常技术在质量上的巨大突破。最明显的就是,我们的智能手机上的语音识别功能比以往要出色得多。

事实上,我们正越来越多地通过语音来与我们的计算机进行交互,不管是亚马逊的Alexa、苹果的Siri、微软的Cortana还是谷歌的诸多语音响应功能。百度称,在过去的18个月里,用户在百度语音界面上的使用量增长了两倍之多。

机器翻译和其它形式的语言处理也变得有吸引力多了,谷歌、微软、Facebook和百度每个月都会发布这方面的新功能特性。谷歌翻译如今支持32对语言的句子语音翻译,以及103种语言的文本翻译,其中包括宿雾语、伊博语和祖鲁语。谷歌的Inbox邮件应用也提供三种针对诸多收到的电子邮件的现成回复。

图像识别也有不小的进展。谷歌、微软、Facebook和百度均拥有能够让你搜索或者制动整理没有识别标签的照片的技术。例如,你可以要求呈现所有有狗、雪甚至像拥有这样的抽象事物的照片。这些公司都在研发能够在很短的时间内为照片生成一句长的描述的原型产品。

试想一下,要收集狗的照片,应用必须要辨别诸如吉娃娃和德国牧羊犬的品种,在小狗颠倒过来或者有些模糊的情况下要鉴别出来,要辨别它处在照片的左侧还是右侧,还要识别各种天气状况下的小狗,如雾、大雪、晴天和阴天。与此同时,它需要排除掉与狗有点相似的狼和猫。

图像识别技术的进步远不局限于很酷的社交类应用。医疗创业公司们声称,它们不久之后将能够利用计算机阅览X光照片、MRI(核磁共振成像)和CT(电脑断层扫描)照片,阅览的速度和准确度都将超过放射科医师;它们还将能够更早和更无创性地诊断出癌症,且能够加速救生药物的研发。更好的图像识别技术对于机器人、无人机以及无人驾驶汽车的改进至关重要。福特、特斯拉、Uber、百度和谷歌均已在上路测试无人驾驶汽车的原型。

深度神经网络

不过,大多数人都不知道所有的这些突破从本质上说都是同一突破。它们均通过一种名为深度学习的人工智能(AI)技术来实现,不过不少科学家还是喜欢以其最初的学术名称来称呼它:深度神经网络。

神经网络最值得注意的地方是,没有人编制出计算机来执行上述的任何技术功能。事实上,没有人能够做到这一点。相反,编程人员给计算机引入学习算法,给它提供海量的数据(无数张照片或者大量的语音样本),进而对其进行训练,让它自行理解如何去识别物体、单词或者句子。

简单来说,这种计算机有自学能力。“实质上,你是有软件自己编写软件。”图形处理领先厂商英伟达CEO黄仁勋(Jen-Hsun

Huang)指出。该公司于5年前开始大举押注深度学习技术。

神经网络并非新概念。该概念可追溯到1950年代,而许多重要的算法突破是出现在1980年代和1990年代。不同于当时,如今计算机科学家终于可以同时利用上强大的计算性能和海量的数据(遍布于互联网的图像、视频、音频和文本文件),这两点对于神经网络的良好运作必不可少。风险投资公司Andreessen Horowitz合伙人弗兰克·陈(Frank Chen)指出,“这是深度学习的寒武纪生命大爆发。”

掀起震荡

那一巨大进展激发了大量的活动。根据市场研究公司CB Insights的数据,AI创业公司上一季度的股权融资额超过10亿美元,创下历史新高。CB

Insights指出,2016年第二季度该类创业公司共计进行了121轮融资,远远高于2011年同期的21轮。2011年至2016年,该类创业公司的融资总额超过75亿美元,其中逾60亿美元来自2014年之后。(9月末,5家AI领域的领先者——亚马逊、Facebook、谷歌、IBM和微软——共同成立AI非盈利合作组织,旨在推动公众对AI的理解,以及进行道德伦理和最佳实践方面的研究。)