未来100年改变世界? 人工智能正在成为新的时代动力

赞助本站

正如电力在过去一个世纪里改变了工业的运行方式那样,人工智能将在未来100年里大幅改变社会。AI正被整合应用到家用机器人、机器人出租车以及心理健康聊天机器人中。一家创业公司正在利用AI技术开发机器人,让它们更接近人类的智能水平。AI本身已经进入到人们的日常生活中,比如为数字助理Siri和Alexa的大脑提供动力。它让消费者能够更准确、更高效地在网上购物和搜索,以及执行其他人们认为理所当然的任务。

Coursera联合创始人、斯坦福大学教授吴恩达(Andrew Ng)博士上周在硅谷举行的AI前沿会议上发表主题演讲时表示:“AI就像是一种新的电力。大约100年前,电力改变了每一个主要行业。AI已经发展到同样的水平,有能力在未来几年改变所有主流行业。”吴恩达说,尽管人们认为AI是一种相当新的技术,但它实际上已经存在了几十年。但它之所以现在才实现腾飞,这要归功于数据和计算能力的扩展。

吴恩达表示,目前通过AI创造的大部分价值都是通过监督学习完成的。但有两大波的进步:一波利用深度学习来预测消费者是否会在算法获得有关他的信息后点击在线广告。而当输出不再是一个数字或整数,而是语音识别、另一种语言或音频的句子结构时,第二波进步就出现了。例如,在无人驾驶汽车中,图像的输入会形成其他在路上的车辆位置输出。

微软首席科学家黄学东(Xuedong Huang)表示,实际上,深度学习(即电脑从数据集学习到执行功能,而不是执行它被编程的特定任务)对实现与人类相媲美的语音识别目标是有帮助的。2016年,黄学东领导微软团队取得了历史性成就,当时他们的系统记录到5.9%的错误率,这与人类转录员的情况相同。黄学东在会议上说:“多亏了深度学习,我们能够在20年之后达到人类的程度。”此后,该团队将错误率进一步降低至5.1%。

数字助理的崛起

从2010年开始,语音识别的质量开始改善,最终Siri和Alexa诞生了。吴恩达说:“现在,你几乎认为这是理所当然的。亚马逊Alexa总监Ruhi Sarikaya说,除此之外,预计语音将取代触控输入。提高准确性的关键是理解上下文语境,例如,如果一个人问Alexa晚餐应该做什么,这位数字助理必须评估他的意图。他是想让Alexa去餐馆预订位置、点餐还是寻找食谱?如果他要求Alexa找到《饥饿游戏》(Hunger Games),他是想要听音乐、看视频亦或是听有声读物?

谷歌的研究科学家迪勒克·哈卡尼-图尔(Dilek Hakkani-Tur)表示,数字助理的下一步研究将是一项更先进的任务,即理解“超越文字的意义”。举例来说,如果用户使用“今天晚些时候”这样的短语,可能意味着晚上7点到9点之间,或者下午3点到5点开会。哈卡尼-图尔说,下一阶段还需要更复杂、更生动的对话、多领域任务以及超越领域界限的互动。此外,数字助理应该能够做更多事情,比如轻松阅读和总结电子邮件。

语音识别之后,就是“计算机视觉”,即计算机识别图像并对其进行分类的能力。随着许多人上传图片和视频,将元数据添加到所有内容中变得很麻烦,这就需要一种将它们分类的方法。Facebook人工智能研究院可视化识别技术专家Manohar PaluriLumos说,Facebook开发了一种能够理解和大规模分类视频的AI,名为Lumos。Facebook利用Lumos进行数据收集,例如,收集烟花图像和视频。该平台还可以利用人们的姿势来识别视频,比如将人们在沙发周围忙碌的场景归类为“即将外出闲逛”。

谷歌视频理解主管拉胡尔·苏山卡尔(Rahul Sukthankar)补充说,关键是要确定上传视频的主要语义内容。为了帮助计算机正确识别视频中的内容,苏山卡尔的团队在YouTube上挖掘了AI可以学习的类似内容,比如针对非专业内容的特定帧率。苏山卡尔补充说,未来研究的一个重要方向是使用视频对计算机进行训练。所以,如果机器人看到一个人把麦片倒进碗里的多个角度视频,它应该能通过观察视频来学习。