美国旧金山时间2015年1月30日下午1点半,北京时间1月31日凌晨5点半,The Big Talk在美国硅谷计算机历史博物馆举行。
这是2015年The Big Talk的第一站。《The BIG Talk》是百度于2014年6月创办的科技活动品牌,节目为百度百家举办,致力于成为连接前沿科技和商业价值、解读未来趋势的思想平台。
百度和硅谷当下在科技研究前沿的学者参加了这次活动。参加者有:百度公司首席科学家吴恩达、免费大型公开在线课程项目Coursera的首席业务官Lila Ibrahim、美国奇点大学生物技术和信息学项目负责人Raymond McCauley(雷蒙德?麦考利)、斯坦福大学独立访问学者Walter Greenleaf(沃尔特?格林利夫)、麻省理工学院人力动力学实验室主任Alex Pentland(亚历克斯?彭特兰)、加州大学伯克利分校可再生能源和稀有能源实验室创办主任Daniel Kammen(丹尼尔?柯曼)、本田硅谷实验室高级项目总监Nick Sugimoto(尼克?杉本博司)、康奈尔大学机械制造实验室主任Hod Lipson(霍德?利普森)、苹果联合创始人Steve Wozniak(史蒂芬?沃兹尼亚克)。
百度公司首席科学家吴恩达首先讲了人工智能与深度学习的最新进展,其余几位演讲嘉宾分别讲了各自领域的研究进展及人工智能的未来应用。
值得注意的是,吴恩达首先披露了百度在人工智能方面的最新进展,他透露百度在图片识别与语音识别上都取得了突破性进展,他认为,这样的人工智能技术将会变革人机交互方式,未来将给手机、互联网、家用电器都带来很大的变革。持此观点的并非吴恩达一人,康奈尔大学机械制造实验室主任Hod Lipson(霍德?利普森)的判断更为积极,在该场活动前一天的圆桌论坛上,他甚至断言“当前正是人工智能的转折点”,在The BIG Talk当天的活动上,他详细介绍了在机器人研发方面取得的突破性进展。
如果这个判断准确,未来几年,我们将看到很多领域将发生革命性的变化,因为当下许多领域的技术瓶颈就是人工智能。但是,由于这些信息仅得自一场论坛,要做更准确的判断需要更多的消息。
“当前正是人工智能的转折点”
吴恩达首先展示了百度在图像和语音识别方面的进展。
他展示了一组图片,下面配有中文图片说明,他告诉大家:“这是电脑写的。”他透露,百度现在已经能够比较深度地识别图像,将来问题就是这项技术能够开发什么样的应用。他预言,未来5年电脑视觉将会取得巨大发展,比如医学影像、电子商务中买卖衣服的对比,更多具体的领域他也无法预测,但可以肯定的是一定会带来很大的变化。
在语音识别方面,吴恩达认为百度的技术已经可以做到世界领先。以前语音识别比较困难,因为有噪音干扰。他介绍说,一般来说最大的语音识别的数据是需要两千小时的数据,百度则用七千小时的语音数据来研究,是一般研究的三倍多。通过这些数据,可以建立矩阵进行语音识别,比别的API(Application Programming Interface,即应用程序编程接口。是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节)都好很多。
他解释,百度能做到这些是因为使用了神经网络。他认为,这样的人工智能技术将会变革人机交互方式,未来将给手机、互联网、家用电器都带来很大的变革。
他进一步阐释,为什么人工智能、深度学习现在会起飞。他把深度学习比喻成火箭发射,火箭发射成功需要发动机很大、燃料很多,发动机大燃料少不行,发动机小燃料多也不行,发动机相当于神经网络,燃料是数据。现在神经网络越来越强大,人类数据积累越来越多。他对比道,2010年最大的神经网络有1000万个连接点,几年前他在谷歌的项目——谷歌大脑,当时有1000个大脑、10亿个连接点,成本比较高。现在则可以用不同的技术用较少的电脑建立更多的连接点,现在百度搭建的神经网络已经达到1000亿个连接点,这相当于用了更大的发动机。
Hod Lipson(霍德?利普森)在前一天的圆桌论坛上发表演讲认为,过去几个月来,人工智能有了巨大的改变,当前正是人工智能的转折点。
在The Big Talk上,Hod Lipson(霍德?利普森)展示了他的最新研究进展——有自我感觉的机器人(Sentient machines),他对现场的观众说:“这种技术大行其道可能在你孩子那一代。”