胡郁也提到《从0到1》这本书中一句经典的表述,美国近些年投入很多资金研发能飞的汽车,最后却得到了140字符(指的是Twitter):真实世界需要的是物理、综合的东西,但虚拟化和信息化反而发展更快。他认为这句话同样适用于人工智能与机器人。
在视觉方面,微软全球执行副总裁沈向洋持积极态度:人类的感知有九成之多来自视觉,研发这部分“将大有可为”。
比如,今年微软在社交网络上意外走红的“how-old”——用户可以通过上传自己的照片,来测试自己的年龄——就是利用脸部API,基于云的脸部识别算法来检测和识别图片中的人脸。
他还提到了微软小冰的最新研究成果,智能聊天机器人“小冰”具有辨识猫狗品种的能力,甚至在面对猫的图片时能够发出“小眼神儿太犀利了”的“吐槽”。而在“小冰”的开发过程中,深层神经网络为计算机提供了不少的帮助。
沈向洋也承认,发展计算机视觉是有难度的。比如在人脸识别过程中,由于拍照光线、发型、角度、妆容等因素影响,得出的结果往往大相径庭,照片上的林志颖和郭德纲现实中基本同岁,计算机却给出一个36岁、一个51岁的错误答案。正因为“A picture is worth a thousand words(一图胜千言)”,计算机在图像识别的路上还有很长的距离要走。
这在沈向洋看来,似乎更具有“目标”的含义,“对于在做计算机的人来说,如果把通过图灵测试做目标,目标就不够远大。”对计算机视觉,他预测接下来的研究方向是“两大一精”,即大数据、大计算、精准计算。这些也值得中国人工智能领域的专家所注意。
期待脑科学和人工智能研究的“杂交优势”
在听觉方面,刘庆峰也给出了他的预测:“我认为下一个产业趋势是万物互联,在这个过程中,绝大部分设备将没有屏幕,人在移动状态下不方便去看去操作。那样,语音时代就真正到来了。”
中国在这方面已经取得了不俗的成绩:语音合成、语音识别和自然语言理解领域都曾连续多次斩获国际大奖。刘庆峰说,科大讯飞从2006年起至今参加英文合成国际评测,取得了八连冠。甚至在2014年该比赛更改了比赛方式,改比印度式英语,中国依旧取得了第一。
据他透露,人工智能的语音发展,已经不仅仅意味着地图导航软件中能够合成林志玲的声音,它还可以用在教育领域的口语测评、主观题自动扫描评分,乃至在医疗领域根据语音自主判断病症等,“这些运用的前景不只是一个目标,更是件非常靠谱的事”。
不过,要真正打通“智能”这道关卡,在李德毅看来,还需打破学科壁垒的生殖隔离。
他说,悠久强大的学科,如生命科学和物理学,一定都是很有个性的学科,学科壁垒森严,存在“生殖隔离”现象,长期以来脑科学研究和人工智能研究犹如两条平行线,没有实质性的交集就是一个佐证。
也因此,李德毅将目光放在了认知神经学和认知物理学的融合,企图寻找“场外求助”——也就是一种组合的力量。“一旦碳基生物脑和硅基电子脑形成‘杂交优势’,其势将会猛不可挡。”
他认为,用人工智能技术构建千千万万特定机器认知脑,并通过移动互联网、云计算和大数据,或许就可以“倒逼并逼近一个人造生物脑”。
登陆|注册欢迎登陆本站,认识更多朋友,获得更多精彩内容推荐!