人工智能"脑洞"有多大?不能只盯着"计算认知"

在当天的论坛上,谭铁牛举了几个模式识别的例子。比如语音识别,近些年突飞猛进的科大讯飞,能将维吾尔语翻译成汉语,汉语翻译成维吾尔语;再如步态识别,在看不到人脸、虹膜和指纹的时候,就能通过步态在几十米外感知到其身份。

此外,还有图像识别,其中具有代表性的人脸识别,早在几年前马云刷脸支付已经引爆舆论热点。谭铁牛本人就在进行虹膜识别的研究,并建立了目前国际上规模最大的共享虹膜图像库,被多国共享使用。他说,这不仅可以用在手机上,还可在查找丢失儿童上发挥作用。

谭铁牛说,模式识别的技术瓶颈可通过借鉴生物的机理改进,未来生物启发的模式识别在人工智能领域前景可期。其最终追求,是希望模拟逼近人的模式识别,这是非常艰巨的过程。

他也提到,模式识别的主要瓶颈在于鲁棒性、自适应性和可泛化性。

鲁棒性,说白了,就是人工智能“够不够皮实”“是不是稍微有点扰动,就会出错”。谭铁牛举了一个例子,比如在酒会上聊天,背景噪音比较多,如果想听清其中某一个人的声音,就要忽略或者抑制背景中其他对话的干扰——人类可以做到这一点,也就是听觉系统所谓的鸡尾酒效应,但人工智能可以吗?

所谓自适应性,则比较容易理解,谭铁牛说,人类的眼睛会随着灯光的变化、环境的变化进行调整,这说明自适应性非常强。这一点可以应用到人工智能上,比如人脸识别,有一位朋友十几年甚至几十年没见,再见面是否还能认出来?他说,现有的模式识别在这方面还不是很理想。

可泛化性,说白了就是“举一反三”。谭铁牛说,当小孩认识苹果后,即便只记住了一次,也可以识别其他类型的苹果,这说明人类看到一个东西后,不仅知其然,还知其所以然。而知其所以然,就是人工智能领域所说的“深度学习”。但目前的人工智能深度学习,必须建立在大量数据的基础之上,这一点也有待进一步研究。

谭铁牛说,要解决这3个问题,关键还是看人类本身,在微观层面上,人工智能的模式识别可借鉴人类的神经元,神经元有兴奋性、抑制性、功能可塑性和传播性。科学家受到这个启发,增强了模式识别动态系统的稳定性。

无人驾驶是人工智能的突破口?

李德毅已经找到了一个实践的突破口:自动驾驶。他说,无论是对话、诗词或者驾驶,图灵测试都允许测试者现场介入,判定结果都带有近似性和主观性。但是,和对话、诗词测试相比,驾驶的图灵测试可以进行更为精确、更为客观的评测。

他说,当初汽车被发明出来的时候,人们最感兴趣的是汽车的结构、机械、传动、轮胎、底盘和车身。到20世纪,人们感兴趣的则是发动机、碳排放和被动安全。到20世纪末、21世纪初,人们总体上关心3件事情,轻量化、清洁化、智能化。

所谓智能化,在他看来有4个阶段,第一是理性辅助驾驶,以人驾为主;第二是自动驾驶,局部时段可以放开手和脚;第三是自动驾驶,即用自动驾驶接管驾驶权;第四是人机协同驾驶。

在李德毅看来,无人驾驶,难在拟人。

他感叹:汽车是从马车演变而来,作为动力工具,汽车的马力可以达到100匹马力,但汽车远远不如马应对不同的负荷、天气、路面,以及不同车辆情况下的适应能力。说白了,汽车的感知、认知能力远远不如马这个认知主体,“老马识途,车不如马!”

李德毅说,其根本问题不在于车而在于人,要解决人的问题,就要让驾驶员的认知能够用机器人替代,让机器人具有记忆、决策和行为能力,于是新的概念产生了——“驾驶脑”。

“驾驶脑”不等于驾驶员脑,“驾驶脑”是要做驾驶员的智能代理,要去完成包括记忆认知、计算认知和交互认知在内的驾驶认知,他说,这应该是人工智能时代最有意义的课题之一。

中国青年报·中青在线记者 邱晨辉来源:中国青年报( 2017年05月15日12版)