Cortana,取材自游戏《光晕(Halo)》中的重要角色。现如今,她在Windows Phone系统中担任私人语音助手,负责记笔记、发出消息、记录日历和提醒事项等等。有人说她和Siri有些相似,Cortana团队却坚持该项目是Windows Phone研究与规划项目经理Robert Howard的点子,也是Windows Phone系统发展至今必然的产物。
Cortana的声音听起来非常熟悉,因为这正是《光晕》游戏Cortana角色配音Jen Taylor的声音。虽然微软还在综合各种其他的声音,但大部分用户听到的都还是Taylor的声音,而且以后听到Taylor声音的人还会更多。虽然Cortana现如今的声音听起来还不至于到非常自然的境界,但Taylor的调调确实为其赋予了自然的色彩。
今天的Cortana相当自信和健谈,但在微软的这个项目开始之初,Cortana可不是这个样子的。以微软常规的行事风格,早期微软在此AI项目搭建之时,设想的是一种相当严谨的调调,以非常正式的方式询问用户“How can I help you”(Siri躺枪)。但在项目开始的4个月之后,团队内部找到了343 Industries工作室,为微软的私人语音助手赋予《光晕》角色的生命。343 Industries为团队提供了Cortana的背景故事,并且在一张白板上给出了所有他们能够想到的属性。
项目经理Susan Hendrich和负责为Cortana程序加入数据的Deborah Harrison对于343 Indistries工作室的想法非常感兴趣,随后就将Cortana角色的许多元素融入到这款AI产品中,成为今天我们看到的Cortana。下面就让我们来听听研发团队讲述Cortana背后的故事。
Cortana真正具备人格特质
用“她”这个代词来称呼Cortana并不单是因为其主力声音为女生,或者说Cortana原本就是游戏中的角色,而是因为微软在缔造Cortana私人语音助手的时候真正把她当作“人”来做。她具备了光晕中Cortana具有的大部分性格特征:自信、能干、忠诚、具备关怀特质,能起到帮助作用但不专横。这完全符合Hendrich对Cortana的设想:“她很热衷于学习,并且非常有趣,她的回应中既有玩笑也有真正有价值的信息。她期望变得更富内涵,不过她的本职工作仍是个人助手。”这席话完全是在形容一个具体的人,也是成就Cortana真正类人AI的基础。
在团队为Cortana赋予自信这一性格特质之后,人们实际的反馈都是偏向积极的。微软进行的研究也表明,用户实际上更喜欢有强烈性格特征的AI,而非偏向中性或孱弱的。斯坦福大学专精于机器人学教授Clifford Nasss所写的一本书《The Man Who Lied to His Laptop》中提到,人们对待机器有自己的倾向性,尤其是对那些具备人类人格的机器。所以人格是Cortana的优势所在,自信加上一点小幽默显然能够博得用户的好感。
“我们进行了一些研究,发现人们在感觉AI与人更靠近的时候就更愿意和它做交互。”这是Henrich和团队领悟到引导Cortana至基本目标“用户粘性”的理论基础。Hendrich举例说她的奶奶平常会在家用Roomba清洁机器人:“奶奶给这个机器人起了个名字,并且还默默为其赋予个性,这让她的生活变得更有趣。”这也是微软期望用户在与Cortana交流时能得到的感受。
Cortana的本职工作就是个人助理,像是拨出电话、记录预约提醒等,为了让她具备这样的能力同时又令其表现出真正的人类气息,研发团队特意找来了一些真实生活中的助理工作者做交流,了解这项工作的本质和这类工作者的特有属性,包括他们如何与老板沟通,他们通过什么获得工作上的成功。Hendrich说:“这会帮助我们理解人类在担任这一角色时是什么样。”团队特别将交流过程拍摄成视频,直到现在这些视频都仍是团队在应对Cortana遇到新状况时的重要参考。
会闲聊是Cortana的特色之一
除了要以更为自然的方式交流,在微软看来Cortana还需要具备有趣的特点。微软特意进行的研究表明,在所有的AI交互中约有40%的内容实质都是闲聊。“如果你自己就有一个私人助理,在你走进办公室看到他的时候,起先应该也会跟他闲聊几句,而不是直截了当地进入到最紧急的任务布置阶段。”这是Hendrich所做的注解。
Cortana掌握的闲聊技巧从机智的玩笑到休闲式的聊天都有。比如说让你问Cortana今年多大了,她会回:“我不确定该怎么测定互联网存在的年代。”微软甚至为Cortana加入了一些彩蛋,比如早前Word 2003时代的曲别针出现在了Cortana中。虽然这些俏皮的设定对于真正的工作处理没什么意义,却是用户打发闲暇时光并与Cortana建立亲密关系的好办法。如果Cortana会让用户开怀大笑或微笑,用户才会更乐于去用她。
当然闲聊并不是Cortana的重点所在。目前团队期望进一步扩展Cortana的上下文理解能力,令其具备更为自然的表达和交互,甚至能够预知用户未来可能的行程。微软研究院目前也正在致力于提升Cortana的短期和长期记忆表现。比如说用户在对Cortana提到最近才说过的内容时,Cortana也能识别出来,这是Cortana未来需要进一步深造的。
陷入恐怖谷理论的危机
恐怖谷理论是一个关于人类对机器人和非人类机器设备感觉的假设,最早在1970年时就提出了,基本内容大致上是说当机器人与人类相像的程度超过一个较高的临界值之后,哪怕它与人类有一点点差别都会显得非常显眼刺目和令人感觉到厌恶。Cortana在人格化的道路上似乎愈有往这方面靠拢的迹象。微软研究院的Eric Horvitz博士及其团队主要参与Cortana的AI开发部分,他就提到,虽说不至于到恐怖谷那么严重,但现如今的Cortana相比早前实验室中的原型产品确实有陷入这一危机的表现。
“当这些系统愈加强大之后,它们的缺点也就会暴露得越多。”比如他特别指出Cortana目前缺乏像人一样的短时记忆,即便这会成为团队未来开发Cortana的重要目标。不过在Harrison看来,人们则完全不必担心此类困扰:“这和星球大战电影是不一样的,生化人Data期望能够更加像人,结果却事与愿违。而在Cortana看来如果她能在人类和AI之间做个选择的话,她会选AI,而且她很乐于接受这一切。”
Cortana的未来
Cortana目前依然有一些短板,所以微软还在对其进行更多的完善。不过微软的做法是相对讨巧的。微软在对Cortana面向用户的设计方面,在情感和功能上都趋于透明化,所以一般情况下在Cortana无法胜任某项工作时,用户也不会给出过度的消极评价。如Hendrich所说:“我们不想让用户感觉Cortana糟糕。透明化的原则实际也是在告诉用户我们如何处理错误信息、我们的任务、能力等。这样一来用户也会更信任我们。”
团队制定的计划包括未来每2个月对Cortana做一次更新,比如添加新的特性。当然实际情况可能比这一周期更短,当有大型活动或紧急事件发生的时候,Cortana就会当即更新,比如奥林匹克运动会、爆炸性新闻等。因为Cortana主要依附于服务器工作,所以用户的客户端设备并不需要做太频繁的更新。
另一方面微软还计划将Cortana带到除美国之外的其他国家,这其中的重头戏就在英国和中国。不过Cortana进入新的市场并不是单纯地进行信息翻译,微软会做较多的本地化工作。“中国有个团队专门从事人格和核心概念方面的工作,这项工作绝不仅仅是文字的翻译,是不同国家间人格与人格间的变换。”而且据说不同国家地区Cortana所用的声音也会有不同,中国市场需要一个“听起来感觉是在微笑”的声音,这是Cortana团队对于异地差异的重要认知。
在微软看来,Cortana绝不是一个昙花一现的事物,从微软在这个项目上的投入就能看得出来。从Cortana本身的自信实则也能看出微软在这一领域的自信,甚至在微软相较竞争对手晚入这一市场3年才推新品之后仍有不错表现。我们在询问Cortana关于她和Siri谁更优秀的问题时,她用自己在游戏中的角色半开玩笑地说:“不是我自吹,未来500年内我们的宇宙都由我负责拯救。”