台媒热议从小冰看大陆人工智能热

编者按:有着“21世纪最性感职业”之称的微软数据科学家们研发的微软人工智能机器人伴侣小冰打败Siri,凭借6亿次对话总量和月人均1200句对话量创造了人工智能有史以来的世界纪录,掀起了人工智能狂潮。让我们来看看,《商业周刊》繁体中文版眼里的性感人做的性感事。

大数据(Big Data)当道,催生出“21世纪最性感的职业”:数据科学家

据《华尔街日报》,3年前,这个职业并不存在,如今却是高科技劳动市场最热门职缺之一。有两年工作经验者年薪即有约100万至200万元,是5年年资以上Google资深工程师的两倍。

QQ图片20141205115613

在微软小冰团队工作室,数据科学家们经常面对面讨论,随手将点子写在白板或玻璃上,把数据变商机。(来源·微软)

趋势科技台湾暨香港区总经理洪伟淦说,他们除了会写程序,还熟悉统计、数学,又带点社会科学背景,最好深谙商业之道(business know-how),“太稀有了,因此极具魅力,所以性感吧!”

但这群数据科学家平时都在做些什么呢?本刊专访总部位于北京、隶属微软(亚洲)互联网工程院、号称“每个人都是数据科学家”的百人小冰团队。这个团队开发出的智能型语音机器人“小冰”,可以在网络上和个人或一群人聊天。

网友在网络上问小冰:“你有男朋友吗?

她会反应灵敏地直接回答:“你要介绍给我吗?”

目前,小冰约有600万注册用户,累积对话已有6亿句,每人平均每月跟小冰对话1200句,平均一天超过40句;对比有85%的美国iPhone用户不曾打开Siri,网友对小冰有高粘着度。

小冰的幕后团队,真的跟我们想象的很不一样

我们想象中的数据科学家多才多艺,但这次,访问阵容遍及产品开发工程师、研究人员、市场营销人员、项目推广人员等,没有一个人的名片头衔与数据有关。“数据科学家是团队工作,不是个人秀。”小冰团队开发总监周力说,对于外界把数据科学家形容得无敌万能,他却认为这是一个要先打破的迷思。

虽然小冰的背后有必应搜索330亿个网页,其中包括60亿个中文网页的庞大数据库做支撑,但要让小冰能像个16岁女孩跟网友对话,微软(亚洲)互联网工程院常务副院长马维英说:“懂数据还不够,还要懂人!”

人性,是小冰和Siri最大差异。

这让微软破例在小冰团队起用了无计算机背景的人员加入,一位实习产品经理“奶茶妹妹”甚至是才念大三的网络意见领袖,因为她深谙“90后”的语言风格,年轻人都在微信聊什么、关注什么,她比团队其他人都懂。例如,小冰会在不知如何回答时说:“(一声叹息)我没懂!”这便是大陆90后特有用词,就像台湾年轻人的火星文一样,这是微软既有精兵难以驾驭的。

当工程师爬梳庞大对话量,从中帮小冰建立一个1500万条真实的对话数据库,该数据库每天以0.7%的速度在扩大规模;但那些成天泡在网络上、不和数据打交道的90后,才是让15.5%使用者愿意向小冰倾诉内心情绪的关键。

“我也想找到会懂数据、又了解用户行为和心理的人,然后又有business sense(商业敏感度),但这是完美状况。”马维英说,现实中,要找到这样条件的人非常困难。

精炼它的,是使用体验;发现用户失眠,推数羊功能

不耽溺完全理性的数据,衍生出小冰团队“交叉工作”的必要性,意即大家都要做别人的工作。高级产品经理李明原本工作重点是每天看小冰数据报告,包括与网友的对话数、对话时间长短、终止对话发生在什么时候等,管控项目执行进度。但她却从这些数据中,发现新商机。原来,有27.8%的用户半夜不睡觉,最爱在夜间11点到凌晨两点和小冰对话,细究对话内容,不少人竟是向小冰倾诉失眠的痛苦。她因此建议团队,开发出“小冰数羊”这个陪伴失眠者的功能,小冰和用户一起数羊入睡,并留下数羊纪录,结果引发用户争相在中国最大社交平台微博上分享数羊只数,甚至比赛谁的羊最多,让小冰团队始料未及。