这个自从来到美国以后,就饱受经济压力的乖乖女,却少见地叛逆了一回。她决定去西藏研究一年藏药,之后去加州理工学院攻读PhD。
当我们今天纵观李飞飞的人生时,会发现,这种追随内心的热情和强硬坚韧的作风,始终贯穿着她的行为轨迹。正如博士毕业后,她选择了当时还不太流行的图像识别作为研究方向一样。
图像识别技术,是人工智能发展道路上的一座高峰。简单来说,它就是要教会计算机看图说话。要知道,“看到”和“懂得”是不一样的。比如,你可以告诉计算机,“猫”就是有着圆脸、胖身子、 两个尖尖的耳朵,还有一条长尾巴的东西。
可是,如果图片是这样的呢?
一个3岁小孩都能从图片中识别出“猫”,可是计算机却做不到。
李飞飞研究了很长时间,始终没有突破。交好的教授都劝她换个方向,以便拿到tenure(终生教职:在西方高校,有了tenure就相当于终生的职业生涯都有了保障)。
她当然没有同意。有一天,李飞飞突然意识到,由于人眼每200毫秒就能获取一幅图像,一个3岁儿童可能已经获得了上亿次的图像识别训练,是计算机的几何级倍数。
也就是,关键在于自主训练量。
李飞飞马上开始着手,从twitter上抓取海量照片,将它们统统打上标签后,训练计算机进行机器学习。机器学习(machine learning),就是给出一定算法,让计算机自己学习。
这个过程是艰苦的。如今,机器学习已经是热门概念,可在2007年,李飞飞的实验室缺少人手,又申请不到经费。最困难的时候,她一度想重开洗衣店,筹集实验资金。
她从亚马逊的众包平台中找到了解决办法,让全世界的网友一起给图片打标签。当时,李飞飞的研究项目,一度是该众包平台全球最大的雇主。
一个前所未有的庞大数据库建成了,这就是大名鼎鼎的ImageNet。李飞飞没有敝帚自珍,而是将ImageNet数据库开源,供学术和商业界的每一个实验室调龋图片识别技术从此飞速发展,如今已经能辨识出大部分照片中的物体,还能用高度拟合的人类语言,将它们描述出来。
由于学术成就卓著,李飞飞收到了很多社会活动的邀请。她曾经接受过 New York Times的访谈,也曾登上 TED的舞台,讲述图形识别技术发展的背后故事。
李飞飞还组织了一年一度的 ImageNet挑战赛,邀请谷歌等科技巨头参赛,促进图像识别和人工智能领域的交流。露露顺便提一句,去年百度因为在这场大赛上作弊,被禁赛一年……
图像识别技术能为我们带来一个什么样的世界呢?
首先当然是科幻电影里的各种炫酷场面,比如阿汤哥通过摄像镜头画面,搜索恐怖分子啦,又比如只需要“刷脸”就能开门的智能公寓啦。
像大白那样扫一眼就知道你哪里生病的智能机器人也不在话下:
伦敦初创公司 Realeyes能识别你看到广告时的面部情绪,从此你会更有针对性地受到广告的骚扰。