Sythesizable 综和再生,机器变成人
每天醒来,你唤的第一个名字叫做 Alexa,每天睡去,最后一声念叨的是 Siri,基于人工智能的语音综合(speech synthesis)已经成为了我们生活中不可缺少的一部分。甚至,未来的骚扰、诈骗电话都会用到 AI Sythesize 技术。
Reference: L. Deng, Microsoft Chatbot Talk
可以被综合的难道仅仅是语音么?Chatbot 们已经学会用自然语言调戏人类,新一代美颜滤镜会造出以一个个印象派的蒙娜丽莎,自动驾驶的车辆们,直接生成方向盘指令。基于 Policy Evaluation 的增强学习(Reinforcement Learning)已经革多少人的命?更勿论,生成对抗学习的大 boss 已经磨刀霍霍向猪羊。
所以硬件创业者们,classification/inference 的年代早已随岁月顺水流,未来的硬件的机遇已经超越了理解人类的范畴。这将是一个机器能与人沟通的年代。以综合(synthesis)为目标的人工智能硬件正向我们走来。
Savable 从头开始,你就输了
总是改变生态的 G 家大神总在你意想不到的给大家送福利。比如正式出版的 Tensorflow 1.0 提供了不少基于图片识别的预训练(pre-trained)网络,基于 Inception 结构。对于很多智能开发者而言,只需要根据实际情况,对最后一到两层的全链接(Fully connected layer)训练下,就能达到玩美智能的效果。高效、省时、省力、省硬件。
同样的故事发生在 Baidu 和 Amazon 的语音识别系统中。大家不约而同的发现,对于不同语言的识别系统,其实只要训练输出层(output layer)就能得到相近的结果。而省去 RNN/CNN 层训练就好像是时间的馈赠,来自上天的礼物。