谷歌DeepMind AI语音功能接近人类水平

http://static.cnbetacdn.com/article/2016/0912/2e1a911cfc4a9bb.jpg

谷歌的人工智能部门DeepMind之前帮助AlphaGo击败围棋大师。现在DeepMind透露,它已经研发了新款AI,这款被称为WaveNet的AI,是一种深层神经网络,可以通过对人类语音进行实时采样形成原始音频波形,从而最终创造一些机器所能达到的,最接近于真人的语音。

英语用户和普通话用户测试发现,WaveNet性能已经比现有的文本到语音系统更好,但仍然缺乏让用户认为是真人讲话的说服力。WaveNet,采用真人语音输入,但学习和模仿这些人的讲话,WaveNet可以捕捉不同用户的声音,并且模拟他们的身份和说话语调。

同样令人印象深刻的是,WaveNet甚至可以模拟人类说话时候嘴部气流产生的杂音,以及模拟语调,情感和口音。不过现在距离谷歌正式推出WaveNet还有很长的道路要走。