App已死,智能永生——从万物互联到万物智能

  从“万物互联”到“万物智能”过渡的过程中,深度学习这个关键性技术,正在迅速深刻地影响到百度,2014年底,国际主流科技媒体报道,这样的一家中国企业在人工智能领域的迅猛发展成果,是比较罕见的。在成立IDL实验室的时候,我们明确是想植根深度学习,在人工智能这个领域做深、做扎实。过去三年中,深度学习发展非常快速,体现在过去两年时间的投入和领域学术大牛人才的引进。百度诞生的第一天起就是人工智能的公司,全球最大规模的深度神经网络平台上,百亿级的海量数据集帮我们人工智能的模型在不断的演进。一个自我经验积累、自我理解、自我演进的系统才是最好的人工智能系统,也就是我们的百度大脑,还有两会的时候Robin提到的中国大脑。这张图说明的是我们百度大脑的三个核心能力包括:感知,理解和决策,大家看到在左边,我们通过哪些路径做感知层?我们有用户在移动端、PC端在线搜索索引的数字信息;还有通过人机交互在不同设备上的视觉、听觉、触觉等交互过程中跟人有关的信号和数据采集。还有无人车、无人机获得3D建模、物理场景传感网的数据。

  中间最重要的是百度大脑的核心,高性能分布式计算的能力,有着上千台服务器,包括PC服务器和GPU服务器的大规模数据处理系统,这是思考理解层。这个思考过程包含数据模型、算法模型,深度学习以及大数据引擎,这是我们的核心,等下我会详细说说这个“思考”能力具体我们是怎么做的。基于这样一个工程的能力,百度能够去开发各种各样深度学习的算法,应用在搜索优化、语音处理、图像处理、自然语音理解、用户精准画像、广告的用户匹配、个性化推荐、大数据预测等方面,还有语音、图像等应用,都是用户可以感知到的,当然还有我们正在开发的机器人、自动驾驶、BaiduEye、DuBike等。 

  我们百度大脑,为什么百度可以做这件事情,或者我们核心能力在哪里?首先有这些人才,有这些国际上绝对顶尖的人才在做深度学习、异构计算、图像的、语音的,用户自然语言处理的,用户行为建模的人才的能力。同时我们有足够多的海量用户数据,不断产生有标注的,有价值的,有图谱性理解意义的数据。还有我们不断演进、演变的数据模型,这是我们的核心能力。