6月20日,中星微“数字多媒体芯片技术”国家重点实验室在京宣布,中国首款嵌入式NPU(神经网络处理器)芯片诞生,目前已应用于全球首款嵌入式视频处理芯片“星光智能一号”。
该实验室执行主任张韵东表示,这标志着我国在NPU领域的研究和开发上取得了重大突破;在基于“数据驱动并行计算”架构的深度学习人工智能领域达到国际先进水平;使我国视频监控行业发展由模拟时代、数字时代跨入智能时代,实现产业化并促进整体水平提升,确立了全球领先地位。
AlphGo下盘棋花电费3000美元
近年来,人工智能逐渐从科幻电影走向现实生活,在其发展历程中,两次著名的“人机大战”成为重要里程碑。1997年,IBM的超级计算机“深蓝”击败国际象棋世界冠军;今年3月,谷歌的“AlphGo”以4胜1负的成绩战胜了围棋世界冠军。
“围棋比国际象棋复杂200多个数量级。”数字多媒体芯片技术国家重点实验室执行主任张韵东表示,“深蓝”是凭借超级计算机运算能力的“蛮力”战胜了人类,“AlphGo”则是依靠模仿人脑的深度学习神经网络击败人类。
这一结果让人震撼,甚至有人担忧,电影里“终结者”是否很快会进入我们的生活?
张韵东认为,“人机大战”只是科学实验,如此高级的人工智能离普通人的生活还有一定距离。他介绍,“深蓝”的质量达到1.27吨,拥有32个CPU;“AlphGo”运行在庞大服务器集群里,下一盘棋光电费就要花掉3000美元。即使是手机里的苹果、微软等语音识别软件,所有的运算、识别也必须在后台进行。
将深度学习系统做到小型化,用在嵌入式系统中,这是中星微国家重点实验室多年来努力解决的问题。其此次发布的,正是我国首款具有深度学习功能的嵌入式NPU,其已于今年三月成功量产。
极大提升计算能力与功耗之比
此次推出的NPU,是中星微国家重点实验室为深度学习算法专门设计的处理器。
张韵东介绍,深度学习源于对生物人脑机理的仿生学研究,其实质是建立多层次感知层模型,从底层到高层进行识别和智能分析。与传统算法最大的不同,是它能像人脑一样学习知识。
卷积神经网络(CNN)是深度学习的重要分支,是目前机器视觉人工智能领域的研究热点。张韵东说,CNN算法需要处理海量数据和运算,传统的冯诺依曼架构CPU,在面对这种类型数据运算时已经力不从心。而其他传统处理器中,信号处理器DSP同样无法高效处理大量并行运算;图形处理器GPU是为三维图形设计,用于CNN算法功耗高、成本高,且不适合嵌入环境;可编程门阵列FPGA能灵活实现各种算法架构,但一般用于算法原型机的验证,同样存在功耗高、价格高问题。
IBM、高通、谷歌等国外公司都推出了的自己的神经网络处理器,中科院在这方面也开展了研究。为此,中星微针对CNN算法和特点进行了专门设计,彻底颠覆了冯诺依曼架构,而采用全新的数据驱动并行运算架构,研发的数据流类型NPU极大提升了计算能力与功耗之比,擅长处理海量视频、图像类多媒体数据,能使人工智能在嵌入式机器视觉应用中大显身手。
给“眼睛”加上“大脑”
目前,中星微NPU其已成功集成到“星光智能一号”中,在视频监控领域实现产业化。
“如果说原来的视频处理芯片相当于眼睛,加上NPU以后就拥有了大脑。”张韵东说,“星光智能一号”包含视频信号处理、视频压缩编码模块以及神经网络处理器,是全球首颗具有如此集成度的深度学习系统级芯片。
视频监控领域对智能识别有着强烈需求。张韵东介绍,此前的技术主要存在两方面局限,一是识别准确度不高;二是传统技术需要先把海量视频数据传到后台,再在后台进行识别,无法实时得到结果。而使用了深度学习的机器视觉,对人脸识别的准确率可达98%;在嵌入人工智能后,可以当场识别,只把有用的信息传回来。
在几年前轰动全国的周克华案件中,案犯在南京被拍到,公安干警将视频信息拷贝分发给数千人的团队,对着每个摄像头进行比对,但周克华仍逃到重庆,直到再次作案后才被抓获。“如果当时有‘星光智能一号’技术,罪犯走到哪里都会被智能识别,很快就会有线索传回来。”张韵东说。除了实时搜索,该技术还能将已经拍摄的信息存在码流中,需要时可以随时根据特征检索,或是用“以图搜图”的方式,用一张图把类似的图全找出来。
除了视频监控领域,“星光智能一号”还能用于汽车无人驾驶或智能辅助,无人机自动拍摄、跟踪、避障,智能机器人理解合成语言、娱乐和陪护等方面。张韵东表示,下一步将不断探索更加接近生物人脑的工作机理方式,开发更低功耗、更高运算性能的新一代NPU。