卷积神经网络(CNN),是图像处理中的离散卷积运算和人工神经网络相结合。离算卷积运算可以提取图像(就像该研究中的照片样本)的特征,主要应用于图像的识别。深度卷积神经网络一般包含输入层、输出层、以及中间的若干卷积层。深度的层次就是卷基层的层次,卷积层越多,对图像特征的提取就越抽象,越容易对图像进行识别。论文中提到这项研究采用AlexNet架构,拥有5层卷基层和3层全连接层(如下图)。作为比较,据前微软亚洲研究院常务副院长芮勇介绍,其团队在图像识别中建立的深度学习神经网络模型已经达到了152层([2]附智能菌此前的报道),而此前一篇论文显示Facebook首次将29层卷积神经网络用于自然语言处理([3]附论文下载)。
从研究团队对照片处理前后鉴别结果来看,机器不会出错。而引发争议的就在于样本的选择和标签的设置。首先,样本选择是通过关键词在搜索引擎上获得的,那么搜索引擎对于照片呈现的依据和标准,我们无从得知。其次,人工排查的依据和标准,也没有进行量化。22名男性研究生对于照片标签的认可,也没有给出明确的判断依据,那么样本数据在设置的时候会不会加入主观偏见?最后就是样本和人工排查人员的数量,论文中指出总共样本数为3954张照片,用于训练机器的数据占80%,而研究人员加上22名受访人员也是小数量,这对于需要大量数据学习的机器来说,能否支撑研究所需要的数据量?
发出去的论文还能撤回?技术专家各说各有理
针对武筱林此前的人工智能算法鉴别罪犯和此次的鉴别美女,智能菌选出了具有代表性的回应:
一位上海交大的海外校友则表示,武筱林应尽快撤稿,这种行为给上海交大造成了恶劣的影响,这起事件以后会对该校学生申请国外高校产生影响。
国外新闻网站Hacker News的一位用户称,看到摘要的时候还以为在开玩笑,读下去却发现是用在数据和实验证明这一事件。他认为这种研究需要犯罪学、心理学和机器学习方面的专家,而不是随便几个懂点深度学习框架的人就能完成的。
国际隐私保护组织的Richard Tynan博士认为,作为一个个体,你不可能知道机器是怎么给你下定论的。在小数据集上,算法、人工智能和机器学习可能会建立起专断荒唐的相关性。这不是机器的错,把复杂系统运用在不合适的地方是很危险的。
加拿大麦克马斯特大学的电子与计算机工程系主任,蒂姆?戴维森教授则指出,这项研究应当促使人们反思一个问题:长相偏离均值的人是否更容易遭受所谓“主流”人士的歧视和排斥,而其中一些人会因此走上违法道路?
再来看看网友脑洞大开的回应:
易友<horsenriver>表示:相亲的时候美女太多,挑花眼了,请教授的机器帮忙看看。
易友<就是不服认死理>表示:敢不敢整一组韩国女明星试试?看看谁整容了谁是纯天然的。
看脸读心如果真的靠谱 机器视觉未来有哪些应用场景?
目前在做计算机视觉识别研究的绝不止学术界,国内外各大科技公司争相布局这一领域,在此智能菌想如果做出这项研究的是某家科技公司而并非大学教授,会不会引发此类争议?毕竟近段时间各家都想在AI领域搞个大新闻,从AlphaGo化身Master横扫围棋界,到百度大脑战胜人类顶尖选手,从应用层面角度来看,与武筱林的研究相同,都没能提出明确的应用方向。
智能菌此前报道,研发AlphaGo的DeepMind接入英国医疗数据,帮助医生提高诊断疾病的效率,并且预防各种疾病的传染传播等。对于人脸识别,北京西站已经开启了刷脸进站的服务,这让车站能够更高效的通过进站人流,对即将到来的春运人流高峰也有帮助作用。