一篇论文引发的争议
近日,上海交大教授武筱林在国外论文数据库中上传了一篇论文,讲述其带领团队用人工智能算法鉴别“清纯”美女和“妖艳”美女,并且准确率达到了80%以上。这本是一篇正常的学术论文,但国内外各方对此的反应不淡定了,就像武筱林团队对美女做出“褒”和“贬”的标签一样,舆论各方对此也是各抒己见。
那么,这场争议到底是蓄意炒作还是学术争论?究竟是什么原因让这个学术问题上升到舆论问题?武筱林团队做的这项研究是否权威,是否能有说服力?研究过程中用到的技术算法是什么?机器判断“清纯”与否的标准是什么,会不会加入研究团队的主观意识呢?技术最终落地到产品,如果这项技术能够应用到实际中,其应用场景又有哪些呢?下面智能菌带你一探究竟。
情人眼里出西施?机器视觉还能帮你出"东施"
对于选美,自古就有“情人眼里出西施”的谚语,而在12月23日,上海交大教授武筱林将研究论文Automated Inference>
武筱林介绍称,目前人脸识别技术已经能够成功鉴别人类的性别、种族、年龄等生物性特征,那么对于识别人类的情感、性格等社会性特征,人脸识别技术能否进行推测鉴别呢?对于这篇论文引发的争议,武筱林或许有所准备,因为就在前不久他还发表了一份论文,讲述的是通过机器识别成年男子“罪犯”与“非罪犯”的类型,识别准确率高达86%。“罪犯”与“非罪犯”的标签相较于褒贬而言,更多的是对一个人社会属性的审判,此处智能菌更关心的是那高达14%的出错率。消息一经推出便引起了巨大的争议,而其中质疑和否定的居多。
既然有了前车之鉴,武筱林团队为何还要进行类似触及社会伦理的敏感研究?况且第二次的研究并非机器定罪中是与否的鉴别,而是针对个人主观因素占主要依据的审美。对此,武筱林在第二篇论文中表达了对上一篇论文引发争论的回应:“我们不能因为社会禁忌和政治观念,就在不加以检验的情况下否定这种可能性”。这样的解释能否说服质疑者?还要看其研究所采用的方法和技术手段。
好不好看人说了不算?机器审美标准从何而来
据论文介绍,武筱林的研究团队先是从搜索引擎中按照关键词获取照片,再人工进行排查,最后获取3954张美女照片,其中标记为清纯、柔美、甜美、单纯等褒义标签的照片为2000张,而标记为娇艳、俗气、风骚、轻浮等贬义标签的照片为1954张,分别以S1和S0代替分组。对于如何确定照片属于褒义标签还是贬义标签,除了按照搜索引擎的获取外,研究人员让22名男性研究生受访者对照片进行人工判断。
这是获取的样本,同时也是训练机器、做测试用的数据。研究团队采用深度卷积神经网络(CNN)对样本数据进行研究,其中80%的数据用于训练机器,即让机器明白哪些是褒义标签的照片,哪些是贬义标签的照片,10%的数据用于验证,剩余10%的数据用于测试。最后实验的结果是经过数据训练的机器对于两类标签的鉴别准确率达到了80.23%。
此外,为了消除照片中女性化妆对于机器的误导,研究团队讲所有图片调成灰阶图,机器鉴别的正确率依然达到了74.59%。由此研究团队认为可能是化妆照片面部的对比度和饱和度对机器鉴别产生影响,由此猜测照片的对比度和饱和度是机器做出判断的重要依据之一。