关于自动决策的 GDPR 也需要防范根据种族、意见、健康状况等产生的歧视。但是使用用户生成的数据(如社交媒体和新闻,不指真实的数据,如医疗或财政记录)训练的深度学习模型通常暗含邪恶的偏见。如前所述,深度学习可以读取大量文本和数据,并模仿其内容,但无法理解内容。深度学习只相信它在数据中频繁看到的事物、底层模式和趋势,因此它会放大人类社会的偏见和问题。数据显示被逮捕的黑人比白人多,那么一旦有人犯罪,深度学习将首先怀疑黑人;数据显示公司董事会董事中男性比例高于女性,则深度学习将在招聘中更倾向于男性应聘者。
深度学习决策会比训练数据的平均样本包含更深刻的偏见,如种族歧视、性别歧视。这个问题在所有的机器学习算法中都有发生,但是深度学习模型是其中最难测试、检测、控制和调整的。这个问题很难解决,这引起很多深度学习实验突然取消,从聊天机器人变得纳粹化、充满仇恨,到美图软件中给黑人照片美白。
深度学习是一个神经网络,你无法单独编辑每个答案的输出结果。
你无法通过在训练之后添加补丁,来修复一个带有偏见、种族和性别歧视的深度学习模型。深度学习是一个神经网络,与其他 AI 方法不同,你无法编辑某个答案,而是必须使用全新的、完全公正的、稀有的数据对该网络进行重新训练。深度学习可以在不理解的情况下模仿数据中的内容:它不会否定任何数据,不会发现社会上的偏见,而只是「学习所有数据」。你应该雇佣一个人类员工,专门创建假的完美、公正的数据。但是,由人类专家编辑创建海量无偏见数据的成本仅为了训练深度学习模型,又怎么可以说用 AI 取代人类呢!此外,即使你已经训练出真正公正的深度学习模型,你也无法向法官或用户证明其决策的公正性,因为它无法提供解释。
深度学习的重要性应该降低,用于没有法律风险的非商业 app 或游戏。当可解释的 AI 变得流行,深度学习将会像磁带一样被抛弃。在游戏中输给机器人的人类不太可能说服法官对 AI 公司罚款,因为你无法解释 AI 是怎么赢的。不满 FaceApp 把自己的自拍照修的更老、更年轻,或者换了性别的人也不太可能说服法官对 FaceApp 罚款,因为你无法解释 AI 是如何决定新面孔的。在医疗图像中进行疾病检测是一项安全的深度学习应用,前提是用户在服药之前先向人类医生寻求确认。
合法的深度学习市场非常有限:在决策结果造成财政、健康上的区别,或者存在歧视性,而深度学习无法理解决策是否公正以及为什么公正的时候,法官可以处罚。那么自动驾驶呢?似乎在艺术、游戏或高级幽默以外的领域使用深度学习都有法律风险。现有的非深度学习方法可以取代深度学习,新方法也会被(重新)发现,因此 AI 的发展将会顺利进行。尤其是每个人研究(并投资)AI 和机器学习科学领域中的所有新旧算法,而不只是深度学习:这也是成为「人工智能专家」的唯一路径。
深度学习除了正在「非法」用于很多可解任务以外,它也不能被用于解决以下一系列问题:那些需要抽象推理来找出数据中哪些是公平,哪些是不公平的任务,那些需要解释其中的逻辑,并自行作出决定的任务。即使对于那些不需要解释的任务来说,深度学习看起来是最好的系统(如图像识别),但是也不如人类自己那样具有稳定性。你可以轻而易举地使用对抗样本来让深度学习系统出错:为一张猫的图片加入一些特殊的噪点,机器就会把它误认为其他不相关的东西,而人类绝不会犯错。如果街边的路牌被对抗样本黑掉了,现在的自动驾驶汽车将不再安全。新一代的人工智能系统必须克服这个问题——它也将取代深度学习。
著名深度学习库 Keras 作者 François Chollet 曾在一篇名为《深度学习的限制》的文章中说到:「深度学习唯一真正能成功做到的是使用几何变换,在给定大量人类标注数据的情况下将空间 X 映射到空间 Y 的能力。」这些空间拥有多维,不仅仅是三维的,这就是深度学习可以模仿毕加索风格作画、在德州扑克中 Bluff,以及在其他一些方面里展示创造力的原因。但是对于外行人来说,这也许意味着:深度学习模型可以被训练成拥有识别猫的能力,但本身不知道什么是猫;可以是一个种族主义者,但不知道什么是种族主义。深度学习可以识别猫、具有种族主义,并赢得很多游戏,这看起来是令人瞩目的进步,但深度学习无法解释为什么图中的动物是猫,也无法定义种族主义。