机器视觉
在旧金山码头一个废弃的仓库里,当潮湿空气从生锈的铁皮屋顶上的洞里涌出来的时候,Sunny Tang正在演奏她的大提琴,同时正从流感中恢复过来。她有45%的悲伤和0.01%的恶心,至少这是在仓库另一面追踪她的表情、手势和身体语言的人工智能(AI)获得的信息,并在她身后的大屏幕上显示出来。
机器情感分析
Sunny Tang正与Kronos Quartet的其他人共同演奏,这是一个以非正统实验而闻名的旧金山弦乐系列,而AI则服从特里沃尔·帕格伦(Trevor Paglen)的命令,这位美国艺术家在几乎所有的媒介上都对技术和监控提出了重大质疑。这都是视觉机器(Sight Machine)项目的一部分,它是帕格伦编排的表演,目的是探索计算机视觉崛起带来的影响。
几分钟后,当Kronos Quartet开始演奏其他曲子时,屏幕上出现了新的图像。最初,它们通过环绕在上空的卫星的眼睛来显示地球。然后,他们放大了地面上的东西,显示AI正锁定房子、汽车和个人,随着帕格伦的硬件和软件追踪到Sunny Tang的动作,他们就像从天堂里追踪他们的一举一动那样。
“一个地球,一个人。”一个无形的声音说,这个声音在寒冷的仓库中回荡着。这一次,没人再笑出来。就在几分钟前,有趣的事情开始让人感到不安。在帕格伦在旧金山湾进行试验三个月后,这些感觉仍然引起了共鸣。就像艺术家的作品那样,视觉机器正触及那些基本上看不到但却非常真实的东西。
随着电脑视觉在我们的生活和风景中悄悄传播,它具有娱乐性和实用性,功能强大,存在缺陷,有趣但却令人感到不安。AI也是一个整体,你看不见它,但它无处不在。“没有任何结论,”亨利·迪尔斯(Henry Dills)说。他是一名摄影师和大提琴手,穿着一件棕色的运动外套,戴着一条白色的围巾,正在观看表演。他说:“这些机器开始给我们带来巨大的阴影。过去只有神明才会如此,现在则是机器。”
谷歌、Facebook和苹果都在打造能够实时分析人类情感的服务。像笛卡尔实验室和轨道研究所这样的初创公司利用类似的技术来分析大量的卫星图像,以了解人类活动和意图。在通常情况下,人类自身想要了解这些活动和意图也会非常困难。依赖于深度神经网络,复杂的数学系统可通过分析大量数据来学习执行任务,但这些服务并不完美。
然而,它们的进步很快,正迅速从实验室进入现实世界,包括帕格伦的技术。他和自己的工程师团队使用开源软件,在谷歌和其他公司内部的神经网络上运行。音乐会期间的一些图像是预先录制好的,但在很多情况下,神经网络实时追踪了Sunny Tang和Kronos Quartet乐队的其他部分。帕格伦说:“我想从艺术中得到的东西可以帮助我们看到我们周围的世界,这是我们生活的历史时刻。”
帕格伦最出名的工作是探索政府监控的深度,从美国国家安全局的海底电缆窃听照片到五角大楼全球间谍网络图等。今年,他开始在斯坦福大学的坎托艺术中心工作,这里是AI研究的主要中心。但他并不是在玩弄关于机器人霸主的旧观念或文化上的陈词滥调,他正探索计算机视觉的尖端领域正在发生的事情。
起初,帕格伦想参加OpenAI项目,后者是由特斯拉首席执行官伊隆·马斯克(Elon Musk)和初创企业孵化器Y Combinator总裁萨姆·奥尔特曼(Sam Altman)斥资10亿美元创建的实验室。OpenAI的目标是加速AI的发展,尽管其目标是利用AI保护世界免受此类加速带来的危险。但OpenAI却犹豫不决,所以帕格伦去了斯坦福大学。
帕格伦的新项目触及了他在政府监视工作中所从事的某些相同主题。当Kronos Quartet演奏特里·莱利(Terry Riley)的《>与此同时,帕格伦正在解决现代AI自身学习带来的有时神秘、有时令人不安的方式。在很多情况下,神经网络都能很好地完成被要求做的事情,但即使是设计这些网络的人也无法完全理解为什么它们如此有效。它们通过分析更多的数据来学习,比人类更谨慎。这种复杂性意味着,人类无法真正地分析它们是基于什么做出的决定。