苹果首先发布了其中四个图像识别模型以及一个面向计算机视觉和自然语言处理的API。这些工具在用户设备本地运行,也就是说,数据仍然是私有的,永远不需要在云上进行处理。
此外,苹果还让AI开发人员可以很容易地将他们自己喜欢的AI引入苹果设备。某些种类的深度神经网络可以直接转换为Core ML。
苹果现在提供了Caffe和Keras支持,前者是由加州大学伯克利分校开发的一款用于构建和训练神经网络的开源软件,后者是一个可以简化那个过程的工具。值得注意的是,它不支持谷歌的开源AI框架TensorFlow。不过,创建者可以构建自己的转换器。
在苹果提供的预训练模型中,有一部分是开源的谷歌代码,主要面向图像识别。
需要说明的是:苹果并不是第一个发布可在移动设备运行的深度学习工具的公司。
在WWDC之前的谷歌I/O大会上,谷歌发布了“为移动而生”的TensorFlow Lite,它将允许开发人员在用户的移动设备上实时地运行人工智能应用,有多款在移动设备上使用 TensorFlow 做翻译、风格化等工作;TensorFlow 在移动设备 CPU(高通 820)上,能够达到更高的性能和更低的功耗。
而早在 2016 年 11 月,Facebook 就已经发布了一个称为 Caffe2Go 的架构。Caffe2Go 用于实时风格转移(Style Transfer),即在用户的移动设备添加了类艺术(Art-like)过滤器。在今年的 F8 大会上, Facebook 进一步发布了 Caffe2,正式支持移动平台。而除此之外,MxNet 深度学习框架也支持多个平台,包括移动设备。
和Tensorflow、Caffe等深度学习框架不同,Core ML是完全聚集于在设备端本地进行深度学习推理的框架,而其它框架除了支持本地设备端同时也支持云端,能够推理也支持训练。苹果宣传Inception v3速度是Tensorflow的6倍,这是通过MetalAPI对于GPU能力充分利用的结果。
相较于其他移动端深度学习框架,Core ML看起来更方便使用。苹果很聪明的定义了一个标准的模型格式(.mlmodel),提供了流行的框架模型到该格式的转换工具,比如你可以将你的Caffe模型转换成Core ML的模型格式。这样就可以利用各个模型的训练阶段,而不像TensorflowLite只能使用Tensorflow模型。模型训练好了之后,只要拖放到XCode中就可以使用,苹果甚至把接口的Swift代码都生成好了,非常方便。
从目前的情况看来,Core ML似乎在移动端上的表现更胜一筹,但是将来是否真的可以保持稳定发挥,还得靠时间来检验。
苹果系统中AI应用
苹果在之前的开发者大会上的主题演讲中清楚地向大家表明,发生在手机上的每个动作都会被记录,然后由操作系统的一系列机器学习算法进行分析,判断是否预示着用户希望要做一个日历预约、拨打一个电话,或者制作更好的动态照片。像Apple music的听歌推荐,通过对用户听歌记录的学习来调整作出相应的推荐;iphone的电池续航,手机的电池管理系统使用了机器学习,了解了用户的使用习惯并作出相应的调整,使续航更持久。
另外从Siri的声音也可以看出苹果用到了机器学习。他们不再使用预先录制好的标准答案,现在,Siri的声音完全是由AI生成的。这样更灵活(苹果在大会上示范了四种不同的音调),随着技术的发展,它听上去会越来越像真人(苹果的竞争对手离这个目标已经不远了)。
学术研究
苹果只发表了一篇论文,并且获得了CVPR 2017最佳论文。苹果AI研究负责人Ruslan Salakhutdinov一直在做巡回演讲(很大程度上是为了招聘到AI顶尖人才)。举例来说,他在Nvidia的GPU技术大会上了发表了演讲,之后他还会在纽约发表演讲。此外,去年年底,在Salakhutdinov上任后不久,苹果在一个重大的AI会议上和他们的竞争对手举行了一场闭门会议。但是,就目前竞争激烈的AI市场来讲,论文和演讲的威慑力似乎远不如实在的研究成果来的强大。苹果公司如果想成为全球AI领跑者,未来的路似乎并不好走。