Slack、Facebook Messenger、Alexa 和虚拟现实商店等新平台的增长对开发者来说也是有利的,因为平台会越来越开放、会增加让开发者生活更简单的应用、还会通过投资基金等手段互相竞争以获得开发者的关注。
最终,在接口层上,我们将看到文本、语音和视觉的“自然接口”将解锁会话商务和增强现实/虚拟现实等新型类别的接口。我们对这些接口的未来是非常乐观的,因为它们是人类互相之间、人类与世界之间互动的方式。
构建模块和学习服务
智能构建模块和学习服务将会成为应用背后的大脑。
图片来源: TechCrunch 。
随着企业们对微服务开发模式的采用,即插即用不同机器学习模型和服务以实现特定功能的能力将变得越来越有价值。在这一层面上,我们能看到两种类型的企业:一类是原始机器智能提供商,另一类是训练模型(即“模型即服务”)提供商。
第一类提供商为智能应用开发者提供“原始的”或核心构建模块,如算法和部署过程。第二类提供商则为企业提供中间服务,让企业可以即插即用地使用预训练模型处理图像标记、自然语言处理或产品推荐等任务。这两类智能应用背后的企业为智能应用提供了很大一部分价值,但这一层的关键问题是如何确保这些构建模块能获取它们提供给终端用户的一部分价值。
IBM 沃森的方法是免费为开发者提供其 API 的使用权,但在开发者的应用被发布给消费者时会收取其 30% 的收入。其它一些提供商则基于 API 调用、计算时间或虚拟机进行收费。
这一层的企业的关键不同在于:为开发者提供优质用户体验的能力,以及机器学习算法和模型的准确度和性能。
对于自然语言理解等复杂而又通用的问题,如果供应商具有最好的数据、模型和流程,预构建的模型很可能会更简单、性能更高。但是,对于特殊的特定业务,创业公司和企业得开发他们自己的模型和数据集。
数据收集和准备
困难又枯燥的数据收集和准备任务将变得更智能。
在数据被准备好送入机器智能的工作流程或模型之前,还需要进行收集、聚集、清理和准备。消费者和企业应用的数据来源包括照片和视频、网站和文本、客户行为数据、IT 运营数据、物联网传感器数据和网页数据。
当应用仪器收集到原始的数据之后,还需要将其转换成机器支持的格式。比如,企业需要将文本文件和照片等非结构化数据转换成机器可以审查的结构化数据。这一步中,必须认识到模型的质量高度依赖于其输入数据的质量。没有高质量训练数据而开发的 bot 或“人工智能”可能会导致意想不到的后果(参考微软的 Tay),而这种训练数据的收集往往依赖于半手动的过程,比如众包或查找历史数据集。
这一领域中其它值得关注的部分是传统上作为数据源(如点击流数据或应用性能日志)的“笨”管道的公司。它们不仅将尝试构建预测性和适应性的功能,还将面临来自希望从相同的数据源中提取观点的智能服务的竞争。
这将成为金融、客户关系管理、IT 运维、市场营销、人力资源等传统上收集数据但不即时提取观点的行业的一个创新领域。比如,HR 软件将基于之前招聘的历史数据,在提供面试反馈和关键岗位最佳候选者方面,表现得越来越好。
数据基础设施
智能应用将构建于大数据技术的基础上。
图片来源: Flickr/Marius B under a CC by 2.0 license
全世界的数据量每 18 个月翻一番,而且因为这种大数据爆炸,企业已经在存储和数据分析上投入了巨资。
Hadoop 和 Spark 这样的项目已经成为了较大型的应用智能生态系统的关键推动者,而且它们也将继续在智能应用各个层次中充当关键角色。在选择分析基础设施上,开源仍将是一个重要的特性,因为客户希望看到“引擎盖下”是什么,以及避免在他们选择数据的存储位置和方式时被供应商限制。
在 IaaS(基础设施即服务)领域内,每一家主要的云提供商都将争取支持智能应用的工作负载。我们已经看到一些公司开源了自己 IP(知识产权)的关键领域(如谷歌的 TensorFlow 机器学习平台),从而将企业和开发者吸引到它们的平台。尤其是谷歌,未来将成为一家值得关注的公司,因为公司为增长核心 IaaS 业务,而将自己通过世界上最大的数据集训练的机器学习模型开放给用户。