如何使用机器学习解决物联网的大数据挑战

  机器学习将在2017年开始从实验室研究和概念验证实施转向领先的业务解决方案。机器学习将帮助企业进行创新,如自主汽车,精密养殖,治疗药物发现,以及金融机构的高级欺诈检测。

  机器学习与统计学,计算机科学和人工智能相结合,侧重于开发快速高效的算法以实现实时数据处理。这些机器学习算法并不只是遵循明确编程的指令,而是从经验中学习,使它们成为人工智能平台的关键组件。

  机器学习有助于解决物联网数据流问题

  机器学习也可能帮助人们应对物联网的挑战。英特尔数据中心机器学习解决方案总监VinSharma表示,第一代大数据分析是围绕社交媒体,在线购物,在线视频,网上冲浪,馺其他用户生成的在线行为产生的信息流动而成长的。

  分析这些海量数据集需要采用新技术,例如灵活的云计算和虚拟化,ApacheHadoop和Spark等软件。它还需要更强大的高性能处理器,并提供工具来发现大数据的洞察力。

  如今的物联网连接网络使大数据第一代的数据量相形见绌。随着设备和传感器不断增长,他们创建的数据量也将增加。

  例如,一辆自主驾驶汽车每天将生成4,000GB的数据。新的空中客车A380-1000飞机在每个机翼上配备了10,000个传感器。传统的大数据技术将不再能够处理智能家庭中的连接电器,智能城市中的交通传感器,以及智能工厂中的机器人系统所创建的数据。

  新的和令人兴奋的系统要求

  机器学习的关键是分析来自庞大的,永远在线的物联网网络的巨大而重复的数据量。虽然机器学习可能看起来像许多科幻小说一样神秘,对许多人来说,机器学习已被用户所熟悉的社交媒体和在线购物网站所应用(Facebook的新闻依靠机器学习算法,亚马逊的推荐引擎使用机器学习向读者推荐书籍或电影)。

  机器学习系统识别物联网网络上存在的数据的正常流动模式,并集中于规范之外的异常或模式。因此,机器学习可以从数十亿数据点在巨大的数据流中分离“信号与噪声”,帮助组织关注有意义的内容。

  然而,为了对企业有用和有效,机器学习算法必须在大约几毫秒的时间内在持续的基础上运行计算。这些更复杂的计算将会给传统的数据中心处理器和计算平台带来压力。

  为了以规模和实时操作,机器学习系统需要具有多个集成核心的处理器,更快的存储器子系统,以及可并行化用于下一代分析智能的处理的架构。这些是具有内置分析处理引擎的平台,以及在内存中运行复杂算法以实时结果和立即应用洞察的能力。

  最终预测

  为高性能计算而构建的处理器将面临很高的需求。机器学习和人工智能将需要更多的力量,因为他们开始连接物联网数据流和客户参与之间的点,提高销售和推广的能力。

  这些处理器是传统的研究实验室和超级计算机的挑战,例如天气模式和基因组测序的建模。但是随着物联网网络变得越来越大,越来越普遍,机器学习平台将变得越来越必要,因为企业越来越多地将其成功基于机器到机器通信的洞察。

 

  这些处理器提供了最苛刻的工作负载所需的性能,包括机器学习和人工智能算法。因此,它们不再局限于研究中心和大学中超级计算机的恶劣环境,因为它们越来越成为尖端企业的要求。