通用电气制订大数据应用计划

借助于通用电气制造的工业产品所收集的敏感数据,新一代分析技术即将为一系列行业创造出更多的机会。

通用电气软件与分析中心副总裁William Ruh在2012年12月阐述了该公司大数据策略中的三个关键组成部分:即预测性分析、针对分析的云平台和安全性。

作为全球最大的企业之一,通用电气一直是航空、铁路、采矿、能源、医疗保健等行业的主要系统生产商。在认识到大数据对于公司的重要性后,通用电气的CEO Jeff Immelt推出了一项名为“工业互联网”的创新项目,旨在帮助客户提升效率,同时利用分析方法为通用电气创造出新的营利机会。

“工业互联网”是通用电气进军“物联网”的一项重要举措,它可以通过与互联网连接的传感器收集大量数据并进行分析。Immelt表示,目前他们已经在通用电气制造的25万台“智能机器”中嵌入了传感器,这些机器包括了喷气发动机、动力涡轮机、医疗设备等。获取和分析这些由传感器所生成的数据对于优化工业运营具有巨大的潜力。

比方说,通用电气打算分析他们在过去五年中收集的报警与错误报告数据,并利用这些数据识别出那些能够让计划维护变得更为精确的行为模式。

在航空领域,通用电气的GEnx喷气引擎每秒分析5000个数据点,以优化飞行时间。在铁路交通领域,通用电气和客户通过收集和分析来自传感器的数据能够确定哪些车轮需要被更换。与此同时,他们还计划增加一些摄像头,以录制关于轨道的视频,并对这些视频进行实时分析。

通用电气还计划利用从其他来源收集到的数据来丰富他们的数据集。例如,利用卫星数据来丰富智能电网地图。这样一来,那些供电公司就知道清除哪里的植被可以降低电线在暴风雨中短路的风险。

Ruh表示,通用电气将利用现有的厂商和开源组件实现突破。虽然该公司将使用Hadoop和R语言等技术,不过他也明确表示“没有一家厂商拥有解决问题的灵丹妙药”。他举例称,机器学习是一个独特的领域,他希望自己的团队在这方面取得一些新的突破。

这了实现这一目的,Ruh希望他的技术团队能够创建一个分析云,以便相关工具能够被随时接入进行数据收集和分析。该平台还需要具备充分的灵活性,以便企业能够向未来出现的新兴技术迁移。最后,安全性和兼容性也是通用电气关注的重要部分。其中,“监控谁在什么时候做了什么”的能力是重中之重。这一举措将计算机系统中的取证技术扩展到了工业系统中。

Ruh称,扩展性在整个领域都属于基础架构方面的挑战。据他观察,针对业务交易的传统企业软件并不适用于通用电气系统生成的实时、高速、大容量数据。例如,一个关键性需求是存储那些融合了类似Hadoop分析技术的时间序列数据。

为了实现这一目标,通用电气在全球的9000多名雇员正在研发这一软件。不过,研发软件和分析技术只是该公司基础性工作的一部分,这一工作在Immelt看来还需要进一步深化。Immelt曾经表示,通用电气希望在旧金山湾区成立一个办公室,以便能够更为容易地招聘到拥有分析技术专长的工程师,以及与新兴公司展开合作。此外,通用电气还将采取与投资卫生保健企业相似的模式收购一些企业的股权。

此外,通用电气两年前还在加州靠近硅谷的圣拉蒙市成立了一个软件与分析总部,并从思科那里成功的挖来了Ruh,以领导并展开技术创新。Ruh表示,他们的办公室已经增加了300名雇员,其中半数以上是开发人员,其余的则是架构、营销、支持和运营人员。Ruh希望到2013年年底,该团队的人数能够增加到500人。(范范编译)