3)新的驱动力不同:感知技术的发展和普及是工业大数据的驱动力,现有的工控技术很难处理大数据量的挑战,大量的监测数据也为大数据分析带来与业务数据融合分析的机会。而互联网的发展为企业带来与客户交互的新渠道,极大促进了商业大数据分析的发展。工业领域的大数据大多是具有时空信息的结构化数据,且背后有明确的物理结构(如系统动力学、网络拓扑关系等),对时间序列、时空模式、序列模式等结构模式挖掘非常重要。而商业大数据分析大多集中在结构化的数据仓库表或非结构化数据(如文本、视频),数据间除了实体关系和部分时空信息外,结构性关系较弱。
4)对分析技术的要求不同:工业系统的实时性高,动态性强,对分析结果的精度要求高,很难接受概率性预测,而商业应用常遵循大数原则,概率性的分析就可以为运营提供很大的帮助。不同工业应用场景对技术指标的要求也不同,比如在风机领域,大部件的故障检测报警已经在PLC中实现,大数据分析只有提前若干小时的故障预警才有意义;油气管道泄漏检测中,泄漏发生后的及时报警也很有意义,但其要求零漏报、极低的误报(管道深埋地下,误报会给一线工作人员带来很大工作量);在抽油机监测分析中,可容忍分析算法对一些罕见或复杂故障类型的无法研判(类似漏报),但分析算法可以研判的出示功图异常的的准确率应该是100%(这样就可以降低70~80%的重复性工作)。
工业数据分析的价值实现之道
综上所述,工业大数据分析更应该抱着“小数据”的心态,敬畏机理模型和领域经验,把数据分析模型与机理模型充分融合。数据分析对工业领域知识的帮助主要体现在如下3个渠道: