面向大数据的时空数据挖掘

  数据收集和预处理

  为了进一步理解并调控数据中心的热量管理系统,数据中心在有限的位置布置热量传感器,通过传感器收集不同位置的实时温度。另外,数据中心的热量传感器、空调机组和打孔瓦的物理参数,比如每个热量传感器的坐标位置,每个空调机组的坐标位置和长宽高(三维物体)以及打孔瓦的坐标和长宽(二维物体)等信息也会相应地影响数据中心不同位置的空气流,如图 8 所示。

  图 8. 数据中心结构图

物联网

  这些数据不能直接应用于时空数据预测建模,必须要先进行数据预处理,把温度数据、各个物体的位置数据等进行融合,从而得到一个包含空间地理位置字段,时间字段,预测输入字段和将要预测的目标字段的一个表格式的输入数据。

  时空数据建模

  经过数据预处理,我们得到一个包括时空数据预测建模所需字段的标准输入数据。然后我们将选择并设置时空数据预测模型的不同参数来建立时空数据预测模型。很显然,这里的目标字段为数据中心的温度,空间位置字段为温度被监控的位置,即热量传感器的坐标位置,时间字段为温度被监控的一系列时间点,预测数据字段则为其他相关因素,包括数据中心的空气流、空调机组的长宽高等,如图 9 所示。

  图 9. 数据预处理后的输入数据结构

物联网

  接下来根据数据中心温度的监控时间点来设置时间间隔选项,如果温度是每小时收集一次,那么时间间隔应设为小时并设置起始点;如果温度的收集频率是一天一次,则应设时间间隔为天。并且根据输入数据的时间变量的特征决定是否需要对数据进行转换从而使得数据与指定的时间间隔设置匹配。

  然后根据需求设置最大自回归阶数指定使用哪些先前值来预测未来值,并且指定计算空间协方差的估计方法。为了最大程度的提高对时空数据预测模型的预测准确性,还可以通过设置"缺失值的最大百分比"和"模型构建中用于假设检验的显著性水平" 对模型构建过程进行微调。

  最后构建时空数据模型,从而实现后续的模型输出和假设检验分析。

  时空数据预测

  想要获得对目标值的预测,即要了解下一个时间监测点或者将来某个时间点数据中心不同位置的温度值,需要有和时空数据建模的输入数据结构统一的预测输入数据。其中,时间为将要预测温度值的时间点,空间位置为将要预测温度值的位置点,其他相关输入变量均为每个将要预测温度的位置的相应未来值。有了预测输入变量,输入时空数据模型即可得到数据中心在指定时间指定位置的温度值,同时还可获得该预测值的错误方差及预测置信度的上下限。

  时空预测结果展示

  时空数据预测模型的显著性不仅在于它可以同时处理时间和空间两种属性并对未来任何时间任何地点的目标值进行预测,更在于可以通过时空预测模型进行假设检验分析从而改善决策。

  在上述数据中心能量管理的应用实例中,时空数据模型可以通过热图来可视化在指定时间指定位置的目标值,如图 10 所示。

  图 10. 数据中心温度预测热图

物联网

  在时空预测过程中,首先假定在下一个时间监测点所有其他的参数都保持现有值,即空调机组的数目和位置,热量传感器的位置,空气流等保持不变的情况下的温度情况,得到如图 11 热图所示的结果。从图中可以看出,在现有制冷持续的情况下,部分区域会出现温度过冷现象。基于该假设检验分析的结果,为了节约能量,我们可以把空调机组的制冷设置温度升高 1 度,从而得到如图 12 所示的热图。从图中可以看出,保持现有设置不变情况下的过冷现象得到明显改善。

  图 11. 保持现有设置不变的温度热图

物联网

  图 12. 采取措施后的温度热图