谁领先人类识别技术--以深度,卷积和递归为基础?

  Daphnet Gait 数据集

  (DG)Bachlin等人记录了帕金森病(PD)对于10个参与者的影响,这意味着开展活动,可能会导致步态冻结。冻结是帕金森病常见的运动并发症,它会影响个体的移动,例如散步。我们的目的是检测这些冻结的事件,以便通知未来情境激励系统。这代表一个两级的识别问题。加速器数据是从脚踝以上,膝盖以上和躯干部位进行记录的。最终的数据是9维的。我们在验证集中使用对象9的第1关,在测试集中使用了对象2的第1和第2关,并且使用剩余的数据进行训练。据我们分析,我们向下采样加速器数据到32Hz,对于帧到帧的分析,我们创造了持续1秒且重叠为50%的滑动窗口。整个训练集包含了大概470k的样本(30k的帧)。

物联网

  表1:模式的超参数和实验的数值范围

  通过逐帧分析,我们创造了持续时间为1秒且重叠部分为50%的滑动窗口。训练集大约包括470K的样本(30k帧)。

  4.2超参数的影响

  为评价所有实验中每一个参数的影响,我们运用fANOVA框架分析方法。fANOVA会决定每一个超参数对于网络结构表现的影响程度。它会就模式的表现建立一个预测模式,并作为超参数的函数。这一非线性模式随即被分解成为超参数的相互作用函数。fANOVA曾在递归函数中进行超函数探索。

  对于探索者来说,知道模式的哪一方面对表现的影响最大是至关重要的。我们将模式的参数分成三类:(1)学习型参数,控制学习过程;(2)规则型参数,限制模式的建模能力以防止过度重合;(3)构建型参数,影响模式的结构。每一个超参数都不一样,我们估计归因于参数类别和不同等级参数之间的相互作用。

  4.3 表现标准

  由于在本次研究中所使用的数据集有偏重,所以要求表现标准的类别分布是独立的。我们倾向于评估f1数值的平均值:

物联网

  相关研究曾使用加权f1分值作为主要表现标准。为把我们的结果和其他先进方法进行比较,我们会对加权f1分值进行评估:

物联网

  Nc表示的是在c等级之内的样本数量,Ntoatal代表是样本总数量。

物联网

  表2:每一模式和数据集所获得的最好结果,和一些比较标准。变量增量(表格的下半部分)指代的是所有实验中上等和中等表现之间的绝对差别。

  5.结果

  结果在图2可见。图(a-c)显示的是主要表现标准在每一个数据中的累积分布。图(d)通过fANOVA 解释了每一超参数类型的影响。

  总的来说,我们观察了模式在OPP和DG上的优秀表现分布,其中在(b-LSTM-S)表现最好f1的平均值超过了15%,在OPP中表现最差(DG上的平均值为12%)(见图2)。在PAMAP2上的差别较小,但也有7%。在OPP上表现最好的方法超过目前的先进方法,在f1的平均值上超过4%(加权f1值超过1%)。CNN模式发现此项研究比之前结果都要好,因为f1的平均值和加权平均值都超过5%(见图2)。递归方法表现良好,它能就实验样品进行建模,能对HAR进行新(实时)运用,因为它们能缓解分割时间序列数据的压力。

物联网

  图2:(a)-(c)每一个数据集识别表现的累积分布;(d)从fANOVA分析得出的结果,并解释超参数的种类对于识别表现的影响(见表1)。

  在本次所研究的模式中,表现得分的分布不同。CNNs显示最有特色的表现:模型配置的一小部分表现较差(例如,在PAMAP的得分为20%),而其余配置在表现上的差别却不大。在PAMAP2中,例如,最优表现和中等表现之间的f1平均值只相差7%(见表2)。DNNs显示在OPP上所有方法的最优和中等表现相差最大值为35。7%。两个前置RNNs模式(LSTM-F,LSTM-S)在不同数据集上表现相似。尤其在PAMAP2和OPP上进行探索的配置识别表现非凡。