深度学习在图像取证领域中的进展

隐写分析是针对隐写问题发展而来的一种技术手段,目的是检测目标中是否包含隐藏信息。待检测目标中嵌入隐藏信息的比特率越低,意味着隐藏信息量越少,检测难度越大。传统的隐写分析都是基于特征提取加特征分类的两段论方案,为了更全面的刻画待测目标中的“微弱”信号,维度不断增加的高维特征被提出,例如Rich Models特征。特征分类方面为了加速高维隐写特征的分类,Fridrich课题组提出了针对隐写分析的特定分类器,集成分类器。

深度学习的发展为隐写分析提供了一种新的思路。Qian Y, Dong J等首次将深度学习算法应用于隐写分析领域,并基于隐写分析的领域知识提出高斯激活函数,取得了和传统方案性能相当的检测效果;Guanshuo Xu, Yun-Qing Shi等设计了一种新的网络结构,在网络结构中添加了绝对值层、BN层和全局pooling层,也取得了较好的检测效果。基于以上工作,两者又相继推出了后续工作。Qian Y, Dong J等融合迁移学习的方法进一步提高了算法性能;Guanshuo Xu, Yun-Qing Shi等提出了基于集成学习和集成分类的方案。

图像取证深度学习之风何去何从

如今深度学习的如火如荼让各行各业的同胞摩拳擦掌。就取证领域而言,深度学习的探索之旅还处于小荷才露尖尖角的状态。如施云庆教授在IWDW2016中的谈话所言:“深度学习在取证领域中的进步相较于计算机视觉领域是很小的,如何进一步提升深度学习在取证中的检测性能仍然值得关注”。另外,取证领域的数据集规模相对于计算机视觉领域较小,对于数据驱动型的深度学习算法,更大规模的公开的全面的精确标注的数据集对于图像取证问题无疑是迫切需要的。

这段时间本文作者经过一些探索也取得了一些心得,在此和大家一起探讨。首先就网络的深度而言,浅层的网络结构已然可以得到较好的实验结果。当然网络的加深会对实验结果略有提升,但是并不能和增加层数带来的计算复杂度的提升成比例。其次,预处理操作并不是对于所有取证问题都适用,预处理操作在放大噪声信号的同时也相应的丢失了部分原始信息,对于深度学习数据驱动型算法而言,这些丢失的原始信息对于算法性能的影响比重如何暂时还无定论,所以预处理操作添加与否还需具体情况具体分析。

目前基于深度学习的图像取证研究还有许多问题需要去解决,更多的路需要去探索,本文作者欢迎读者的任何意见或者建议,并期待和大家一起探讨。