第四组(LCLL):火眼金睛

第四组(LCLL):各位领导老师嘉宾,各位同学大家好。我是来自浙江大学的李晨,我们团队做的是人技术类的第一个题目:火眼金睛。我们团队拥有四名成员,都来自于浙江大学,队长是李越,队员有张德斌、我、赵笑廷。

我们团队所做的东西是用来判断一张图片中否含有人。组委会给我们一些图片,图片比较复杂、视角也不限。关于这个算法的运用我们有很广泛的范围。我们可以用在道路交通行人的检测,也可以用于监控视频中人像的搜索。关于检测是否有人的算法,已经有一个很长时间的研究了。这边引用了一篇论文中关于传统做法的结果图。传统的做法效果都不是很好。最近基于深度学习的算法发展的非常好。所以我们在百度识图、百度魔图上都有很好的应用。我们团队决定使用深度学习的算法来完成这项任务。基于深度学习的算法,我们团队的算法取得了非常好的效果,我们排名第一,准确率达到98%。在理性测试中,我们团队的算法仍然有98.2%。

关于深度学习算法,我们参考目前比较优良的其他人的算法构建了一个深层的神经网络。包括基因层、采样层、规划层。我们构建了十层的神经网络。神经网络的训练我们需要非常大量的数据。主办方只有三万张左右的图片数据。为了使我们的效果更好。我们团队自己从网站搜集了很多数据。搜集完数据以后,我们一共搜集了九万张数据,并进行了人工标注。我们设计输入内容,我们采用三通道的彩色图象,128乘128的分辨率。并且我们在神经网络中添加了规划层,使得我们的算法效果更好。并且更有泛化能力。这是我们神经网络的结构。我们采用了非常深的神经网络层。并且采用较高分辨率的图象进行训练。

这是我们算法测试结果。图象显示的是我们训练的误差,从每次迭代之后误差逐渐减少。说明我们的算法在不停迭代之后有非常好的性能。这是我们算法训练数据的可视化效果。

目前我们用了接近九万张图片进行训练。但是规模数据还是远远不够的。所以我们考虑在算法中增加更大规模的分布式计算和更大的规模来完成这项工作。

我就介绍到这里。谢谢大家!