黄:我们还在做基于深度学习研究的图像理解和分类。以及在QQ音乐上的哼唱检索、类别识别和个性化推荐。通过分析音乐的信息,识别出歌曲类别,比如流行、摇滚,打上标签。另外通过用户行为知道他喜欢什么歌,也可以更好的帮他做推荐。
作为大公司背后的技术团队,优图确定技术方向的逻辑是什么?
黄:一方面,我们团队有相当大的自主权,在音视频多媒体大数据这个框架下可以做各种技术研发和落地尝试,老板会支持员工或者团队做较多尝试。我也在一直给团队传达这个理念。我们也会实时关注时事动态,与热点做一些结合。
另一方面,也会与业务一起确定需求。每周都会有业务来找我们提需求。比如,我们在2012年做的智能剪裁,传统剪裁缩略图的方法是直接中间截图,但实际的图片中可能是照片上的人在图片的一边而非中央,所以就需要用智能剪裁技术裁剪更好的缩略图。当时QQ空间提出了这个需求,我们觉得很好就做了,而且这个技术并不难。但是对于业务带来的好处很大。很多时候这两种情况时并存有交叠的,更多的是我们自发推动的。
当然,还会考虑到布局。我们是一个一个项目推进,这样就能连成一条线,可以逐步加大加深团队的积累。比如做了人脸识别之后,我们又做了活体检测。做对了大方向之后,很多东西就是水到渠成的事情了。