我们现在观察到很多的AI所谓的大拿们,他们更关注怎么落地,能不能把毕生研究成果能够体现出来,所以在我们内部在吸引人才的时候,往往也会说你们微信、手机QQ里面的平台数据能不能给他们用,但是事实上大家都知道,BG、部门里面的平台他们也很希望近水楼台先得月,数据就在我身边流动,我为什么不能招人先研究一把,为什么给你呢。我们现在还处在内部怎么把数据分享出来这个阶段。当然这里面还有一个用户很关注的个人隐私,别把我的数据都卖了,到时候大家都知道,这里面还有一个很复杂的信息安全个人隐私脱敏,你是不知道无法根据数据倒推到哪一个人做了什么事情,我们要把这些处理干净才能往下一步谈。这里面数据清理到什么标签,才能给其他部门、包括外部合作伙伴怎么用。同时有很多数据来自合作伙伴,业界其他公司,他们也遇到这样的问题那者一堆裸数据不怎么用,这样业界还要有一个标准,互惠互利交换,这是一个大方向,还有很长的路要走。
吴鹰:大数据清理之后,有针对性的,对业界别人是一个价值,别人也是一个补充。我相信人工智能是一个全社会的协调最后发展的过程。刚才朱民讲有那么多问题,所以政府也要介入来做。我们主管部门官员这次也参加了,省政府、市政府官员参加了,就是要大家共同来解决问题,其实还不光是中国,是一个世界范围内大家协同做一些事情。
微软如果大家愿意跟你们合作,你们是不是感兴趣这个事情?
沈向洋:你刚才问Pony这个问题问的非常好,作为大公司来讲,特别是成功大公司来讲,我们对社会有一个责任,对行业有一个责任。当我们行业做的很成功,第一件事情就是开研究院。现在Pony也开研究院,唯一做的不对的就是开到微软门口去了。我也想分享一下在微软的工作经验,你说叫这些公司把数据拿出来,让初创公司或者其他公司去用,我觉得不见得很现实、不见得很容易。Pony刚才解释的很好。但是我想鼓励大家,很多的数据如果我们愿意花时间、花精力做一点处理,比如Pony刚才讲的。然后让研究人员去用,完全是可以做到的。我们微软出了两个数据集,一个是计算机视觉标准方面的集,这样可以做数据分割、物体分割。最近做了另外一个数据集是在自然语言,希望有一批新的做问题问答。这样推动研究领域,大家在标准集下,不断把标准集数据越做越多。我们做的方法是用搜索引擎数据,非常小心处理过,包括很多隐私的问题等等。拿出一些数据让大家做研究是非常实际的,完全可以做到。
吴鹰:Pony大家很支持你的观点,将来我们也期待像BAT这样的大公司,不但是说数据拿出来分享,刚才Pony还主动提到包括运算能力分享都有可能来做,这样对创业公司、中小公司,包括政府、研究机构特别是大学,非常重要。其实利润这个事儿对企业在某些方面是制约企业发展的,他一定要完成这个利润,他是一个上市公司要做到这些。这就相对的眼光短一点。其实大学很多研究,美国很多一流大学做这些事情,像MIT,今天下午陈刚教授会介绍。他从拿到课题,我要对人类将来有影响。我们这些公司的影响都是很有帮助的。
但是你转型在智慧城市上锲而不舍做了6-7年的积累,我刚开始一直打击他,你跟政府做很多事赚不到钱,你跟政府收多收少都不合适,你们跟人工智能有关的发展上有没有一个规划,还是希望跟这些公司合作在人工智能方面的发展?
郭为:今年发生了一个比较大的并购案,就是因特尔收购了Mobileye,Mobileye是以色列的一家公司,做汽车驾驶辅助的,Mobileye在1000万辆传统的汽车上装载了数据采集的东西,每天收集的数据量差不多相当于现在3000亿个个人生成的数据量,由于有这些数据将会支撑因特尔未来在超算上,在大数据领域的发展。神州数码整个大的体系就是想利用我们在传统行业的优势去挖掘,刚才讲深网数据,少春是再ERP的公司,ERP的数据是不可以在互联网上直接进行传输的,它是深度应用的数据。今天BAT很大的优势就是在互联网上已经完全垄断了数据。客观讲只要他们不犯错误的话,别人是没有机会的。当然企业犯错误是必然的,只是说在哪些方面不犯错误。Pony在布局的时候老讲那块不能缺,人工智能原来没有,去年开始布局,对未来的看法一旦哪个地方出现空位的时候,其他的就出来了,比如Mobileye十几年在数据上的积累,一下子就被大家认可了他在辅助驾驶上的能力。我们在农业、医疗、制造业,我们给工商总局做广告登记的服务,那也就是全中国所有的商标注册登记,我们掌握了全中国所有的商标注册的公司,你的企业究竟哪个商标用得最多,哪个商标价值最大,我们完全可以通过数据分析的办法来做,这里面蕴藏了大量的商业价值。这些东西怎么做?我觉得就是要和现在成功的,或者说在人工智能上走在前面的公司去做,发挥我们的优势深网数据挖掘,然后脱敏,打上标签,然后和别人合作把这个东西做好。这个就是我们要做的。今天我去跟BAT在互联网竞争,那我是找死,那是完全不可能的事情,那真是活腻了。