通信研究院张俊霞:大数据重点技术知识产权发展态势

从非关系型数据库专利申请体现出的一些发展趋势我们也看到,实际上关系型数据库和非关系型数据库呈现出一个融合发展的趋势。这个融合主要体现在两个途径上,第一个途径实际上就是关系型数据库和非关系型数据库的互相支持,取长补短。另外一个融合的方法就是对于这种数据结构非常复杂,数据量非常大的情况下,可能大家更趋向于采用这种联合部署的一些方案。提到非关系型数据库,我觉得在这个里面比较有特色,有代表性的一种非关系型数据库就是文档数据库。在文档数据库里面,专利申请的布局量也是很有意思的。几乎90%的专利都是在华申请,像美国、欧洲、日韩一共占到全球的11%。在咱们国内这一块,主要申请人包括奇虎、长虹、浪潮这些企业,从这个专利体现出的一些特点,主要就是基于Web同步这一块。我们也跟踪了一些文档数据库他们在哪个开源许可协议上发布,发现Apache2.0,还有GPLV3受到大家的追捧,很多项目都是基于这两个许可协议发布的。

分布式计算已经发展了十几年,是一个老的概念,这个申请量还可以,大概全球有400多件专利,中国和美国基本上是各半的情况。从这个增长趋势上,也是从2010年开始,比国内早了两年,从2010年开始基本上大家就同步了。从2013年、2014年国内的申请量略高。主要申请人我就不再念了,也没有什么特别的。

从专利申请的一些技术发展的方向我们看到,在这里面大家比较关注的就是任务调度,从任务调度这一块,专利申请可能更多的是在美国申请,美国一个国家就受理了全球53%的量。从申请人上来看,我们看到中美两地申请人的差异还是很大的,咱们国内这一块主要就是高校、研究机构,国内可能是企业会多一点。

内存计算,这一块总量我也不念了。在内存计算实际上大家可能会关注的就是多极的一个存储体系,主要的申请人就是这些企业,而且看到内存计算主要受到大家追捧的像Spark、Tackyon这两个项目,都是采用Apache2.0这样一个软件协议下进行发布的。

还有一个流式计算,相比于批量计算专利量是非常少的,还有比较大的创新空间。我们也看到,关于像MapReduce这一块,中美两国差不多。但是对于一些流式计算等等,中国和美国相比,这个实力相比来讲差异还是很大的。从流式计算申请的主要方向包括数据传输类、架构类以及高可用类。从应用领域,实际上包括金融领域、互联网领域和物联网领域。

MPP这一块我简单说一下,传统的MPP在2013年的时候创新已经降低了,这一块随着MPP和分布式系统融合,实际上有一些融合技术又使这一块的专利申请量出现了一个小的高峰。从这个申请人上来看,这个技术垄断局面还是很明显的,这5家公司他们的专利申请量占到了全球的一半。这是主要一些申请的方向,刚才我们也讲了,MPP实际上也和分布式系统进行一个融合,这个里面可能也包括一些演进的路线,比如说SQL on Hadoop里面,像华为,还有刚才演讲的星环科技,他们都是主要的申请人。另外还有一个技术路线就是Shared everything,还有联合部署。