从小数据分析到大数据平台，大数据开源技术是如何演进的？_大数据_计算头条_中国计算网——工业互联网一站式服务平台—

现在我要给大家介绍一下未来的发展趋势，在未来几年当中将会出现的一些技术。

我觉得开源大数据项目几乎已经达到了饱和点，可能是大数据当中一旦出现一个问题，大概就会同时出现五个解决这个问题的项目，索引很多问题都可以被快速的解决。

在最近几年中很多人都特别地注重流计算，流计算已经变得越来越流行了，在过去几年当中我们也看到很多人注意到内存计算，因为内存变得越来越便宜，在很多的系统当中内存计算可能会成为大数据处理方面的一个标配。

现在这些大数据的技术还是比较新的技术，还需要一些时间才会出现共同的标准。但是我觉得在不久的将来，我们很快就会出现大数据方面通用的标准。

我不相信有单一的一种技术会解决所有的问题，我觉得有很多不同的数据就需要有很复杂的大数据库来处理。但是我觉得未来的开源大数据的堆栈包括以下几个部分，其中必须要有一个处理单元，要有一个储存单元，当然肯定要有查询单元，没有查询单元就没有快速的目标的实现了。

在数据提交方面，Kafka已经达到了这个标准，对于流处理方面Spark已经成为了标准的工具，我觉得Druid查询方面也做得很好。

所以基础设施的架构也会不断成熟，不断地改善。在我们的架构不断变得稳定之后，会出现很多的应用，我们现在已经看到一些可视化的工具，以及虚拟现实的工具已经应用到了开源数据。