Hadoop开源启示录

迈克:中国大数据有非常好的未来,清华这边也在做很多和大数据相关的事情,大数据在全球的发展已经非常成功,在中国经济方面、社会方面都会涌现非常多的机会。

道克:是的,中国一定会有很多的机会,而且中国的技术也已经很先进了,更重要的是现在开源社区给了我们更多的机会去参与学习。

12、大数据技术的未来又是什么样的?

道克:这个非常难预测,现在不太可能会知道,如果要知道我就去做了。我认为更可能知道的是在座的各位,如果大家有什么样非常好的想法,可以去积极尝试。

迈克:在中国,小米正在使用Kudu,而Spark社区现在也变得越来越热,这个情况在五年前我们都是见不到的。所以现在开源社区给我们一个非常好的环境和生态系统,像Hadoop这样,可以帮助大家更好的去发展更多新的技术。

王建民:我们能够看到的是,大数据系统对于中国的很多用户来讲,非常难使用,已有的开源技术并不能被很好的利用起来。在我们实验室现在就有这样一个项目,可以帮助大家更简化的使用今天Hadoop的系统,是一种用机器学习的方法更多去完成自动化的参数、自动化的控制,我们正在做更多的努力。

迈克:这个方向很好,机器学习一定是未来的趋势,我们应该思考怎么在更多方面结合这项技术。

注:本稿件摘自数据观入驻自媒体—数据派