那么什么是正确的答案?这里是一个对于“大数据”的解释,我相信,适用于任何人:
鉴于数据库技术无法扩大规模,已成为了业务逻辑的一种阻碍。这种逻辑使用效率不高的方法来访问和操纵数据。但这些低下的效率往往被硬件的增长速度和能力,以及存储的价格下降所掩盖。当然,这种低效直到2007年左右,都没有人真正注意或关心。
效率低下,最终纳入开放新的应用程序时,发现大量数据推断的重要成果(经常是分析的一种)的新的和实际用途。我们总是用传统的数据库系统的方法,不能扩大。大数据技术的建立是为了使应用程序可以扩大,但更重要的一点,其解决了过去30年来一直困扰我们的系统效率低下的问题。效率低下与尺寸或规模几乎没有关系,而是源于懒惰,我们更倾向于一拖再拖的不解决这些不愉快的细节,直到他们真正成为我们的麻烦。
从本质上讲,大数据工具解决的是大量数据的存储、访问、操纵和分析的方式。他们代替了传统数据库。至少,代替了存储系统(Hadoop),但他们也可以代替存取方法。