人的本性认为更具体的东西更准确,如下午3:12比下午某个时间更准确。
但事实正好相反。在许多情况下,更精确的预测不太可能是准确的。例如,一个客户买了一台特定配置的笔记本电脑,而过去购买该配置笔记本电脑的唯一的客户,还买了一双粉红色的高跟鞋。
“热门粉红色高跟鞋的推荐可能很具体,但可能太具体,导致很高的误差,”位于加利福尼亚州圣莫尼卡的营销公司Retention Science首席执行官Jerry Jao说。
所以,通常看起来漂亮的东西,实际上可能无助于业务和营销管理。
误区7:大数据等同于Hadoop
Hadoop,针对非结构化数据的一个流行的开源架构,最近已经得到了很多关注。但企业还有其他的选择。
“有整个的NoSQL运动,”SAP大数据总经理兼高级副总裁Irfan Khan说。“有MongoDB,Cassandra等其他完整的技术。”
其中有些技术可能更适合特定的大数据项目。尤其是Hadoop的工作原理是将数据划分成多个块并行处理。此方法适用于许多大数据的问题,但不是所有的问题。
“虽然YARN和Hadoop 2解决了一些问题,但有时你需要处理的方式,Hadoop不是理想的选择,”大数据咨询公司LucidWorks首席技术官Grant Ingersoll说,“人们需要保持冷静的头脑,并决定什么是最适合自己的,而追随时尚。”
误区8:最终用户不需要直接访问大数据
大数据往往太过复杂,以至于需要专门的员工来处理。但是,这并不一定如此。
举个例子来说,由重症监护病房中的设备所产生的全部数据。心脏速率,呼吸数据,心电图读数。虽然,很多时候,医生和护士就只能看到病人的当前读数。
“我看不到在10分钟前的情况,也不能绘制未来一个小时之内的趋向线,”飞利浦医疗保健患者护理和临床信息首席营销官Anthony Jones表示。
但能够看到病人的历史数据对于一个医生做决定非常有价值。“这些家伙有一个核心的数据科学团队,他们缺少一个巨大的机会,”Jones说。
现在的问题是让所有不同的设备生成的数据能够交互,即使它们并非为此设计,并使用不同的平台、操作系统和编程语言。一旦你这样做,医生和护士能够在需要的时候得到一个有用的数据表单。
误区9:大问题才用到大数据
一家大银行的首席信息官最近发表了关于大数据的谈话,并被询问关于最终用户自助服务的问题。
“这位首席信息官说,"我不相信",”Birst首席执行官Peters回忆说。
这是一个共同的态度,他说,一些高管认为大数据只回答了某些类型的问题。这种态度可以这样概括:“我们的大数据目标是解决极少的高价值的问题,通过核心的数据科学家团队。我们不希望数据混乱,让普通人有机会访问这些信息,因为我们不认为他们需要它。”
Peters不同意这种观点,但表示这常见于很多行业。“这是大型保险(放心保)公司里面猖獗的神话,但业务用户都没有足够的智慧处理它。”
误区10:大数据泡沫终将破灭
炒作周期可能来回反复,但技术始终坚持变革。互联网泡沫的破灭,并非互联网终结的信号。
即使在炒作平静下来,公司仍将有大数据需要处理。事实上,由于呈指数增长,他们将有预计比以往任何时候更多的大数据处理 - IDC预计,直到2020年,累计收集的数据数量,每两年将增加一倍。
并且它不只是公司目前收集的东西。相反,新的数据类型可能还会出现,需要大量的存储。
宾夕法尼亚州互动营销公司Cadient集团首席技术官Bryan Hill表示,认为“大数据”只是一个阶段,企业可能错过机会捕捉到可能对他们的业务产生影响的数据元素。
“所谓"大数据"很可能会改变,就像云计算和以前的web其实没有什么不同,”他说,“这个词可能会改变,但大数据的精神会在里面留下来。”