为什么企业应该关注数据的广度,而不是数量

大数据

在这个大数据时代,很多对待数据收集的态度是:试图捕捉所有数据。跨平台市场营销分析专家SumAll公司首席执行官Dane Atkinson表示,对于数据,大多数企业应该考虑数据的广度,而不是数量。

数据的真正价值来自于不同数据集的交织,” Atkinson表示,“只有当你关联不同数据集时,你才会有所发现。”

为了说明这个道理,Atkinson提到了海洋及其潮汐。为了明白潮汐与海洋的关系,你需要了解海洋与月亮之间的关联。

当你的数据具有足够的广度(例如足够不同的数据源),你不一定需要大量数据来提供有效的结果。例如,SumAll.org是使用数据用于社会公益的非营利性组织,SumAll正在帮助纽约和非营利组织CAMBA解决无家可归的流浪汉的问题。

驱逐通知是让一个家庭变得无家可归的主要因素之一,不过,并非所有驱逐通知都会导致无家可归。每年在纽约约20万户家庭被驱逐,在大数据角度来看,这并不是非常大的数据。但这里的挑战是,如何确定这20万户家庭中哪些家庭最有可能因为驱逐而无家可归。

在SumAll介入之前,CAMBA每个月会手动整理Kings County住屋法院约5000个新的驱逐案件,并向他们服务区域的家庭发送信件—每月约400。在SumAll以及某些针对性技术的帮助下,CAMBA可以显著缩小这个数据。

首先,地理编码所有案件来确定哪些属于CAMBA的范围。然后,从不同数据集获取表明一个家庭存在“风险”的数据—过去的住房情况、教育程度、就业状况和年龄等。通过关联这些不同数据集,SumAll能够帮助CAMBA确定30到50个最高风险的家庭。这让CAMBA可以更有效利用其资源来帮助这些家庭。

最终的结果是,CAMBA能够为50%更多的家庭提供驱逐预防服务。

事实上,专注于数据数量而不是数据广度让你更难以利用你的数据,收集所有你产生的数据会阻碍你使用这些数据。

“在无止尽的数据收集中存在很多固有的问题,”他表示,“我们大部分的合作伙伴都有大量数据,但他们无法利用这些数据,因为它们已经成为太大的问题。”

首席信息官[注]发现他们处于这种情况是因为他们往往是技术为导向。他们想要构建数据基础设施,让业务部可以提出任何问题,并得到解答。但这种做法太“好高骛远”,与此同时,首席营销官等会绕过首席信息官来访问他们需要的工具。

CIO不仅要是技术专家,而且是使用数据推动业务的推动者,”Atkinson表示,“我们如何为客户挖掘数据价值。”

答案是,不要从大数据来思考问题,应该从业务问题的角度来思考。从你能想到的最小问题开始,确定你可以如何利用大数据来让事情变得更好。

“我们真正能够响应的简单问题是什么?”他说道,“知道什么时候客户会流失?为此建立一个基础设施。为这些数据构建管道,并规划企业的数据流。”

via:网界网