企业管理的挑战:非结构化数据分析

确定“主动谈话人”要知道其用户名、登录名和其他与具体职员有关的ID。如果在现实中这些信息都来自同一个人,获取5个不同人的数据没有用。第二,你必须能理解你分析的话题。要成功分析必须使内容结构化。第三,你的客户是谁?你是否使用了正确的词条获取与该客户有关的所有信息?您必须确保能获得每个部门、缩写和控股公司的所有参考资料。如苏格兰皇家银行和国民西敏寺银行?英国天空广播、天空或新闻集团?

然后将这个完整的结构化框架与从你选择群组中大量不同对话收集的非结构化信息结合。可能出现这种情况:销售额最大的公司也是该公司员工谈论最多的公司,在这种情况下,内部沟通是良性的。但同样,人们谈论最多的客户并不能带来足够的收入,在这种情况下,你就能发现销售流程中导致低效率的关键。

目前很多厂商将非结构化数据作为单独的技术挑战对待。但只有在确定了相关的重要结构化信息时,才能理解非结构化数据。如果一个职员是负责某个特定话题95%的沟通,无疑将使他或她成为这个问题的核心信息中心。但如果这个模式不能找出证明各种不同的登录信息和身份信息属于同一个人的基础结构化信息,你可能无法看到这个事实。

如果数据等同于噪音,就不可能准确做出决策。因此,我们应如何使用非结构化数据为超市设计最好的布局?零售公司、主题公园甚至警察部门使用的是群体分析,预测人群在某些情况下可能的反应。在超市中,分析视频确定购物者狂商店的路线,记录他们在哪停过,什么地方将商品放入篮子,在遇到人多或死角时如何应对。

然后将非结构化信息与结构化数据结合--例如,某些商品在货架上的位置或收银台--制作一个购买者行为的完整数据驱动图。一旦这个信息就位,就可能根据各种不同情况对未来销售进行预测。是否将山羊奶酪换个位置,买酒的人会更多?如果将更便宜的啤酒移到通道后面,人们会购买更多高价啤酒吗?如果面包房附近出现拥堵,超市会出售更多的面包吗?

使用这种结构化和非结构化数据组合,可以找到这些问题的答案,而这些问题又是成功预测分析的基础。但只有建立完整的可用数据图,才能做出准确的决策。