大数据可视化需要避免的三大误区

大数据

最近,很多企业都在谈数据可视化,其受关注的程度不次于大数据。数据可视化是正确理解数据信息的最好方法,甚至是唯一方式。出色的可视化产品可以让用户对自己目前关注的事情一目了然,并可以快速给出建议,随时随地分享。在大数据时代,如果你的数据展示方法不对,可能会破坏数据可视化效果。

误区一:显示所有的数据

尽管我们多次被告诫,大多数人并不关心你对多少数据做了多少量化指标的处理,他们不在乎你每天可以处理多少数据,或您的Hadoop集群有多大。用户想要的是具体的或者相关的答案,并且他们希望越早得到越好。但是有些数据可视化工具,还是会把无关的数据显示在页面上,目的是希望接近企业所需,但事实上造成了用户很难找到有价值的信息。

现在仪表板应用非常流行,其指导思想是可以“显示所有状态的数据。大多数性能是枯燥的数据展示,而多异化功能则被隐藏。其实,好的仪表板数据展示,是把重要数据做了了趣味化的展示处理。让用户做一个有效排序,哪些是优先处理,哪些需要延后处理。数据可视化可以达到仪表盘达不到的能力,可以更好地处理数据报告。

误区二:显示错误的数据

显示错误的数据和显示所有的数据同样存在隐性危机。在数据可视化操作中,显示的信息子集与数据是相关的关系。比如你关心销售数据,您可能也关心每个地区或者个别销售人员的销售数据,考虑通过数据做出决策。把几个关联性很强的图表进行折中处理,选择一个图片来展示,这实际上需要一个复杂的数据可视化能力来完成,而且相关几个图片的数据必须做到干净、清晰。

误区三:美化数据展示结果

即使你采用干净的数据绘制图表,你仍然会弄错。因为特殊化的表格类型展示很少见,绝大多数的可视化需求都是用来满足线形图、饼图等基本图形。

要想美化数据展示,在处理关键数据字与段之间的关系时,就应该考虑把指定字段加在坐标轴上。按照组别、类别、数据时间、数据量级以及重要性进行划分,尤其是颜色类别一定要有,并且可以自定义亮度和饱和度,确保在使用本标签或者其他标签的时候做到准确无误。

为了避免失误,最好的方法是专注于你的目标。在可视化应用之前就应该考虑:我们关心什么?需要做什么?要解决什么问题?要看到怎样的数据?以怎样的结构和关系来展示?要突出哪些数据?当你能够回答这些问题时,你就可以进行数据可视化的设计或者应用了。

via:chinabyte

36大数据

更多详细信息,请您微信关注“计算网”公众号: