IT盲也毫无压力 大数据必知精粹合集

大数据:另类“V字仇杀队”

在这春节期间,大家都见证了全球最大的“人类迁移”车流、物流、人流,它们流淌的同时也是数据,是商机。而大数据,就是这样一种需要借助专有平台实现价值提炼帮助决策分析的海量数据集。鉴于大数据在云计算、移动、社交等多个发展趋势中都具有普遍性和重要性,本文将为广大读者介绍有关大数据的基本内容,以期帮助更多人了解大数据,并从中挖掘更多商机活跃市场。

另类“V字仇杀队”

谈到大数据,就自然而然会想到大数据的4V特点:Volume(数据量大)、Velocity(实时性强)、 Variety(种类多样)、Veracity(真实性)。另外,通常还大数据还具有Value(价值)的特点,这 也是人们纷纷关注大数据的主要驱动力之一。这里的“V字仇杀队”指的是大数据时代下价值的重新定义和挖掘,让数据价值充斥在社会的每个角落。

 

  IT盲也毫无压力 大数据必知精粹合集

 

大数据是多维的,而且极具复杂性。大数据带来的价值包括但不限于:数据的组织和管理,基础架构,决策支持和自动化界面和分析。随着社交数据、企业内容、交易与应用数据等新数据源的兴起,传统数据源的局限性被打破,企业愈发需要有效的信息治理以确保其真实性及安全性。

 

  IT盲也毫无压力 大数据必知精粹合集

 

大数据的四大要素及挑战

 

Volume

数据体量巨大。从TB级别,增长到PB级别。截至目前,人类生产的所有印刷材料的数据量是200PB(1PB=1024TB),而历史上全人类说过的所有的话的数据量大约是5EB(1EB=1024PB)。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。

Velocity

处理速度快,1秒定律。根据IDC的“数字宇宙”的报告,预计到2020年,全球数据使用量将达到35.2ZB。在如此海量的数据面前,处理数据的效率就是企业的生命。

Variety

数据类型繁多,络日志、视频、图片、地理位置信息等等。类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,这些多类型的数据对数据的处理能力提出了更高要求。

Veracity

只有真实而准确的数据才能让对数据的管控和治理真正有意义。

 

  IT盲也毫无压力 大数据必知精粹合集

 

大数据的4V特点(来源:f5)

 

Value

价值密度低。价值密度的高低与数据总量的大小成反比。如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。随着社交数据、企业内容、交易与应用数据等新数据源的兴起,传统数据源的局限性被打破,企业愈发需要有效的信息治理以确保其真实性及安全性。