人类正处于历史转折点,大数据将改变人类的决策方式。作为对未来数据与决策之间关系的独立思考,国内第一本关于Analytics的中文专著——《证析》日前由华夏出版社正式出版,即将正式发售。
“证析”是作者郑毅对英文单词“analytics”新译,由于“analytics”在汉语中没有统一的译名,也经常被直接翻译成“分析”。“证析”这一表述更能贴切说明“analytics”的方式和价值。证,是证据的证,这个证据更多强调的是定量的证据, 也就是数据;析,仍然是分析的析,“析万物之理”,分析数据以产生新的洞察,据此影响决策,从而提升绩效。
“证析”的目的是使用数学手段、利用客观证据影响业务决策,在实践过程中它可能会涉及企业管理、数学与统计学、计算机科学与技术等诸多领域的知识与技能。郑毅结合自己数据挖掘领域多年的经验,通过大量的案例和应用举例指出:证析,是对量化证据进行分析以影响决策的实践科学。当前,伴随着云计算技术的发展和商业的推广使得分析师的技术门槛和费用门槛迅速降低,也将带来整个证析的生态系统的转变,一种新的证析商业生态系统的出现开始渐露端倪。反过来,证析的应用将促进云计算的发展,提升了云计算平台的价值,促进其发展。两者共同作用、相互促进的结果是使得人类在决策时更加有据可依,从而改善人们的决策,进而改善人类的生活。
正如宽带资本董事长田溯宁先生在本书推荐序中所说的:“我们对大规模的各种数据进行‘冶炼’,从数据中发现关联,发现知识,成为我们对未来判断决策的依据。它的数据基础在于企业、社会的大量积累,它的计算方法则是这些年运用、实践的各种算法,尤其是互联网企业的算法与软件模型,此书都有详细的描述。”对大数据背后蕴涵的意义和价值,进行了深度的解析。据悉,在5月23-35日举行的第四届中国云计算大会 · 云基地专场期间,《证析》作者郑毅将在云基地现场签名售书。
附:
序. 探索知识新边疆
中国宽带资本基金董事长 田溯宁 博士
拿到郑毅这本《证析》,便爱不释手,一气呵成的读了下来。一方面因为他的观点正是我所想证实与了解的,同时也为他证据充分、文采飞扬的内容所感动。
前一段到英国参加万事达董事会,参观战争博物馆时,看到海军大臣的丘吉尔在1912年1 月的一张关于英国舰队未来的动力是用本土的煤还是新科技进口的石油为原料的便条。丘吉尔力排众议,有远见的确定石油为动力。这个决策使英国海上力量又称霸了几十年。当时我在想,如果今天的海洋是数据信息,那什么是征服这个数据海洋的“油动力”?
人类文明的历史也是知识发现、地域边疆拓展的历史。科技创新在地域疆土的扩张过程中扮演着重要的角色。从西班牙人的三桅船,到英国的蒸汽机动力,地理的扩张随之带来财富的积累,生活质量的提高。人们的世界观也因此发生巨大的变化。大航海使我们知道地球是圆的,天文望远镜、显微镜的发明及一系列理论的创新,使我们认识到了宇宙与微生物,前者使人类感到自己的渺小与“仅有一个地球”的珍贵,后者让我们发现的抗菌素等医药使我们的生命质量得以提高。
二十世纪,尤其是二战之后,野蛮殖民,依靠征疆拓土的方式获得财富早已发生变化。五十年代的计算机技术,使人类对数据、信息的存储、处理与理解发生了质的飞跃。从IBM主机的产生,到七十年代个人计算机的出现,社会、企业、个人的生活已经离不开“计算”技术,正如同工业的革命“动力”使人们的体力得以扩张,“计算机”使人们“智力”得以提高。但我们所有过去的“计算”构架,基本上是处理、存储“结构化”的数据(某人、某时完成了某一事件)。这种结构型数据为提高企业的效率起到革命性的作用。同时历史上,这些结构数据的大量积累、沉淀,如同远古的矿藏能源一样,存储了大量的“数据原矿”。
九十年代之后,互联网的出现,数据的产生与积累又如火山爆发般的扩大,而文字数据开始变为图片、视频、互动、三维等更大量的形态各异的数据,这些数据的特征是“非结构”,它与事件、社会情绪、天气等诸多不可预测的因素有关。“结构数据”很像牛顿力学,而互联网“非结构数据”则像量子力学。从生物学角度来看,“结构数据”很像人的理性左脑,而“非结构数据”则如同控制我们情绪的右脑。而对世界需的认识要对两种数据的分析。近十年来,计算领域正向从对数据的交易、记录到对数据的分析、比较、提炼、再分析以产生正确认识的过程发展。这个领域正是“证析”。正如此,“大数据”成为近两年计算、投资领域最热门的话题。迅速发展的“云计算”,则为“大数据”提供了规模、便宜的计算平台。
对“大数据”分析意义重大。如果个人的智慧以智商为衡量标准,“大数据”的理解与运用是关于企业的“智商”,它的目的是提高企业的决策质量。它的技术基础是通过各种统计、算法,加上前所未有的“云计算”能力。我们对大规模的各种数据进行“冶炼”,从数据中发现关联,发现知识,成为我们对未来判断决策的依据。它的数据基础在于企业、社会的大量积累,它的计算方法则是这些年运用、实践的各种算法,尤其是互联网企业的算法与软件模型,此书都有详细的描述。“大数据”在中国的研究与实践对现代化进程有着重大意义。
这个领域在理论与实践均是刚刚起步。如果我们下大力气,从实践到理论,从理论到实践来抓起,有可能在此领域参与、推动甚至领导世界上此行业的发展。我相信数十年后,人类对数据-信息-知识过程的创新,会如同蒸汽机、计算机的诞生一样将是一个重大领域的创新。对建设创新性国家的中国无疑是历史性的机遇。其次,中国现代化中城市化的很多问题,如交通、教育、医疗、社会管理等用传统的方法走不通,或者成本太高,而基于数据的证析可能是解决此类问题的选择。最后,这个领域的发展孕育着巨大的产业机会,随着人类对数据的依赖性不断增加,我们每个人生下来的数据(生理与心理数据)均会被记录下来,我们将有一个“数据银行”,因此,数据加工业,数据工厂等新产业形式将层出不穷。它将带来几十万、上百万新型软件工程师、数据分析师等新的工作与就业机会,中国应有可能在过去几十年成为世界工厂后,在未来几十年成为世界的“数据工厂”。
郑毅写这本书的经历是值得尊敬的历程。他曾服务于多家公司。在公司的商业环境不具备合适的研究条件的情况下,他肯于为自己喜欢的证析领域研究付出巨大代价创造条件,长期潜心学习、理解、著学立说。这样的精神在当今商品化、短视与功利化的氛围中尤显可贵。他大量广泛的阅读,认真严谨的索引,并且把技术放在人文、社会的背景下阐述,此书可起到范例作用。多少也印证了他的名字“明心正义”,“士不可以不弘毅”的中国优秀治学传统与理想主义精神。此书不足之处,是对“云计算”与“大数据”这对孪生姐妹的关系剖析未能深入,我期待他下一部书在这方面进一步的探索。