从《芈月传》看大数据真谛

芈月传

“大王,霸星出世,四辅变,六甲乱,主天下大变……”太史令唐昧一席话让楚威王鸡血满怀,仿佛霸业所成,指日可待。呵呵哒地喊着我要我要,于是,《芈月传》主角很快诞生了,但因为女儿身,霸星坎坷不断。这就是用古代占星的大数据手法,告诉观者:女主如今苦逼遭的罪,是为来日牛逼夺得魁,毕竟,天降将大任于斯人,必先劳其筋骨,饿其体肤……

其实,明眼人大都知道,所谓占星,一直是古代预测福祸的重要手段,官办钦天监的智慧担当们拿先人们的经验数据总结,用于现世,不断加入新的智识,传于后世,最后铸就了一套成熟的算法,被列入古代皇家仰赖的道统(若觉占星是没有任何科学的迷信,劳请点击关闭页面)。将其比作古代的大数据技艺实现,绝不为过。

只是,有了现代高速计算的基础,和丰沛的数据资源,当代大数据的算法更加明晰,也更有自然学科的理论支持,比那些总蒙着神秘学面纱的占星看上去更“科学”。但它们的基本方法和用途还是一脉相承——总结、分析过往、当下数据,由此预测未来——所以,小郝子借《芈月传》其中种种,说说大数据的真谛。

太史令的实诚,大数据的假象

剧情没有按照楚威王期望展开,小霸星是个女婴,结果老人家盛怒,急招“霸星论”的唐昧,结果唐昧实诚,只据星相言事,说:“阴阳相淆,杀气冲天……若为女子,福祸难料。”结果,被拖出去,剜去双眼,落得血淋淋、惨兮兮的结局……

实际上,更多操演大数据的人,没有唐昧那么傻,主上性格暴戾,自然会玩得玄虚些,知可言,言不尽,明哲保身要紧,若是他再鸡贼点,早点在已知的大数据流程中做些手脚,自然不会落得如此结局。

比如,当下有些大数据的操演者,更是七窍玲珑的心,了解领导偏好,针对地提供一些所谓大数据跑粗的结果,呈现“御前”,争宠取信——改一改大数据模型中的前端假设条件,再借各种理由清洗一些“刺头”数据,呈现给宗主的“料”,既讨喜,又不会把自己置于险境。反正数据就像人,放进“刑房”里“用刑”,总能获得你想要的结果,这就叫“数据拷问”。

正像二战时日本海军倾全力发动中途岛海战,根据所得数据做各种战前推演,结果,参谋将军们不断加入对己方有利的数据、条件,比如约克城号航母遭重创,不可能20多天内再出战,天气使日方更易隐秘行踪,中途岛防守薄弱,太平洋舰队未有察觉……结果沙盘推演显示,日方可获大胜,因此,方案很快取得大本营首肯,日海军倾力“奇袭”中途岛。

可事实上,美军不仅破译日方联络密码,更清晰其欲袭方向,且约克城号顺利参战,结果美方大胜,山本五十六担责,而那些依照“大数据”预演战事的参谋们全身而退,法不责众。

国家的运,自己的命,理性人的假设下,更多人选择后者,所以,诸位企业的当家人,遇到唐昧这样的大数据人才,请好好珍惜,就“娶”了吧,反而是那些天天赞歌不断、玄虚不实,切切当心,搞不好,他(她)就在为你“制造”大数据假象。

楚威王尽信数,大数据也作死

另一方面,不可不说,楚威王尽信数,之前一味认定唐昧的“霸星”说,之后,又相信占星大数据的“天象已显,非人力所能改……”不敢逆“天”而行,除掉可能的祸害。可怜的是,威王却失察于宫斗假设、王后心机,结果,因芈月告发,他得知其母宫外受苦,又被其苦肉计相逼,以致旧伤故疾并发,很快一命呜呼。

所以说,尽信数不如无数,大数据产生的论断,随着时间、环境的变化而变化,任何不智的忽视与不理,终究会作死自己。

如出一个膀胱的尿性,2008年金融危机的罪魁祸首CDS(CreditDefaultSwap,信用违约掉期),它就是金融机构在经济上升期,借大数据“做”出的一种金融衍生品。机构们有意将原本可能是“烂苹果”的资产切割,打包,扮作高大上的CDS“果盘”,结果,对手和各大评级公司用所谓数据模型验证,纷纷称赞这些“果盘”,惊为天人,给予优质评价、保险,在华尔街的欲望与贪婪下,它迅速成为宠儿,交投两旺。