几周前,当费埃哲(FICO)首席执行官William Lansing参加斯坦福大学有关大数据会议的时候,他发现,业界关于大数据的热烈讨论已经从三个“V”增加到四个“V”,即Volume(数据量)、Variety(数据类型)、Velocity(处理速度)以及Value(数据价值)。而第四个“V”正意味着业界开始关注数据洞察,强调如何获取大数据的价值。“挖潜数据价值正是FICO成立50余年来一直专注的事。我们的核心业务就是分析各种数据,并做出智能的决策。”Lansing表示,“FICO的市值也在近一年来连续攀升,如今已经达到15亿美元。”
1956年,斯坦福大学的几名数学专家创立了FICO,公司当时的愿景就是希望利用数据分析预测风险变量,从而帮助银行控制信用贷款的规模。如今,FICO的分析技术正保护着全球2/3的信用卡业务,仅在美国就帮助各类机构实现高达100亿美元的审批贷款决策,可见其数据分析与预测技术的功底。“对我们而言,大数据也是大机会。”Lansing近日来到中国,并与本报记者分享了他对大数据的观点。
数据分层的价值
的确,如今大数据是个热门话题,但关于大数据的讨论多数还是围绕基础架构层面展开,比如Hadoop等技术。这些讨论多集中在数据存储、数据处理以及实时管理等方面。Lansing透露,即使是在硅谷,很多新兴企业也都是专注在大数据基础架构领域,比如Cloudera,它能够为开源技术提供商业软件级别支持,在大数据领域,就如红帽支持Linux一样,Cloudera 也在支持 Hadoop,议题多围绕在开发技术如何让大数据更易于读取和存储。然而,围绕大数据分析的话题还远远不够。大家都在讨论如何存储、捕捉大数据,但却很少提及客户究竟可以用这些大数据做什么。
其实,无论哪种类型的企业最关心的就是价值,这意味着,企业需要找出大数据中最相关的变量,然后基于这些变量数据进行建模,并基于模型做出更好的决策。这正是FICO的专长:如果数据处理能力无限,我们能不能基于所有数据做出更好的决策?我们能够为这些额外增加的数据量花费多少资金和精力?这些额外的数据对决策是否重要?处理所有数据的投入产出比如何?这样做是否会影响决策速度甚至是准确度?
这一系列问题的核心就是,数据生来就是不等价的。这至少意味着三个关键点:一、总有一些数据是更重要的数据,应该首先去关注这些更重要的数据,并基于这些重要的数据去进行分析和预测;二、数据的重要性有一个顺序,一些数据是我们要优先采用的数据,一些可以作为分析预测的依据;三、与所有的数据源相同,大数据也难免掺杂着虚假的线索、噪音和干扰,这是数据清洗的问题。所以,我们必须要非常智能地来使用这些数据。
Lansing认为:“数据处理是有范围的,我们会关注某些数据的范围,基于这些数据的范围来做出决策,找出那些更为实用的数据。因此,今天我们还是需要更关注于那些有实用价值的数据,这样的数据更多的是结构化数据。”
举例来说,银行机构需要通过所有数据了解他们的客户。这些大数据可能包括很多非结构化的数据,比如文本数据、图像数据,甚至是Facebook上面的数据。如果有一个银行的客户经常喝醉酒,我们是否可以根据他醉酒的频率来进行预测并确定他的信用评分呢?显然,这些数据可能有一定的额外价值,但并非是最实用的数据,而且我们还需要考虑在这些额外的琐碎数据上花费如此多的精力是否值得。如今,无论是美国还是中国的银行机构,都更关注实用的数据,并且采用那些被经验认为具有预测性的数据去进行分析。这些数据可能不见得是大数据中的非结构性数据,但是银行认为它们具有良好的预测性,可以进行分析。
分析方式的改变
大数据时代另一个值得关注的“V”就是Velocity(处理速度),这意味着在大数据的处理方面,不能简单应用传统的数据挖掘技术,数据分析的方式正在发生改变。Lansing也认为,大数据时代同样重要的是速度和效率的提升,客户正从“分批决策”过渡到“即时决策”。
事实上,数据分析大体有两种模型,一种是基于假设的模型,比如说我们要关注那些高价值的数据,关注相关领域的数据,关注那些能够提升效率的数据。
FICO在数据流特征分析领域不断推动创新,尤其是在欺诈防范这一领域。 其反欺诈解决方案模型依靠交易特征,概括了数据在交易过程中的特征,以便计算相关的欺诈特点的变量,而不依赖由此生成的既有数据。
另一种模型就是一种非基于假设的模型。因为,由大数据带来的变化是分析时必须减少对于固有数据的依赖,分析模型将能够根据数据流中的动态数据自我调整。为了应对不断增加的数据流中的动态数据,就需要集中研发自我学习的技术,包括自适应分析和自我矫正分析技术。Lansing相信,这些关键技术将弥补传统方式的不足,甚至将可能在某些领域取代传统的模式。
据悉,现在就已经有一些新兴银行在利用FICO的这种自学习分析方式进行小额贷款。这些贷款并不按照传统的贷款审批模式,而是针对次贷或一些特定的人群随机发放小额贷款。由于采用系统学习的模型方法,小额贷款出现坏账后,相关信息将自动输入系统,以供系统学习,然后再发放更多的贷款,并不断重复进行这个自我学习的过程。
这一做法只是在一个很窄的人群范围内采用,事实上很多大型银行接受这种方式也需要相当长的时间。但是不可否认,这种小额贷款方式可以逐渐补充原有的信贷方式,更好地为客户提供服务。
个性与共性
数据分析和预测的技术有没有可延展性,即能不能从银行业拓展到其他领域呢?实际上FICO对于客户行为的了解,不仅仅局限于银行业,还包括保险业和零售业,这是因为客户行为从数据分析角度看具有共性。
Lansing表示:“比如,在保险行业当中的欺诈行为和银行当中的信用卡欺诈的行为是非常相似的。在营销解决方案方面,很多零售业的用户行为和银行业的用户行为也是非常相似的。同样我们在金融行业的客户管理经验,也可以应用到零售行业。”
FICO擅长于分析一些复杂、困难的问题,而公司声誉也正是基于在金融行业里的优秀表现所建立起来的。因此,FICO除了开展信用评价为核心的业务之外,还开展了应用软件业务,帮助全球金融机构提供诸如巴塞尔合规咨询、账户管理系统、反欺诈系统、催收与资产保全系统、信用评分模型和技术等多方面的产品和服务,为非金融机构提供基于数据分析的市场营销解决方案等,并扩展到利用分析工具帮助客户解决任何分析业务方面。
比如在大数据方面,可以基于零售分析提出营销解决方案。如今,零售市场被细分为很多区域化市场,逐渐走向精细化,某一企业可能会专门针对某一个具体的市场,针对某一特定人群发送电子邮件、短信甚至明信片,来进行个性化的营销活动。因此,整个零售市场的主要特点就是个性化和活动管理。
例如,一个客户每六个星期都会到某超市购买某种牌子的洗涤剂,这样这位客户下次再来的时候,就是超市为他提供洗涤剂营销和服务的最好时机。
Lansing认为,利用数据分析,实现一个单一的细分市场,应该是营销的未来发展趋势,而对于银行业来说,一对一的营销能力同样被看重。为此,今年5月FICO还收购了Entiera公司,更好地支持FICO为银行和零售行业客户提供一对一营销的解决方案。据悉,Entiera公司独特的客户对话管理解决方案可以帮助企业在SaaS环境中生成、监控和分析营销解决方案,还可以存储非结构化的数据,让营销方案和决策更便于操作。