大数据+机器学习:微软重夺霸主地位的希望

机器学习(Machine Learning)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。不久前,《纽约时报》报道了微软将机器学习应用于新业务。Lightspeed(光速创投)美国投资总监Jeremy Liew也介绍了“大数据加机器学习”重塑银行信贷业的例子。
应用机器学习技术,软件和服务都是盈利点

在下一个Office版本中,Excel将可以合并处理大量的数据。比如,能够扫描1200万条Twitter消息,然后生成一个图表,告诉你哪一个奥斯卡提名者被人们谈论得最多。Outlook新版本添加的功能可以评估用户的电邮阅读习惯,判断哪些邮件是用户想去阅读的。微软的机器学习软件将能够对公司电脑系统进行抓取,就像必应搜索引擎抓取互联网上的网页和链接一样。

来自传感器、连接的设备和云计算中心的数据大爆发造就了大数据产业。计算机要从每天生成的海量中找到规律和模式。长期来看,微软希望能够将更多的机器学习技术运用到它的云计算平台Azure中去,比如租赁数据源和算法让企业设计自己的数据预测引擎。微软最终可以通过软件服务收费,而不是仅仅销售软件。

微软有一些创业公司所没有的东西:巨大的资金储备——上一季度末的财报显示,现金和短期投资一项为670亿美元——同时有能力在一个大项目上投入十年、甚至二十年的时间。Gartner的资深研究员David Smith说,“微软的资源太多了,Windows、IE浏览器、Skype、必应搜索等等,他们能做许多事。数据分析将会是他们的下一个大生意。”

碎片化关联,“另类信贷”模式显现

一些初创公司用海量数据挖掘和算法来做一些贷款业务。

Wonga就是一家刚刚兴起的替代贷款的初创公司。投资机构Accel的Sonali De Rycker是Wonga的董事会成员,他介绍说:“他们大量的使用了社交媒体和其他的网络工具,但这些都是绝对想不到的。而这正是他们的奇迹所在。”

问题的关键在于算法,它怎么把你的邮政编码,你的车的颜色,你的按揭是多少,它怎么能将你这些碎片化的东西关联起来。 这些都是Wonga对于它过去客户的各种碎片化信息的数据堆积和整理,这非常关键。在Accel在2009年进入Wonga董事会的时候,Wonga已经 有了10万个贷款案例。这10万条数据信息不断集成和归类变成了一个日益增加的信息网络。其中每个贷款人都拥有6000到8000条数据。

“你用大量的数据串成了一个故事。我们愿意为这些数据付费,因为我们需要它。我们可以通过上千种组合来判断做某件事是对的,还是错的。”

伴随大量的数据来源和强大的大数据分析工具,这也意味着它可以比其他发薪日贷款机构可以以更低的利率贷款。机器学习的依据就是不良贷款,所以失败的次数越多,你交的学费越多,同样的你的模型就会越完善。

大数据时代有了更多复杂的商业模式,但目前只是表面。在接下来的几年里在这个领域里将会看到更多的创新点。