如今,随着社会不断发展,技术不断进步,国内外各大金融机构已经在大数据、人工智能、区块链等新技术上有很多尝试,智能客服、智能投顾等新金融形式也早已不新鲜。那么,这些前沿新科技遇到严肃谨慎的金融业,究竟是“黑科技”般的存在,还是技术宅们的另一场狂欢呢?
以下是氪信联合创始人杨玢玢在《当金融遇上黑科技》线下主题沙龙活动的精彩分享:
大家好!我是氪信杨玢玢,负责氪信产品研发。氪信的全称是氪信信息技术有限公司(CreditX),最近刚刚完成了B轮融资。团队的核心人员均来自于雅虎、微软、携程、eBay、央行等世界知名公司和机构,在人工智能领域有超过10年的积累。
在氪信创立之初,我们主要思考这样一个问题:AI应用在金融领域里,如何能够在商业上有所突破?李开复老师也针对这个问题说过他的观点:想要有所突破,需要几个必要因素,一个是要有数据,毕竟AI归根究底还是数据的技术;另外要有处理数据的能力,其次还要有商业变现的场景。技术单独存在不能产生价值,一定要放在一个对技术有需求的场景里面。
我们认为,把AI技术应用于金融领域是一个突破点,而且金融本身是数据化非常完善的场景。同时,金融领域还具备以下几个要素:
第一,市场本身快速发展。在国内目前征信体系不是很完善的情况下,很多有金融需求的人得不到相应的金融服务。氪信通过对数据的搜集和加工,为符合要求的用户提供金融服务。
第二,数据端非常成熟。如今,大家花在手机上的时间特别多,互联网行为就是一个非常好的数据。关键在于如何把它和金融、信用相结合,怎么去拟合他们之间的关系。而这种信任评估是氪信比较擅长的。
从我们决定把AI的技术应用于金融风控,至今已有一年半的时间,在这段实践过程中,我们看到在技术层面、业务层面和战略层面都存在很多痛点,概括来说,就是业务本身对技术提出了需求。比如2016年蓬勃发展的小额现金贷业务,本身就是一个欺诈频发的行业,且没有强数据做支撑,因此,很多从业十几年的金融风控专家在面对新业务形态时,显得有些束手无策。
没有强数据不代表没有数据,事实上,企业还是能够拿到一些所谓的“弱数据”,比如手机上的数据,设备类的数据,或者一些消费类的数据。拿到数据之后去想怎么把这些数据用好,最后再决定要不要给这个人授信。至于授信多少,就需要用到AI技术了。
接下来分享一下氪信的做法和取得的成果。简单来讲风控分为两个部分:一个是反欺诈,一个是授信。
在实践过程中,我们发现区别于传统征信,互联网征信存在几个核心的点: 第一,在反欺诈的阶段,传统征信很难捕捉到一些不是很明显的、由于社交关系和其它关系对自己产生的潜在风险,例如一些团贷、群体欺诈的问题。但是这些问题通过挖掘网络数据价值就可以得到很好的解决。
第二,了解AI的人都清楚,我们在做数据加工的时候,主要还是做特征和建模。在加工的过程中,除了运用专家的方法之外,深度学习也被验证效果突出。建模阶段相比较传统的浅层模型,比如说逻辑回归等等模式,我们采用的是复杂的集成模型方式,因为不同维度的数据具有不同的特点,需要使用不同的建模方法,集成学习框架可以支持不同类型模型算法作为子模型,高效、准确的处理稀疏、超高维、非线性数据建模。
接下来我会分别讲一下我们公司的做法:
第一是底层,我们需要把能够拿到的数据定义为网络需要的关系,底层做一个数据的整合;第二层我们会到一些复杂的网络构建基础,里面有一些信息挖掘和算法;再往上我们会有一些模型,从网络里面拿到隐含的特征,去进行模型的构建;最终来识别比如说一些虚假的申请,或者是一些特殊地域的团贷等。
在网络的算法里面,我们的主要核心是复杂网络构建和团挖掘技术两块。首先在原始的点和边构建好以后,我们如何通过合理算法解决实际的问题,通过团的距离计算,达到比较良好的分团的结果。
另外一个是特征,这个也是非常关键的。我们如何从网络里面提取对一个人的欺诈识别比较有用的信号特征。在这方面,传统的做法是会有一些个人的风险特征,或者关联人,大概多少坏人,这些是我们人能想到的特征。