传统银行的转型实战:看工商银行如何利用大数据洞察客户心声?

一些体会

大数据

文本领域挖掘过程中我们有一些具体的体会,比如首先选择贴合业务算法的模型,通过刚才的介绍也可以看到在文本挖掘领域很多的分析模型都有一个特点,就是可复印性比较低,往往在一个领域比较有效的方法换个领域就不太有效了,甚至换一批数据准确性就有很大的影响。

所以我们在选择一些方法的时候需要针对具体的业务特征和具体业务的特色多做一些尝试和实验,通过实验的数据来说话,我们到底选择一个什么样的比较合适的模型。

第二点是需要去注重语义资源库的建设,语义资源库扮演重要的角色,虽然我们可以在互联网上获取重要的资源,比如说中文单词的词库或情感辞典的词库,但是这些词库往往不能直接产生比较好的效果,因为这些词库只包含大众的词汇,这需要结合我们自身专业的特色。

比如说金融行业就要不断地整理梳理自身所需要的特色词汇,这个可能是需要投入比较大的精力的,我们在这个过程中也是花费了不少的精力,最终才能够完成我们所需要的分析的效果。

第三个问题,尤其是针对传统行业来说的,因为大数据商业的概念其实已经被炒的像一个神话一样,大家都在说,其实也很少人知道应该怎么去做,经常我们得到一些需求都是特别宏观、特别大的,其实都不太容易落地,从我们实际落地的角度来看,大数据要在传统行业有效的落地还是要从解决小问题开始。

总结

大数据

最后做一个总结。今天我们讨论了两个话题,首先对于95588客户意见挖掘设置了“对象-属性-评价”这样的方式,然后建立本体模型,针对本体模型我们设计了词向量辅助建模。第二个话题在互联网客户心声聆听当中,我们用朴素贝叶斯完成垃圾信息过滤,然后完成跨渠道事件聚类,最后完成重要信息的识别。