浅析金融大数据安全_大数据_计算头条_中国计算网——工业互联网一站式服务平台—

随着大数据的发展，从银行到P2P再到保险、证券等，越来越多的金融企业开始建设自己的大数据平台。传统上对于数据的管理，金融界是有经验的。

但在当前以Hadoop为基础的大数据平台，接触数据的人更多，数据使用的更频繁，数据的内外交互实时，数据种类更复杂，对安全带来了更严峻的挑战。

从金融业态上来说，包括征信、消费金融、P2P、众筹、互联网银行、互联网保险等金融企业，都会需要大数据平台来支撑业务需要。

金融大数据的安全有三个很重要的工作内容，分别是安全管理及监管合规、数据安全、业务安全。具体到实际的安全映射上，分为以下四类。

一、安全管理

金融机构是属于被强监管的机构，很多业务都需要牌照才能开展。在安全领域保持监管层的汇报和日常沟通，是工作量不大，但需持续进行的工作。

监管机构一般会有现场监管和非现场监管，注意及时、准确的填写内容，利用现场监管的机会，充分展示安全保障能力。

金融监管由于行业特点，普遍比较保守，对于新技术的应用较为谨慎，例如人脸识别、二维码付款、大数据风控等新型技术，不建议在汇报沟通中过多渲染。这里点到为止不再多谈。

主管机构在监管层面，目前主要还是看安全制度、信息安全等级保护评测。等级保护测评无需多说。安全制度层面，由于不同金融业态对应不同的安全管理要求，需要结合专业条线的安全管理制度来开展。

有些机构为了取得更多安全证书，会去拿一些国外的安全体系认证，这在监管层面不是很认可，我自己的建议是，除非有国外机构的业务，或者真正需要借证书来完善自己的安全管理体系，否则这个证书不用过于强调。

除监管之外，安全管理还有一个重要内容是传递安全的信任感。一个平台是否安全是投资者非常关心的一个角度，平台安全可以分为资金安全和信息安全，而信息安全则需要传递这种信心。

如果一个平台被黑客攻击，或者羊毛党大量聚集，或者出现批量的受害者，这对平台的打击是致命的。在安全信心的传递上，一是用人民群众喜闻乐见的形式在平台上宣传，二是要处理好应急事件，尤其在公关层面。

二、生产安全

金融的安全运维和研发安全上，与其他类型机构相比，安全要求相对较高一些。但本质上并无较大差异，本文也不在这里介绍。主要探讨大数据平台安全。

一个简单大数据平台示意图如下：

整个大数据平台可分为三大块。

1、数据源

一个大数据平台，必然面临这种形式的数据接入，数据有结构化的非结构化的、爬虫数据、上报数据、图片数据等各类格式。数据又有个人身份信息、支付、移动数据、法院信息等各种类。数据还根据来源有组织内和组织外。

根据接入方式有互联网、专网等。这里需要考虑存网络边界风险。

在一个大型集团的大数据平台，每天都会有各种各样的数据接入需求。安全部门在这里要有统一、强制的介入方式，包括连接类型是API、FTP还是其他类型。包括数据流量预测。包括接入的鉴权方式和证书管理。

包括使用期限和下线管理。建议是形成统一的数据接入平台进行管理，按照不同的数据保密性级别分类处理，约定统一的安全强度。这件事要早做，越晚做越痛苦，等到业务发展起来，无数的接口需要梳理的时候就积重难返了。

2、大数据平台安全

2.1基础设施安全

大数据平台首先要考虑自身基础设施安全。由于金融属性，大数据平台不太会考虑使用云的形式。另外，取决于搭建大数据平台的技术及数据库，还需要进行针对Hadoop、mogodb、nosql等的安全管理。

需要指出的是，大数据设计的初衷并不是为了安全考虑，整个安全管理机制并不成熟，比如Hadoop早期版本缺少身份认证机制、节点之间的传输无法加密，后续的版本提供了此类的机制之后，升级又可能导致Hadoop不可用。NoSQL数据库则缺乏一些传统数据库提供的安全功能，比如基于角色的访问控制功能。