新华三集团研发架构研究部系统架构师孙晓军:大数据安全防护

拟稿,我们对任何这样的阶段进行数据过程的建模,在每个阶段里,这个数据的处理过程应该是怎么样的,然后根据这个模型提出在这个阶段里数据安全的目的,策略,重点的方向,以及方法。提出来这么一套方法论。这也是比较新的,目前方法论也在搞,我们华三公司是主要的参与开发者之一。

再一个是大数据平台,从我们的角度来看,跟传统的IT系统变化不是很大。只是由于大数据的思维和属性造成了各方面的性能有一些问题。所以说在这块,还有云化,虚拟化的问题,所以在这块我们主要的是针对IT信息系统的体系去考虑安全。比如说云安全的信息已经发布了。

这块是我们对基础平台的从等保的角度上看的,从最基础最传统的结构,这个组成了大数据的平台,在这皮上,我们已经传统的等保体系方法论去规划。这块是在传统的等保体系进行了优化产生的体系。具体的方面比较多,我只是讲一下其中的一个案例。当然华三公司是以网络起家的公司,所以我从网络讲讲。

主要还是安全的三个节,第一个事前,事中,事后,通过各种各样的控制,达到这样的目标,一体化的目标。这只是其中的一个维度。下面是大数据本身的安全,我们从大数据组织架构的角度上分析大数据安全的防护情况。我们在一般的项目里,大家都可以知道,我们整个组织的数据架构大概可以分成几块,第一块是组织外部的数据,第二部分是域内。域外是各个兄弟单位的数据交换,另外是社会书记的抓取。域内不在大数据安全的考虑范围内,另外一个是数据分析系统的数据安全的域,从数据安全域的角度来讲,采用的是物理隔离的方式。数据只能往一个方向走。在这块,我们主要考虑的还不是安全方面的问题,而是数据的同步对业务系统造成的数据的稳定性的影响。所以说,基本上我们在这里采取数据缓存区,有点像是一数据防火墙的,业务系统跟数据分析系统分开了,它的业务系统的运作不会影响到业务安全。

下面是从数据生命周期的安全的角度上对安全进行分析,第一,数据处理的阶段。

这个阶段主要是从数据处理这个环节上分析数据安全,所以说我们对整个的数据处理的过程进行一个建模。数据处理有三块,一个部分是数据的生产,我们现在的数据处理的过程基本上可以认为是数据的生产、消费、提供服务地过程。所以有数据生产、消费。消费的过程是数据分析,大家觉得数据分析怎么会放在数据处理里。数据的应用领域或者是分析,主要是注重数据消费,数据分析的逻辑。但是数据分析最终的执行还是要在数据处理地框架里进行的。所以说,在这样的环节里,从使用的角度上来讲,这里防范的核心的目标就是数据的滥用。也就是说在授权以内的数据,使用范围的聚合,分析,产生了保密性和隐私方面的一些问题。所以说,从开发的角度上来讲,防止数据滥用,整个开发的管理流程,对数据的申请和处理有一个严格的规范。

另外,从管理的角度上,各方面的事前,事中,事后的手段。另外对开发出来的数据应用如何进行控制。在数据处理阶段最主要的是防止数据的滥用,基本的方法,就是最好的数据可用不可见,这样的话就防止了数据违法方面。

在数据应用方面,大概的模型是这样的,刚才讲的是数据处理,可用不可见的实现基本上是以数据服务封装的形式出现的。一类数据操作服务,另外一类是数据的评估服务。当然,数据操作服务提供里数据可用不可见的最基本的服务。对于上面来讲,对于应用的开发,这方面是最主要的方面,所以说对应用的开发的一个申请、审批、最后的上线、使用,这些都是我们的数据安全的检测点。服务于相应的系统,解决数据安全方面的问题。

前面是从数据的生命周期来分析大数据的安全,下面是在大数据的年代里,我们以大数据的观点治理大数据的安全,这个角度上,我们一个安全系统,应该是一个闭环系统,这个闭环系统大概是这么几个阶段,第一个是防护阶段,做好城墙。第二个是事中的监控阶段,第三个是出了问题以后的响应阶段,第四个是恢复阶段。我们以前的数据安全系统比较薄弱的是数据的监视和控制,或者是IT系统安全方面的监视和控制做的比较弱。

在这个方面,我们会把大数据引进来,在大数据的监管平台,其实是在我们安全大数据平台做的对大数据的安全进行的监控。公司主要提供了闭环系统,这是发现了异常,进入我们的响应系统,整个形成了一个闭环的过程。