破解云上的危机

接踵而来的中国网络安全事件,让人们不得不再度审视一个现实:在享受网络便利的同时,谁为安全受损买单?这个问题虽从一开始就很重要,但现在变成了生死攸关。

5月27日下午5点,拥有将近3亿活跃用户的支付宝出现了大面积访问故障,全国多省市支付宝用户出现手机和电脑支付宝无法登录、余额错误等问题。第二天,携程网爆出因数据库被物理删除,携程网站及APP陷入瘫痪状态12个小时,页面无法打开。

继支付宝、携程系统瘫痪后,5月29日上午,多个券商交易系统不堪大量交易重负,也出现了接连宕机事件。

6月12日,美国驻华大使馆官网发布信息称,“美国国务院领事事务局正经历海外护照和签证系统的技术问题。”所有国家赴美签证均受影响。截至《财经》记者发稿,仍无修复时间表。

此前两个月,苹果的应用商店App Store、iTunesStore发生重大宕机事故,搜索和下载功能都暂时失效,这一事故波及全球用户。

数据没有丢失,可谓虚惊一场。但此次事件给网络信息安全敲响了警钟。

高盛统计数据显示,2014年,全球范围内总共发生了3014桩数据被盗事件,11亿份记录曝光,其中97%与黑客活动(83%)或欺诈(14%)有关。过去一年时间里,数据被盗事件和记录曝光事件的数量均大幅增长了25%。

互联网的安全问题并不是新问题,而这几年随着个人云计算服务的兴起,它的重要性再次被关注。

云为移动互联网带来了基础能力,但其动态、开放、甚至不可琢磨的技术特性,又将引发新的安全挑战。而且,以物联网为代表的新一波移动互联网大潮正在赶来的路上。

市场研究机构Gartner预测数据显示,到2020年,全球联网设备的数量将从现在的30亿台增加至260亿台左右。不仅手机、电脑、电视机等传统信息化设备将连入网络,家用电器和工厂设备、基础设施等也将逐步成为互联网的端点——网络安全边界将被无限拓宽且变得日益复杂。

建设可管、可控、可信的网络,是下一波移动互联网浪潮潮起的前提和方向,但现在中国的互联网却近似于“裸奔”。

“裸奔”

中国人在互联网,尤其移动互联网上流通的资产已经越来越多。

市场分析机构易观智库针对今年一季度的统计数据显示,中国包括电子商务、航空票务、火车网上订票、旅游、境外消费、互联网金融、线上游戏增值等网络交易总规模超过10万亿元人民币。

支付宝、银联支付和财付通等第三方移动支付规模超过2.8万亿元人民币,环比增长5.81%;P2P网贷市场交易规模超1000亿元人民币,环比增长34.5%。中国移动支付和P2P网贷市场仍保持了相当高的活跃度。

传统银行业务在互联网和手机端的交易量也十分可观。一季度,中国手机银行客户端交易规模高达12万亿元人民币;网上银行客户端交易规模达到353.5万亿元。而且,手机银行的交易规模还在以两位数以上速度攀升。

这一连串数据显示着,互联网尤其是移动互联网上流通的中国资产已经十分庞大。以网络交易为例,根据国家统计局公布的数据显示,今年1月-5月,我国社会消费品零售总额为11.8万亿元,月均2.36万亿元;而实物商品网上零售额总额为1.11万亿元,并迅速向大城市以外的二三四线城市蔓延扩张。

移动支付手段打通了移动互联网商业世界,从而形成了商业闭环。但由于成长速度太快、规模太大,中国互联网公司对安全的重视程度并未跟上业务规模发展的速度。

传统金融行业几乎是全世界信息安全技术最发达、网络架构最严密的行业,其网络架构搭建理念就好比护城河+多层堡垒,对用户数据的存放和管理有相当成熟的行业标准和规范。即便如此,其IT系统仍有缺陷,多个券商系统宕机就是最好的表现。

中信证券股份有限公司信息技术中心行政负责人董事总经理张益民接受《财经》记者采访时称,从业务上看,国内投行以前主要是以场内业务为主,是牌照业务,造成了各家业务趋同性比较大,必然导致IT系统的发挥余地较小,同质化严重;而国外投行在场外业务上的创新性百花齐放,导致对IT的个性化、创新性要求非常多,这种情况下,国外投行纷纷发展自己的IT开发队伍,以适应业务快速发展、快速创新的需求。他表示,最近几年,中国金融企业才开始自建IT系统以应对安全需求。

诞生于移动互联网、云计算变革之下的互联网金融公司兼具金融和互联网的双重身份,其安全系统更是脆弱。

一位来自传统银行的互联网金融公司高层人士入职后第一件事情就是深度研究其网络架构,并多次在公司高层会议上强调把云和服务器放在第三方平台是极不安全的,力荐公司高层应向传统银行学习,自建服务器。

该公司另一高层向《财经》记者坦言,对于一个刚刚起步的创业公司来说,这是不可能的,“现在能做的是在安全和效率中间平衡折中,到了一定规模之后,才有可能加强安全”。互联网金融公司普遍无力在网络安全上投资重金。

为P2P公司搭建IT系统服务的技术服务提供商中科柏诚董事长王德敬告诉《财经》记者,出于成本考量,绝大部分互联网金融公司偏爱成本更低的公有云平台,其数据普遍被暴露在云环境之中,所有的数据备份和安全防护基本依赖于云平台公司,这与传统金融行业利用封闭的物理设备实现护城河一般的严密数据保护不可同日而语。

一位资深IT技术人士为《财经》记者算了一笔账:以一个只需要一台最初级服务器和基本网络架构的初创互联网公司为例,自己部署服务器成本大约为每月3000元左右,但如果使用阿里云的公有云服务平台,每月只需百元左右。

这与银行在IT系统上的巨额投资几乎是天地之别。传统银行在IT上的投入巨大,一般是其年度利润的10%到15%,只有这样,才能保证IT系统能支撑庞大业务和用户的发展。

同样受限于成本,在公有云平台提供基本的灾备手段之外,目前绝大部分P2P平台几乎都没有基本的灾备系统。

不规范的业务上线操作也进一步放大了安全缺陷。多位互联网金融从业人士告诉《财经》记者,市场竞争异常激烈,业务部门非常着急要上线一些业务的时候,往往会打破规范,在整个上线流程没有建立,或者还没有完成开发、测试的时候,业务就直接发布了。

互联网金融企业的管理层其实十分清楚存在的安全缺陷。这些安全缺陷就像达摩克利斯之剑,时刻存在危险。

小微互联网金融公司在黑客的攻击面前防护能力普遍弱小,容易造成恐慌和非正常死亡。统计数据显示,在2013年和2014年,有超过100家网贷平台因黑客的攻击而宣布关门。绝大部分网贷平台遭遇过黑客攻击,被迫关闭服务器、暂时停止服务。

“金融风险的一个特点是滞后性,早期跑得越快,系统搭得就越浅,倒的机会也越大。”大数据风控公司神州融联合创始人黄海珈说。

最受安全制约的互联网金融行业尚且如此,其他中小型垂直互联网创业公司的安全意识和安全架构部署更是漏洞百出。公有云平台创业公司七牛云总裁吕桂华告诉《财经》记者,互联网公司普遍不具备安全意识,大部分小公司很少主动了解平台的安全机制,更加看重平台的迁移能力和系统运行能力。

多位接受《财经》记者采访的互联网IT安全人士也均认为,除了BAT,中国绝大部分互联网公司的网络架构均不甚完善,安全漏洞和风险巨大。

国家计算机病毒应急处理中心在今年3月发布的调查数据显示,2014年,中国31.3%的用户遭遇过个人信息泄露。

感染计算机病毒的比例为63.7%,比2013年增长了8.8%;移动终端的病毒感染比例为31.5%,比2013年增长了5.2%。无论是传统PC还是移动终端,安全事件和病毒感染率都呈现出了上升的态势。

攻击

一家网游虚拟物品交易平台的创始人在考察了多个公有云平台后发现,没有一家的安全机制令他满意。

网游虚拟物品交易是一个竞争激烈、市场空间极大的高利润市场,在残酷的市场竞争之下,这家网游虚拟物品交易平台正沉沦于竞争对手的恶意流量攻击中不可自拔。

流量攻击必然降低用户体验。上述平台创始人透露,他的平台每天遇到的流量攻击在几十个G到几十个T之间,而他的方式除了将数据服务器分布放在不同数据中心,引流导流,目前没有其他更好的办法。

网宿科技副总裁刘洪涛告诉《财经》记者,按照经验值,互联网公司遭遇流量攻击的频度与规模整体上呈相反的变化趋势。也就是说,越大规模的攻击发生的频率也越低。

一般的互联网公司一两年可能遭遇一次大规模(大于100Gbps)的DoS攻击(Denial of Service的简称,即拒绝服务,其目的是使计算机或网络无法提供正常的服务),中等规模的DoS攻击(20-100Gbps)会频繁一些,约一季度至半年发生一次;而小规模的DoS攻击可能一个月出现一次或多次。

一家游戏公司CTO告诉《财经》记者,游戏行业服务类型严重同质化,虽然不能从技术上溯源攻击者,但用流量攻击来打击竞争对手的事情确实较为常见。

如果说流量攻击是一个恶意商业行为,可以通过一定手段来遏制和规范,那么互联网时代开放的网络架构和平台带来的网络安全风险则常令普通互联网创业公司束手无策。

传统的电信运营商和IT行业通常比较依赖于国外大公司提供的整体解决方案,比如IBM等公司提供的小型机等。互联网公司则更加喜欢前沿的开源技术。阿里曾经在内部发起 “去IOE运动”,消除公司产品对IBM、Oracle、EMC重型基础设施的依赖。而更新的互联网公司则自一开始就不会与这些重型基础设施沾边。很多互联网创业公司的产品环境没有采用任何商业软件,完全基于开源的软件系统和框架来搭建。

开源平台比想象中更加脆弱,而且其一旦受到攻击,会波及众多平台上的公司。

2014年,波及全球数以千万计服务器的“心脏流血”事件震惊了全球IT业。全世界网站服务器中有三分之二都采用OpenSSL开源软件,而针对该软件的“心脏流血”漏洞则帮助黑客获得打开服务器的密钥,监视服务器的数据和流量。“心脏流血”波及范围很广,包括雅虎在内的,Alexa排名在前百万超过40%的网站数据被泄露。

万物互联的风险亦在显现。

2014年9月,一款可以感染路由器、恒温器、烘干机等许多物联网设备的恶意软件,组成了1.2万至1.5万台的大型僵尸网络,在亚洲和美国实施了各种形式的DDoS攻击。攻击流量峰值高达215G,每秒1.5亿个数据包。这亦是迄今为止针对物联网领域最大的一次恶意攻击。

物联网设备存在诸多因设备制造商急于联网,从而忽略了安全问题的严重风险。包括隐私泄露、弱密码、非加密通讯,以及网页操作等漏洞。而企业网络与员工自带的个人设备又极易发生交叉感染。如果没有新的安全模式来应对这一风险,那么未来物联网安全的严重性将超出人们想象。

再造

前南方电网、中国电信和思科资深技术专家徐建锋告诉《财经》记者,安全包括物理设备、网络、系统和应用四大层面。其中,物理设备和网络层面一般不会发生安全问题,一旦发生就是大事,例如,2012年因骨干网设备故障发生的中国互联网大面积断网事件。

在云计算技术和云服务平台越来越成为互联网公司技术架构核心的今天,后端的系统和前端的终端应用安全问题越来越凸显。逻辑很简单——越开放,参与的人越多,安全问题也越多。

支付宝瘫痪事件是一个典型的后端系统安全问题。支付宝相关技术人员告诉《财经》记者,瘫痪事件发生后,支付宝技术团队确定无法在短时内修复被挖断的光缆,决定进行机房容灾应急预案。为了保证用户资金数据不出现任何问题,支付宝技术团队采取了手工而不是自动切换方式——进行内部数据核对,在发现没有影响的情况下才对外开放,这也直接造成支付宝在两个小时之后才恢复运转,没有实现“无缝切换”的容灾设计初衷。

这是支付宝自运营以来首次遭遇真实的整体机房突然中断故障。从外界来看,这次事故显示,支付宝的“异地多活”备份系统架构虽然不同于传统金融行业的“两地三中心”容灾机制,但也基本经受住了考验,在光缆未修复的情况下,快速恢复了服务,这在互联网公司中已经处于顶尖水平。

这套基于云架构的备份容灾系统,并非没有缺陷。上述支付宝技术人士告诉《财经》记者,系统架构还有提升点、改进点,未来改造的方向是在遇到同类突发故障时能够提升切换速度。

上述支付宝技术人士坦言,在本次突发故障以前,支付宝技术团队考虑到网络完全中断的极端情形进行了定期演练,但未对网络拥塞情形进行充分演练。

这也许是为什么支付宝没有能够实现“用户无感知”的灾备切换能力设计初衷的原因——传统金融和运营商每年大大小小的演练有数百次,而且,现实情况与演练还是存在差异的。

事件发生后,支付宝技术团队细化了应急制度及流程、完善容灾切换应急预案与支撑系统的建设,制定了月度演练规则。

外界也有质疑,阿里巴巴“去IOE”、“由硬变软”的数据中心架构转变令网络负载存在隐患,导致业务连续性面临新挑战。2013年,阿里巴巴宣布“去IOE”战略,去掉IBM的小型机、Oracle数据库、EMC存储设备,代之以自己在开源软件基础上开发的系统。传统IT的数据中心,IBM小型机、Oracle数据库和EMC存储设备往往是标配,缺一不可。

开源软件跟商业产品的重要区别在于,开源软件只有基本一个框架,不成熟,需要自己去打磨,出了问题没有厂商技术支持。而IOE好比是4S店,收费高但服务全面。

面对这种质疑,支付宝相关技术人士认为,国产软件能力已经比过去增强不少,并且更能适应互联网海量数据和业务方面的特点。

阿里巴巴的一位前架构师基本认同这个观点。他认为,瘫痪事件对于支付宝而言就是摔了一跤,最容易出问题的不是阿里巴巴这样的技术实力雄厚的大公司,也不是体量太小的初创小公司,而是中型公司。“大型公司技术实力强,小公司被攻击的机会少;而中型互联网公司既没有特别牛的技术团队,出现漏洞和被攻击的机会又远大于小公司。”

5月29日,携程网发生了长达12小时的宕机事件。携程在事后发布简单的声明称,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。

这并非携程发生的第一次安全事故。去年3月,携程就被爆出泄露用户信用卡CVV信息事件。携程安全支付日志在多处网站可随意下载,导致大量用户银行卡信息泄露(包含持卡人姓名身份证、银行卡号、卡CVV码、6位卡Bin)。

多位接受《财经》记者采访的专业技术人士认为,相对于支付宝瘫痪,携程的安全问题十分低级严重。一家美国安全厂商技术高层人士指出,类似泄露用户银行卡信息和程序员误操作删除信息这样严重且低级的错误,如果在美国,这家公司将面临严厉的法律诉讼,乃至关门歇业。

如果出现问题,灾备是唯一的挽救办法。但与早已被标准化的传统行业灾备方案相比,互联网公司分类太多,情况复杂,难以形成统一的行业标准。

IT灾难恢复公司万国数据副总裁汪琪告诉《财经》记者,灾备不出实际效益,一千块钱的投入可能只做一块钱的事情,所以绝大部分互联网公司只做最基础的灾备措施。

例如,一些服务器放在公有云平台上的小型互联网公司,一般在公有云平台提供的数据备份之外,自己是否再进行数据备份,是实时备份还是有限备份,都因企业的资金实力和安全意识而不同。

万国数据为互联网公司提供的一项日常业务是计算合适的灾备投资方案。汪琪告诉《财经》记者,由于云计算和云服务的普及性,互联网公司的数据一般不会丢失,区别在于是业务不中断,还是中断时间的长和短。企业要算账,中断1个小时或者12个小时造成的经济损失会是多少,然后根据灾备的成本,选择合适的灾备方案。

按照携程一季度财报公布的数据,携程宕机的损失为平均每小时106.48万美元。按照宕机12小时算,初步估算携程损失超过千万美元。

万国数据的一份研究报告数据显示,53%的中国公司会因系统故障导致业务中断,而在日本这一数字则只有28%。

至于那些完全没有灾备意识的公司,则很有可能在一次打击之下便被迫退出市场。

汪琪认为,互联网行业很难制定一个统一的灾备标准,但根据其业务属性,可以参考传统行业的灾备标准部署灾备方案,亟须改变“唯成本论”的现状。

事实上,不同类型的互联网公司对网络架构和安全性能的需求其实各有不同。互联网金融公司需要私有云来保护用户账户核心信息;网游和电商公司需要稳定的带宽和架构保证用户体验;社交平台则强调开放特性之下的全面安全。

在终端和应用层面,移动互联网和云计算的普及也令安全面临全新挑战。我国移动互联网用户已经超过8亿,移动终端设备越来越多样,这也意味着管理起来将更加困难。

移动终端受功耗等限制,无法像个人计算机那样内置功能强大的防火墙。安卓移动操作系统尽管已经使用了针对应用软件的签名系统,但黑客仍然能使用匿名的数字证书来签署他们的病毒并发放。

为了保障系统和终端层面的最大安全,Facebook在2011年成立了一个名为“漏洞奖励”项目,该项目通过现金奖励的方式酬谢那些为公司发现安全漏洞的人士。2014年,Facebook通过这个项目找到了17011个漏洞,比2013年上涨了13%。谷歌也有相关的漏洞发现奖励机制。

从最终结果来看,这种方式十分有效,但在中国几乎没有类似实践。

争议

水能载舟,亦能覆舟。

从2013年开始,中国公有云服务开始进入实质性的落地阶段。2014年上半年,中国公有云服务市场整体规模达到3.27亿美元,全年预期将达7.17亿美元,同比2013年增长46.7%。有研究预测分析表明,2015年至2018年,公有云服务市场将持续高速增长态势,年均复合增长率将达到33.2%。

未来,包括互联网公司和需要互联网化的传统公司,也许所有公司都将跑在云上。

开放的公有云平台大大降低了企业的安全成本。微软近期的一份用户调查报告显示,在过去三年间,使用了云服务的企业与未使用云服务的企业相比,安全支出降低了5倍之多。

报告称,安全方面的收获是云服务平均每周可减少18个小时的安全管理时间。这是因为大部分的安全管理是由云服务提供商进行的。“虽然云计算不能取消企业内部对补丁管理的需要,但安全管理的需要会大大减少。”

完全把安全依赖于公有云平台,显然并不明智。

360副总裁谭晓生在近期举行的云计算大会上表示,开放的网络架构令互联网公司可能被攻击的点增多了,由于云计算技术尚未成熟,年轻的虚拟化系统、云计算管理平台比传统系统存在更多漏洞,更加脆弱。

一方面,公有云平台良莠不齐,此外,公有云平台也有可能受到攻击,这就好比把自己家的钥匙交给第三方,安全系数大大降低。

为了保障安全,一些对系统安全要求较高的互联网公司往往采取双重或多重安全保障的方式,例如,七牛公有云平台上一家为大型商场提供视频监控的互联网公司,在七牛的云安全的基础上,又在芯片层面做了加密机制。

另一些渐成气候、规模成型的互联网金融公司则开始拒绝公有云。一位知名互联网金融公司安全总监告诉《财经》记者,他所在的这家公司只有在开发测试的环境下使用公有云平台,正式的生产环境则砸下大笔资金,自建数据库。

他向《财经》记者强调:“我们想做规划者,不想做救火队员。前期不投入,后期背黑锅。”

阿里巴巴也在快速转身,在涉及用户账户的核心数据安全上,向传统银行看齐。

6月25日,筹备已久的阿里巴巴旗下的浙江网商银行将正式上线。网商银行技术总监唐家才告诉《财经》记者,这虽然是一家完全运行在互联网上的新型银行,但在网络架构上还是采用了私有云系统,建了自己的机房,机房外有多层防火墙,“这一是为了迎合监管要求,二确实是出于对储户资金安全的考虑”。

在核心系统和数据的安全防护上,网商银行走了传统银行的道路。但唐家才向《财经》记者强调,这并不意味着公有云不安全,“无论是公有云、私有云还是混合云,结合自身情况选择一套合适的云搭配方案才是最重要的”。

IBM中国区的一位高层人士此前亦向《财经》记者表示,IBM一向做大型行业和企业的生意,但针对中小型企业的公有云市场潜力无限,是未来值得着力的焦点之一。

“风险不在于开放,而在于你是否有能力开放。”上述IBM高层人士强调。

接受《财经》记者采访的多位互联网人士表示,互联网技术将与安全问题如影随形,每一次问题的出现都将是一次新的发展机遇,构筑在云之上的未来移动互联网系统将越来越健壮。

倒逼立法

中国的移动互联网用户规模、业务模式已经跑在全球浪潮之巅,但对安全的敬畏和研究还处于学习阶段。

现时的互联网公司还裸奔在安全体系之外,新兴的“工业4.0”、“互联网+”浪潮又将更多的传统公司推向互联网,在互联网业态发生巨变的关口,政府应该如何建立相应的互联网安全体系?

中国电子学会理事长、陕西省人民政府省长娄勤俭认为,面对中国经济全球化、网络化趋势,既要提高被动防御能力,也要抓制度建设。

他建议,在制度层面,决策层需要加快信息安全立法进程,推进法律法规和数据开放保护制度措施,加强侵犯隐私的惩戒力度,国家、企业建立安全预警平台,及时识别网络安全的重大风险。

还应建立国家信息安全等级保护制度,建立云计算、大数据环境下的信息安全认证审查机制和安全评估体系,开展定级备案和评测等工作,加强安全风险分析,及时有效处置威胁信息安全的突发事件。

资深互联网法律专家林华则认为,对安全的监管和立法分为两种:一种监管是为了加强国家控制,一种监管是为了增加公众安全。而他觉得中国目前只做了前一种。

支付宝和携程事件备受质疑的一点在于,事件发生以后,二者都没有及时向外界详细披露技术故障的前因后果、产生了什么影响、未来改进方向等。这与亚马逊、微软、谷歌等大型国际互联网公司的成熟做法相差甚远。详细及时向外界公开信息,其核心出发点在于,需要给用户信心,披露得越详细,给社会的想象和争议空间越小。

此外,这也是规避在美国法律体系中已经十分成熟的“集体诉讼”风险。在欧美等发达国家,一旦有互联网公司出现网络故障或安全事故导致用户权益受损,消费者往往选择通过集体诉讼的方式保护权益。

近两年来,阿里巴巴、联想、聚美优品、兰亭集势等互联网公司都在美国遭遇过集体诉讼。美国的大型互联网公司也普遍遭遇过集体诉讼。近期,一桩针对雅虎非法拦截由非雅虎邮箱发送至雅虎邮箱用户的邮件内容的集体诉讼被裁决。

裁决称,自2011年10月2日以来,凡是曾经向雅虎邮箱用户发送过或收到其发出的电子邮件的消费者,根据美国《联邦储存信息保护法》(SCA)有关涉嫌侵犯隐私的规定,均可作为原告提起集体诉讼。初步估计,有集体诉讼资格的用户将超过百万。

在美国,集体诉讼可以较低成本获得较大赔偿,也能使诉讼者得到更为全面的解决办法,更是倒逼互联网公司主动从根源上重视网络安全、尊重用户数据、主动改善用户体验的最佳方式。

但在中国,消费者诉讼企业一直处于弱势的局面,更没有完善的集体诉讼制度和习惯。法律界人士认为,在互联网边界越来越宽的今天,中国企业需要建立起对用户数据的足够尊重,尽可能将安全问题扼杀在摇篮期。

云,让这个时代变得更加无所不能,也让所有人都在地图之外航行,没有前人的标示和灯塔。无论是监管层,还是产业链各方,是时候动手解决安全问题了,如果不解决,可以预见:技术将倒退,产业将停滞。

本文将刊发于2015年6月22出版的《财经》杂志