超云对Hadoop优化服务器 提供一站式的云存储

陈敬熙:大家好,我是天地超云的产品经理,“超云云仓——助力建设私有存储云”,云大家都知道,云计算非常热,仓大家第一联想到的是什么?仓库,还有粮仓,放粮食的。还有放米的,放面的。什么样的东西放在仓库里?不是现在用的。今天晚上要做饭,我从仓库里把粮食取出来用,但是我有一大堆的储备这个时间要放在仓里,包括货品、粮食,包括任何一种储备的物资都是用仓去定义的。

我们今天要介绍给大家的超云云仓也是基于这样的考虑进行设计和打造的,专注于存储云,存储云顾名思义,存储日常甬道的一些关键的业务文件。引发大家深入考虑一个话题,我们日常在大量的使用电子文档,对诸位意味着什么?我们在工作生活社交的过程中,在什么情况下我们会产生大量的电子文档?他会是什么样的电子文档?最简单的一个例子,我们的摄影师在拍照,他所产生的照片记录着历史的这一刻,一张电子照片。我们今天在跟客户进行交流所记录下来的一些会议的纪要,也是电子文档。我们给客户提供一份方案的建议书,融合着很多工程师的智慧,也是电子文档,甚至我们记录今天会议上的录音、记录,以及一系列业务的数据、表单这些都是电子文档。我们为什么要去用电子文档,电子文档载体很多,包括大家日常甬道的Office上的Word、Excel,也包括一些照片,一些媒体都大量的产生。随着现在多媒体设计逐渐的增多,你可以随时随地产生你所需要的电子文档存储这一段时间的数据或者信息或者知识。我们为什么要使用电子文档,它带来很多的好处,比如把电子文档存储很容易,小的USB盘上存储几千个小时的音乐,几百个小时的电影,甚至相当于北京图书馆这么大藏书量的内容,甚至是更多更有用的一些东西。它可以存储的很多,修改起来,去复制起来,传播起来也变的很方便,它使我们产生一些知识内容的时候,变的更为容易。早期我们用活字印刷,每产生一篇文档要进行排版,今天这些事情一下变的简单了。

另外一个观点,现在我们在电子文档上的产生量是非常大的,根据大家的调查得出一个结论,在普遍性的日常IT工作者,信息工作者,我们每天要跟计算机打交道,每天日常的工作会接触到15份文档,无所谓是照片或者是文本或者是其他的什么,有人会更多,有人会少,平均我们达到一个数字15个,每天每个人基本会产生13兆左右的数据,无论你是在修改也好,照片,每人每天产生13兆的数据,每个人大概4GB是这个人一年产生的数据量。我曾经认识一个工程师在IT从业十年,他的一块移动硬盘里保存着他从从业以来到现在为止产生的所有技术方案、技术文档,那块硬盘大约1个TB,他用了十年。


在这么大一个量上,为什么数据会如此的爆炸,又引发了一个新的趋势,现在存储数据很便宜,便宜到什么程度呢?一个4GB的U盘,相当于每GB的存储成本四元人民币,你可以带着这些数据满街跑,可能连汽车费都不止四元。如果在一个硬盘上存,每个GB的数据相当于7毛,一根冰棍都换不来。如果在云存储上,在全世界随时随地可以拿到数据,每GB每年5元。这么多的环境,这么多的方式,可以让我们存储很大量的数据。我们可以想象到这是一个非常广泛的市场,非常广泛的应用途径,但是在我们享受这种便利途径的同时,我们是不是有过一系列的考虑,比如像移动办公,虽然很方便,你可能随时随地的在移动,包括客户也好,外出也好,随时可以处理公司的一些事物,是不是高效与风险并存。您在存储的介质上所存储的这些内容保管时间是不是可靠,日常我们记录一些数据的时候,采用半导体的芯片,最大的弱点是一碰到静电就完蛋了,一个是怕电,一个是怕磁,强磁的情况下容易失效。有没有想到它会产生数据的丢失,以及您的数据每天使用的时候是不是进行保护,很关键的这些数据在什么情况下会产生一系列的副本,比如我今天这个数据没带,会从哪个地方拿到这个数据的副本,以及当我们每天保存完一个副本之后,有没有做恢复性的测试,我们经常说电脑坏了,就把电脑全盘的备份,它是不是能真的恢复过来,你试过吗?不知道。以及我们把很多的数据保存在互联网的免费空间上,它意味着什么?


当你面对着存储产生故障的时候,对你意味着什么?当你周边的亲戚、朋友、同事U盘坏了,电脑坏了,产生数据损失的时候,您会给他什么样的建议?在这样的场景下,把这整个问题做一个罗列。这是我们从全世界的调查方面得到的一些数据。实际上全球有25%的信息工作者在移动办公,其实这个量是很大的,这个数字仍然在增长,就意味着更多的人实际上存在着一种风险在里面,87%的有用的数据存储在每个人的个人计算机上,意味着什么呢?现在大家可能知道从淘宝上、京东上看一台标准计算机两三千元,还没有一个电视贵,去中关村买起来可能更便宜,一个上网本一千多元就买下来了,还没有一个手机贵,上面所承载的这些数据,这些信息你认为他对你的价值有多少?85%左右的计算机是没有备份机制的,也就意味着我们每天工作产生的文档除了产生之外,就存储在硬盘上,没有一个副本。全世界目前最著名的一个数据灾难,十多年前的“9·11”,大楼倒掉,它的数据风险最大的,因为包括数据,包括数据备份在那一瞬间全部都丢掉了。


企业内部存储的设备,这种机制,我们已经想到很多,通过互联网的调查,我们也看到这种数据实际上可以说有点儿血淋淋的,新浪微博上以每周为记录,搜索硬盘坏,大概是一千条左右,也就是每周大概有一千个人说自己的硬盘坏了,照片、数据丢了,交通广播平均每个月处理43起寻物启事,其中16起是电脑丢了,移动硬盘丢了,丢在出租车上。这一系列数据的风险,我们讲我们是不是应该对它想一些办法,想一些举措。有些人可能说现在我的电脑应该还算安全,为什么呢?因为我有自己的数据备份,可以备份到光盘或者其他的介质。现在大家都采用的一些方式,比如我们把整个分成几块,关键的文件上,第一文件保护,你为了保证你的文件安全,你通常采用什么样的手段呢?第一个,你可能买一个很大的移动硬盘,把你的关键业务数据每天拷贝一份儿,每周拷贝一份儿。当你硬盘拷贝满了,你说我再买一块儿更大的,再拷,随着数据的增长,逐步去进行更换,甚至有的公司也说我公司里有一个文件服务器,那个文件服务器有专门的机房放着,上面有IT的人去维护。也有的人说我公司里请一个网络管理员,他提醒所有的人你的计算机该备份了,这是一种方式。


文件分享上,你为了把一个文件传给你的同事,传给你的亲戚朋友,我如果把这个文件传给你需要一个更好的网络传起来更快速,让文件的传输更可靠,需要一个更好的邮件系统可以支撑在更多的附件,我这个邮件确实能够到达对方,甚至我们可以花4元/GB的成本买一个U盘,直接寄给你,以及QQ、MSN一系列的软件直接传,手段非常多。以及在移动设备上我们要有多种设备的支持,多种文件的支持,以及多种副本的考虑。在这么一个复杂的环境下,各位可以想象一下,我仅仅是保证我的文件安全,保证我的这些文件可以很好的跟同事之间分享,以及会随时随地拿到这些文件,你要考虑到以上的这十多种措施。你想想一下,你要具备一个多么完善,多么强大的一个基础设施才能达的到这些功能和这些要求。
在一个我们说能够达到这些要求的情况下,你需要多少种手段去维护这些基础设施,要用多少个U盘,现在大家每个人都不只一个U盘,不同时间获取到的U盘,移动硬盘也不少,电子邮件无数个,有时候我都记不住邮件名、密码什么,管理起来是一个更复杂的事情,可能牵扯你的精力,牵扯你的成本,会带来更多的一些麻烦。


不知道大家最近有没有关注过网络安全,最近一件事很厉害,CSDN密码泄漏,大家知道那个密码泄漏之后,对广大的互联网造成的影响是什么?有一部分黑客拿着这个密码到你的微博,到QQ,到任何可登录,可存储的网站上做这种尝试,也包括一些支付宝银行帐户试这些密码到底管不管用,一旦成功了,就意味着你的这些资料通通会受到威胁。
在这个领域里我们受到的威胁是相当多的,我们接下来看一下刚才提到的超云云仓,我们这个仓库同样是为了解决这三个问题,文件保护,文件分享和移动办公,我们在这个领域是如何去做到的。
我们先看文件保护,刚才我们所提到的作为文件保护来讲,你需要最快速度的把你的文件和一个副本进行同步,有可能定一个闹钟每多长时间响起来,但是我希望最好的方式是什么?每当有人发现我的文件产生了变化就存成一个副本到另外的地方,我本地再产生什么风险都可以放心,因为我一直在一个安全的地方有一个副本。


大家看到的界面是我很普通的一个电脑,这个文件夹所设定的就是和我们的超云云仓同步的一个文件夹,我在任何情况下可以在这个文件夹里建立我的文件,也可以选择我现在工作的文件夹进行同步。我们在这边做一个演示,建立一个文件,大家可以看到,每一个文件的缩略图在这边都有一个绿色的标记,证明这个文件已经和我后面的云仓进行了同步。


我先新建一个文件,这个Word已经存在这边了,我后面一个程序,开始检测这个文件夹的变化,刚才这个Word是没有这个标记的,现在加了一个绿色的标签,这就证明这个文件已经同步到后面的云仓上了。这个新建的文件夹我通过一个浏览器连接到我的云仓上,无论是新建或者删除或者修改,我产生的每一个变动都被云仓紧密的监视着,一产生变化存一个副本,这种自动化的情况下帮我们达到一个非常有效的文件的保护。不仅如此,在文件保护的基础之上,他可以提供我们整个文档的随时变更。举个例子,我今天可能参与一些临时的工作,可能我没有带我随身的电脑,我需要在一个地方马上处理一个文档的编辑工作,但是我不想把那个数据存在别人的电脑上,我同样在这个浏览器上点击这个文档,选择在此计算机上进行编辑的操作,点上去之后,云仓会帮助我建立一个临时的空间,把我远程的文档下载下来,用这个工具打开进行编辑。当我完成整个的编辑工作之后,这个编辑会被上传回去。


现在这个文件已经打开了,大家留意一下,在我幻灯片的位置上,有一张比较大的绿色PPT,我把这个文件做一个删除的操作,然后我记录一下现在我的修改时间,这时候云仓会把我修改的版本在本地不留任何副本的情况下又传回到云仓上去,修改的工作在云仓上完成了。当然,有时候我们在日常的一些文档编辑的时候,你会想到今天这个文档版本错了,我需要进行恢复,常规我已经把一个文件覆盖掉就没有任何机会了,云仓可以给我带来什么?在我刚才打开的文件版本上我可以通过一个先前版本的功能区调出我当前这个文件在3点38分的时候做过班级,在这个文件之前的40分钟我又做过一次编辑,云仓帮你追溯到你一直以来在这个文档里做的工作,从而帮助你把所有的工作记录收拢起来,任何时候可以对你之前的文档进行包括移除、恢复或者下载的功能。这样的话,使我们的文档在整个恢复过程中有非常便利的方式。这种文档的访问操作不仅仅是在现在的浏览器上,包括现在所支持的一系列的智能设备,也可以参与。


我们现在可以给大家做一个演示,我们现在的云仓除了支持浏览器的版本,PC的版本,以及iPhone的版本之外,我们还支持安卓1.5版本以上的移动设备都可以加载云仓的客户端。我们给大家做一个互动,我给大家拍张照片,他开始进行上传。大家会发现当我上传完之后,不仅仅移动设备上,包括我的电脑,包括我的浏览器上,和其他的有连接到云仓的这些智能设备上都可以拿到相应的这些文件的副本。在这种场景下,使我们感受到你的数据和你要访问的文件是无处不在的。日常我们在分享文件的时候,我们还会遇到一些场景,随着现在媒体的文件越来越大,一个文档和一个方案,一个演示文稿已经不是一兆两兆,它要十兆、二十兆,甚至更大,当我们要和你的同事分享这个文档,要传输给对方的时候,这个问题是蛮挑战的。我曾经在一个场景下,我的老板说马上把一个方案发给他,我正在休息,我要做的举措第一是先想想我今天有没有带电脑回家,如果没有赶紧开车去单位,如果带电脑回家还比较万幸,然后到电脑上查这个文档,然后把电脑连到家里的无线网络,看家里的网络能不能连到公司的服务器,然后把这个附件附到邮件上发出去,然后等着邮件发送,有时候邮件超大就发送不出去了,甚至发送到一半儿网络突然断了,就得重新发送。甚至文件超大,你会打成不同的包,一个个去发,然后你告诉老板怎么把这些压缩包再整合到一起,这是很痛苦的事,尤其是发送完成以后,你还得在电脑里等着老板说老板有没有把文件确认收到。我经常干什么事儿呢?十个压缩包发了九个,最后一个没发,最后的文件老板没拿大。


以这个场景为例,我们看在云仓上分享一个文件变的多容易,同样以移动设备为例,我们把刚才的这些文档做一个操作,当我点右边的箭头,智能设备上有一个分享的按纽,当点击这个按纽之后,我的云仓会把我刚才要分享的文件进行一个开放链接的处理,它会给我拟定一个邮件,我只要把这封邮件以短信或者任何的方式,把这个链接发出去,对方能收到他就可以进行文件的下载,我只需要在这个位置填上收件人,谁跟我做个互动,给我提供一个邮件地址?


现在邮件发出去了,是一个链接,我们看一下当我分享出去之后,它在云仓里是什么反应?云仓本身会做一个刷新的工作,大家可以看到其他的地方都是红色的Logo,这个地方加了一个绿色的标签,就指的是刚才我们所提到的云仓已经对外分享了这个文件,也就是你邮件发给任何人,只要有这个链接就可以通过外网到云仓上下载这个文件。返回到给老板发文件的场景,只需要躺在床上拿手机发一个链接给老板,说你从哪儿下载,如果连不通您需要检查自己的网络,很复杂的一系列工作在云仓上就变的非常简单。


你既然可以下载,整个它的权限的控制是非常灵活的,到文件夹里,包括文件一级,都可以进行颗粒度的控制。当我们确认您的同事已经拿到这个文件,他除了可以下载这个文件之外,我们另外可以看到有一个禁止此演示文稿的链接,当我确定我的同事已经拿到文稿,我可以禁止这个链接把文件的共享停掉,这样可以进一步的避免一些数据文件产生泄漏,以前大家都用共享文件夹,你把你本地的文件夹共享之后,大家都可以拿到这个文件,你发现有一天有一个公司网里很多计算机都在共享你的文件夹,可能你共享了这个文件忘了关掉,就导致这个文件到处都有,但是共享文件夹带来的最大的劣势并不是你忘记关掉,最大的劣势是它会在网络里形成网络,会形成你的连通的风险,包括安全的隐患。这是最大的隐患。通过云仓可以帮你更好的控制这些内容。


简单的跟大家回顾一下,我们刚才通过一系列演示,第一个,云仓可以通过自动的一些方式去对你本地的文件夹或者多个文件夹进行自动化的保护,上传同步,包括版本控制。文件分享方面,可以通过一个连接让你的同事自然的从云仓进行下载。在移动领域,支持了多种的设计,以及包括主流文件,比如Word、Excel、Powerponit、MP3、MP4、图片预览,你不需要本地装什么软件,直接在云仓上就可以看到这些文件的格式。云仓支持的功能,罗列的位置,大家发现所有的这些功能在Web上是最多的,基本这些功能有一个浏览器就都可以做到,云仓本身来讲是一个全冗余设计,我们交付一体化设备,直接交付的实体就是一个双机热备的情况,不用考虑要不要提供额外的费用做一台备机,以及云仓本身在技术领域来讲,是支持横向扩容的。我们目前提供的云仓规格是两个1U的机架式的设备,可以支持50到100人不同的规格同时在线工作。


无论从负载还是存储容量,当客户这方面的需求有任何的成长的时候,也不需要做机器的调整,数据的迁移,只需要再购入一个云仓,把新的云仓的设备加入,整个的存储容量,包括负载容量就随之自然的扩大,整个云仓会自动的分配新的用户,新的存储容量部署到我们的云仓里。
在这样一个场景下,云仓整个部署结构就相当于在一个环境里加了一组Web服务器,它基本位于DMZ区,可以通过客户内部的互联网或者是域名对外发布或者内部的一种指向,整个环境不会影响到客户现有的基础架构的任何的变化。从安全端口上云仓支持了SSL这种加密的通讯协议,以及可以通过证书的方式绑定公网的认定域名,而且保证客户环境内部设备的使用。


目前我们提供云仓的版本,每一组服务器支持4TB的存储,分别支持50和100人并发的不同规模,也包括单机和双机整个提供的机制供不同规格的客户选择。在这种环境下,云仓可以为我们现在的一些客户直接带来很大的收益。第一,从移动工作上,他可以彻底的使我们现有的高性能的智能设备马上的应用起来。我们现在的一些客户,包括一些会务公司,会计师事务所的一些应用,在这方面很多丰富的场景里在用。
举个例子,比如天津的混装码头,每个港上执勤的员工,他们通过云仓对交运车辆进行条码的扫描,每个交运车进来通过岗哨的时候拿智能手机直接拍一张照片后面传上去,后台的系统进行整个综合的业务数据的处理。事务所对整个项目数据进行综合的归档,包括一些会务公司,他们通过这些方式去和内外部协作办公,包括会议地点,参会人的名单,行车路线、地图,联动的办公,使业务数据更灵活,多人参与的协作,在这个领域我们在一些日常的办公环境里给用户带来了很多便利。以及从安全管理上讲,它的IT结构相对来讲我们已经把它做的非常简单,到管理人的层面,首要关心的第一是给所有的参与用户开辟用户名和密码,后面要接到的整个的存储容量的阀值,甚至添加新的设备,不会增加很多复杂的知识,新的一些维护的工作。我们整个的云仓在运营维护上超云直接做,它可以提供给最终客户什么呢?整机更换,不是硬盘坏了换一块儿硬盘,我们是整机进行更换,云仓带来的最大的优势,里面所有的文件都是密文的,倒出来基本上是不可读的状况。所以,最终客户也不用担心拿到我一个存储节点会把这个数据析出来,这种风险是不存在的。


在整个云仓里,我们也希望诸位在下一步参与到我们的活动里去,第一个,您可以联络您的客户经理和合作伙伴经理,索取我们新版云仓的帐户号,现在我们已经有一套设备部署在云基地的网络里,大家可以通过外网把现有的智能设备的桌面机通过互联网的方式去测试一下整个体验。另外,我们可以索取云仓的样机,现在云仓根据现有的一些环境进行评估的评估样本,在你的企业环境力测试云仓的效益,也可以邀请您的客户到您的环境里进行试用。我们后期会有云仓的一些路演活动,以及对一些合作伙伴,包括云仓前期的基础知识,售前,包括部署实施和运营维护的计划,希望大家可以联系我们的客户经理参与到里面来。


最后给大家分享一个段子,我叫陈敬熙,大家对陈冠希一点儿不陌生,冠希哥当年是因为去修电脑把照片漏出去了,如果他有云仓,他的照片不会这样。我分享的内容就到这里,谢谢大家。