如果您的存储数据量不大,或者对存储性能要求不太高,而现有的NAS或SAN又恰好可以满足应用需求,您可能不会注意到集群存储正在中国市场上悄然兴起。
对于互联网、流媒体、高性能计算、能源等数据密集型、高并发访问的行业用户来说,容量与性能的线性扩展是必须的,而对于传统的存储方式来说,这却是不可逾越的鸿沟。
由若干个存储系统组成的集群,其性能和容量等属性可通过集群的方式得以叠加和扩展,不但有效解决了高性能的文件共享问题,同时兼顾了数据的高可用性及文件系统的高扩展性。
用户的迫切需求直接导致了集群存储市场的兴起。在集群存储领域,有中国用户十分熟悉的IBM、SGI、NetApp、Panasas、蓝鲸,还有中国用户不太熟悉的DataDirect、Omneon、Isilon、Verari、龙存科技等已经摩拳擦掌,而集群存储也将成为存储市场下一个时髦字眼。
从我们接触到的中国用户来看,能源行业、广电行业和科学计算等领域的用户成了集群存储市场上首批吃螃蟹的人。因为这些行业的用户越来越依赖大型的和日益增长的数据集,对于存储的性能和可靠性要求也非常高,而且在服务器集群方面也积累了很多经验,这些因素都有助于上述行业的用户了解和实施集群存储。
其实,集群存储的应用并不局限于某个行业或某个应用,只要存储的经济性与技术性能达到一定的要求,集群存储就是一种不错的选择。
为了让中国用户能够进一步了解集群存储的相关知识,我们邀请了多名业内专家,就集群存储的概念、采购和部署等方面的几个问题进行了解答,相信集群存储在性能和扩展性方面的特色会给您耳目一新的感觉。
什么是集群存储?
所谓集群存储是将多台存储设备中的存储空间聚合成一个能够给应用服务器提供统一访问接口和管理界面的存储池,应用可以通过该访问接口透明地访问和利用所有存储设备上的磁盘,可以充分发挥存储设备的性能和磁盘利用率。数据将会按照一定的规则从多台存储设备上存储和读取,以获得更高的并发访问性能。北京龙存科技有限责任公司CEO唐荣锋表示:“集群存储能够解决存储应用中的高带宽、并发访问、高可扩展性、易管理等各项需求。”
与传统NAS和SAN相比集群存储的优势何在?
传统的SAN与NAS分别提供的是数据块与文件两个不同级别的存储服务,集群存储也分为提供数据块与文件两个不同级别存储服务的集群存储系统。
集群存储的优势主要体现在提高并行或分区I/O的整体性能,特别是工作流、读密集型以及大型文件的访问,通过采用更低成本的服务器来降低整体成本。
SAN系统具有很高的性能,但是构建和维护起来很复杂。由于数据块和网络需求的原因,SAN系统也很难扩容。NAS系统的构建和维护虽然比较简单,但是由于其聚合设备(又叫做NAS头)是其架构上的瓶颈,造成其性能很有限。集群存储提供了SAN和NAS结构的优点。在大多数使用集群存储的案例中,随着存储系统的扩容,性能也随之提升。一个大的集群存储的性能往往胜过一个SAN系统,但是价格也会更高。集群存储系统像NAS系统一样易于构建、操作和扩容。大多数集群存储系统没有传统NAS系统的固有瓶颈。
集群存储有两种实现方式:一种是硬件基础架构加上软件,典型代表是SAN架构+IBM GPFS;另一种是专用集群存储,典型代表是Isilon、NetApp GX以及Panasas,其中NetApp GX是构建在NAS基础架构之上的,但是通过操作系统实现集群存储。从这个角度讲,集群存储与SAN或NAS不存在竞争关系,是实现不同存储需求的解决方案。”
集群存储和NAS的概念是在文件系统层面上的,而SAN是在LUN层面上的,集群存储可以利用SAN环境实现。因此,集群存储与SAN解决的问题不同。如果一定要比较这两者的优缺点的话,可以说SAN做到的是多个服务器节点可以同时看到SAN环境中的同一个LUN,还不能做到多服务器节点间的文件级共享。
集群存储在性能、可靠性及扩展性等多个方面都远远优于NAS。