什么是集群存储?
集群,可提供按比例增加的服务器或存储资源的性能、容量、可靠性及可用性,突破了单机设备的种种限制,已成为被广泛使用的技术。传统的存储系统由于其物理组成(如磁盘驱动器数量、所连接的服务器数量、内存大小以及控制器性能)的限制,会造成很多功能上的局限,如支持文件系统的数量、快照或复制的数量等等。企业一旦遇到存储系统的瓶颈,就只能不断的升级到更大的存储系统并添加更多的管理工具。
集群存储是通过将数据分布到集群中各节点的存储方式,提供单一的使用接口与界面,使用户可以方便地对所有数据进行统一使用与管理。集群中所有磁盘设备整合到单一的共享存储池中提供给前端的应用服务器,极大提高了磁盘利用率,可以为非结构化数据提供具备极高IO带宽和灵活可扩展性的存储解决方案。
对于集群存储产品的实际能力的评估,主要通过其容量及性能伸缩的能力,可访问性(Accessibility,块或文件级)、可用性和使用的难易程度的几方面来考核。不过,集群存储并非就是那些高不可攀的、联合HPC(High performance computing,高性能计算)环境一起使用的大型顺序带宽(Sequential bandwidth)或并行文件系统的代名词,多用途的集群存储支持传统的商业应用,如电子邮件、数据库和在线事务处理(OLTP)等。
此前,跟各位读者分享了集群存储的概念,这里再与各位分享一下集群存储的六大特点:
1. 开放式架构(高扩展性)
它针对集群存储内部构成元素而言。一般集群存储应该包括存储节点、前端网络、后端网络等三个构成元素,每个元素都可以非常容易地采用业界最新技术而不用改变集群存储的架构,且扩展起来非常方便,像搭积木一样进行存储的扩展。特别是对于那些对数据增长趋势较难预测的用户,可以先购买一部分存储,当有需求的时候,随时添加,而不会影响现有存储的使用。
2. 分布式操作系统
这是集群存储的灵魂所在。所有对集群存储的操作都经由分布式操作系统统一调度和分发,分散到集群存储各个存储节点上完成。使用分布式操作系统带来的好处是各节点之间没有任何区别,没有主次、功能上的区别,所有存储节点功能完全一致,这样才能真正做到性能最优。
3. 统一命名空间
统一命名空间在很多厂家的存储概念中都出现过。在集群存储中,统一命名空间强调的是同一个文件系统下的统一命名空间。它同样可以支持上PB级别的存储空间。如果是通过将若干有空间上限的卷挂载到某一个根目录的方式来达到统一命名空间,其效率和出现存储热点时的性能将会大大低于把上PB级别的存储空间置于同一个文件系统下管理的统一命名空间。
4. 易管理性
目前存储业界的管理方式都是通过各厂商的管理工具,或通过Web界面进行管理和配置,往往客户端还需要安装相关软件才能访问到存储上的空间。随着需要管理的存储空间逐渐增大,管理存储的复杂度和管理人员的数量也将会随之增加。而集群存储应该提供一种集中的、简便易用的管理方式,对客户端没有任何影响,采用业界标准的访问协议(比如NFS,CIFS)访问集群存储。
5. 负载均衡
集群存储通过分布式操作系统的作用,会在前端和后端都实现负载均衡。前端访问集群存储的操作,通过几种负载均衡策略,将访问分散到集群存储的各个存储节点上。后端访问数据,通过开放式的架构和后端网络,数据会分布在所有节点上进行存放和读取。
6. 高性能
关于高性能领域,目前对集群存储的讨论还仅局限在高带宽、高并发访问的应用模式下。毫无疑问,集群存储对于该类应用可以提供比传统存储架构更优的性能。但目前应用除了高带宽、高并发访问类的之外,还有高IOPS、随机访问、小文件访问以及备份归档等其他类的应用,集群存储应该在以上领域同样提供高性能的解决方案。