企业必须跟上非结构化文件数据增长的趋势。虽然网络附属存储(NAS)是存储这类数据的最佳选择,但是在保持应用性能不降低的条件下经济有效地扩展NAS的方案却比较有限。
更为糟糕的是,目前有很多企业存储设备都是用来存储非活跃数据。因此,厂商们推出了存储分层解决方案并为各个层级提供优化媒体类型。 但是分层存储会增加滞后时间,而用户最关心的问题就是不能降低性能或增加滞后时间。
多长的滞后时间是可接受的呢?这个问题的答案因人而异。 对于可视效果和计算机制图来说,0.2毫秒的滞后时间是可以接受的,而在数据库应用领域,1毫秒以内的滞后时间就堪称完美了。另一方面,如果用户只是使用一些常规的应用程序,那么可接受的滞后时间范围就可以更大一些。
分层存储技术在归档应用滞后时间方面的表现略有不足。利用最流行的文件服务标准检测程序进行检测,目前整合分层存储技术的最高端NAS设备的最短滞后时间为0.4毫秒。 这绝对是目前经过检测的高端NAS解决方案中表现最好的解决方案。由于标准检测增加了客户端负载,滞后时间增加到0.8毫秒。
这说明了什么?
这个问题与分层存储设备中使用的不同媒体没有多大关系,但是与基础体系结构却有很大关系。任何NAS设备实际上都是由处理器、内存和I/O组成的一台服务器。 NAS设备有别于通用文件服务器的地方是它采用了定制文件系统以及附带了许多用来保护或优化数据存储的应用软件。
分层存储体系结构通常采用群集文件系统,加入了很多个节点,各节点之间可以进行负载均衡,可以在NVRAM和磁盘之间移动数据,托管RAID控制器,管理文件系统元数据以及执行数据保护应用软件等。问题是,NAS控制器需要执行很多占用系统带宽的任务。 它最重要的功能就是有序存储、检索和保护用户数据,而不是提供高性能。
问题是,企业如何在可扩展容量和可扩展性能这两方面达到完美平衡呢?
这就需要在NAS中设置一个性能层级,它是由Flash闪存等高速处理媒体构成。它不用承担减少滞后时间的责任,比如执行一个文件系统。 它的工作就是为活跃数据提供高速缓存,加快NFS处理速度以便让客户端可以快速检索到数据。 它会将新写入的数据移动到后台NAS,这样增加的滞后时间是最小的,大概只有10微秒。
这样的系统应该可以保证整体滞后时间在0.2毫秒以内,连同它支持的NAS在内,而且在客户端工作负载发生变化时也可以依附于这个水平的滞后时间。这是可以实现的,因为性能设备经过了调整,可以加快NFS数据存取速度。
有了这样一个性能层级,进入NAS的流量就会大大减少,这就意味着NAS的效率可以大大提高。 这样,它只需要更少的磁盘和控制器就能达到性能要求。整台设备就象一个高速缓存一样运行,存储最活跃的数据,支持多台NAS设备,无负面影响地提供分层存储的优势。
性能层级提供的低滞后时间还有助于在原始性能不能满足要求时进行整体存储管理。例如,性能读取高速缓存可以在保证所需性能的情况下减少昂贵的存储设备的需求量,用户可以用廉价的SATA磁盘来增加这些设备的存储容量,而无需使用SAS或光纤通道磁盘。
当工作区主要位于高速缓存时,这是可以实现的。正如标准文件服务检测程序所检测出的结果显示的那样,写数据流量大约占整个数据流量的10%左右。通过提供非常低的非写入数据滞后时间,增加滞后时间会降低磁盘的IOPS性能。 例如,增加SATA磁盘后,提供的IOPS性能会比使用SAS磁盘时的性能低45%,整体滞后时间可能会增加1.8毫秒,但是整体滞后时间仍然能保持着3毫秒以内,这仍然满足企业的性能要求。
引进性能层级设备可以让企业获得更好的滞后时间,并且在无负面影响的情况下享受分层存储技术的优势,同时保证较高的性能。
管理员可以选择将这些性能提升直接授权给用户或用于抵销使用较低性能媒体储存非活跃数据造成的性能下降。性能层级设备不但可以大幅提高性能,而且还可以为公司节约大量的资金、能源、空间和冷却成本。 通过减少提供性能和容量时对NAS和相关数据保护应用的依赖性可以实现更大的成本效率。仅磁盘成本节约一项就非常可观。