EMC不久前发布了最新的XtremIO全闪存阵列,这款阵列可以保证在寿命期限内故障时间不超过3分钟,X-Brick的SSD组件平均5年发生一次故障。
我们曾经报道过这个故障时间太长,但是XtremIO创始人(EMC收购XtremIO之后为XtremIO事业部总经理)Ehud Rokach在自己的一篇博客中提到我们的文章中的推测可能是错误的。
他表示在全球范围内客户一边选取了数百个XtremIO X-Brick节点进行了测试得出了以下几个结果:
·XtremIO完全可以保证99.9999%的可靠性(每年不超过32秒的故障时间,在整个使用期限内不超过3分钟的故障时间),
·我们的SSD平均使用寿命为922,240个小时(105年)
·我们的SSD年度更换率(Annual Replacement Rate, ARR)为0.009,对于一个25块SSD的X-Brick,一年内需要更换SSD的更换概率为(1-0.991^25),大约为0.2。
·平均每年0.2的更换率是基于我们客户的案例中的实际数据(未加进SSD资深耐磨损能力等相关的数据),所以你很可能5年才需要更换1个X-Brick中的1个SSD
很明显,他的苦心研究是说:“我们产品在实际应用中,SSD故障率以及阵列层面的可靠性上都是满足企业要求的。据我们的用户反馈,在数千块的XtremIO系统中也只是极少数的SSD出现的故障。”
再次进行一个提醒,从XtremIO首席技术专家Robin Ren那得来的信息,他说:“我们的设备出现故障的原因来源于多个方面,其中出故障的设备在我们的客户(现在已经部署了超过150个X-Brick节点)以及我们内部的设备(超过200套系统)都有。我们现在已经将这些问题进行了全面的分析并且已经淘汰了旧的技术。”
Rokach对Ren所提到的XtremIO故障问题的解释是:“在产品正式发售之前,确实有消息说发现了在测试阶段的设备中的SSD出现了故障。我们后来对两个故障案例进行了分析并进行了解决(升级固件)。毫无疑问的是,在我们的产品正式的发售之后到现在我们并没有接收到任何SSD故障的反馈(包括用户在用的以及其他测试设备)。”
XtremIO数据保护方面主要是靠XDP技术,这是一种专门用于闪存的算法,可防止SSD故障,同时使可用容量比传统RAID多6倍。XDP使最终用户能够100%地使用XtremIO的容量,同时保持最高性能,而其他全闪存阵列在达到容量的60%至80%时,性能会开始下降。这意味着,与其他全闪存阵列相比,XDP多提供多达40%的可用容量。此外,在长期生产数据中心条件下,高效率XDP算法的性能和闪存耐用性比RAID高4倍。