研究员们还强调称,预计到2020年存储于计算机中的全部数据——包括归档、视频、图片、企业系统数据以及移动设备信息——将达到44万亿GB,这一数字来自IDC与EMC的研究报告。
“这相当于2013年全部数据总量的十倍。虽然并非全部信息都需要进行长期保存,但可以肯定的是数据存储设备的增长速度完全跟不上数据的产生速度。”
不过在投入商业使用之前,DNA存储系统还需要克服一系列难题。首先,DNA合成与测序的效果还远称不上完美,每核苷酸中仍存在1%的排序错误率。因此,DNA存储需要设计出合适的编码方案,从而带来额外的容错能力。
再有,DNA存储不擅长实现随机数据存取,这意味着整体而言读取延迟远高于写入延迟。目前的进展只能够实现大型数据块存取;即使仅读取单个字节,也必须对整套DNA库进行测序与解码。
科学家们已经提出了对应的解决方案,即利用聚合酶链式反应(简称PCR)对需要的数据进行定向放大,从而通过针对性测序改善随机接入能力。如此一来,我们将不再需要对整套DNA库进行测序。
“这是我们借用大自然产物的绝对实例,”Ceze解释称。“但我们也在使用现有计算机技术对其加以完善,例如如何纠正内存错误,并让最终成果回归自然。”