DNA:终极数据存储方式

  北京时间8月18日消息,据国外媒体报道,在谈到信息存储时,硬盘完全不能和DNA相提并论。在人类的基因序列中,1克的重量就可以包含几十亿GB的数据,而1毫克分子的信息存储空间就可以包含美国国会图书馆全部的书籍,并且还有剩余。在过去,这些只是理论上的概念。现在,最新的一项研究表明,研究人员可以把一部遗传学教科书的内容存储到1微微克(picogram,相当于万亿分之一克)DNA中,这一技术上的突破很可能会革命性的提升人类存储信息的能力。

DNA:终极数据存储方式

DNA的四种脱氧核苷酸(A,G,C,T)可被用来对数据进行编码


  过去,有些研究团队一直试图向活细胞中的基因组写入数据,但是这种方式有一些不足之处。首先,细胞会死亡,这并不是你存储学期论文的好方法。另外,细胞还会分裂、复制,其中会不断发生变异,从而改变数据的内容。


  为了解决这些问题,一个由波士顿哈佛医学院合成生物学家乔治-丘奇(George Church)领导的研究团队发明了一种DNA信息归档系统,完全不需要利用细胞。相反,利用的是一台喷墨打印机,从而将化学合成的一小段DNA嵌入到一块微型玻璃芯片的表面。为了给数字文件进行编码,研究人员把文件划分为微小的数据块,并把这些数据块以A、C、G、T(DNA的四种脱氧核苷酸)的字母组合来表示,放弃了过去在计算机上的1和0编码方法。每条DNA片段还包含了一个数字“条码”,用来记录数据在原文件中的位置信息。在读取信息时,需要DNA测序仪和电脑将所有片段按序重新组合起来,并转换为数字的格式。计算机还需要负责处理错误信息,因为每个数据块都可能会被复制上千次,经过比对,任何小错误都可以被发现和纠正。


  为了证实这一系统在实际应用中的能力,该团队使用了这种DNA芯片将丘奇同他人合著的一本遗传学书籍进行了编码。他们成功了。在将书籍内容转换为DNA的信息、并将其翻译成数字存储模式后,该系统显示的出错率为每百万比特仅两个错误,相当于一些小小的拼写错误。这同DVD的性能差不多,远远好过硬盘。本周五,该团队在《科学》杂志上发布的报告称,考虑到DNA芯片的体积非常小,它成为了目前世界上最密集的信息存储介质。


  不过,你最好别急着将闪存上的数据复制到基因存储上。美国马里兰州罗克维尔市克雷格-文特尔研究所的合成生物学家丹尼尔-吉布森(Daniel Gibson)表示,DNA测序仪和其他设备的成本相当高,目前还不适宜推广,但是这一领域发展迅速,这项科技将会变得更便宜、更快速和更轻便。吉布森过去领导的研究团队曾合成了世界上第一个最完整的基因组,并在DNA中加入了一些额外的信息作为“水印”。不过,这些研究人员使用的是三个字母的编码系统,要比丘奇团队的效率低一些,但是却成功阻止了活体细胞的复制,从而不会将DNA转换为蛋白质。吉布森说,“如果DNA要被用来存储信息,并且使用环境不在实验室里,那么你还需要DNA测序仪的帮助,而这是很不现实的。”丘奇不同意这种观点。他表示,除非某人有意识的“破坏”他的DNA数据存储系统,否则信息将非常安全。