天津大学的科学家从活的大肠杆菌细胞中存储和检索了445KB的数字数据,并表示大肠杆菌是一种稳定的DNA存储介质。
到目前为止,存储在DNA中的数字数据使用的是存储在玻璃瓶或类似容器中的合成DNA。中国的一个科研团队通过将合成DNA插入活细胞,然后在细胞复制后检索数据来实现这一目标。
研究人员说,人工存储的DNA,无论是在试管中还是在玻璃中,通常使用的是DNA片段长度从100到200个核苷酸不等的短片段。但按他们的方法,储存在体内(活细胞)使用更大的片段,多达11520个核苷酸。
使用DNSA在细菌细胞中存储数据的示意图。
随着细胞的繁殖,它们产生新的细胞,这些细胞携带插入的携带数字数据的DNA片段。研究人员说:“活细胞的基因组维持机制确保了DNA分子的高保真度复制。”这意味着可以从比初始数量更多的细胞中提取碎片,也意味着可以期待更高的稳定性和更长的存储期。“
详细信息在《自然》杂志上,研究人员研究了寡核苷酸,寡核苷酸是DNA的短链。他们使用了超过10000个包含2304个千位对(kbps)的寡核苷酸。这是DNA长度测量单位,等于1000个碱基对。碱基对是四个DNA碱基中的两个结合,意味着腺嘌呤和胸腺嘧啶,胞嘧啶和鸟嘌呤。
源二进制数据被编码到由四个碱基(A、C、G和T)组成的4个字母的DNA字母表中。在软件层面,编码冗余度为1.56%,可以忍受某些寡核苷酸的物理损失。他们建立了多达11,520个不同的寡核苷酸的寡核苷酸池。他们被组装成质粒载体,一种在细胞内独立复制的双链环状DNA分子。这些细胞以多余的方式组装起来,然后储存在一个混合的大肠杆菌培养固体板或液体培养基中。在那里,细胞繁殖并形成菌落。
质粒在细胞中基于DNA的数据存储中的用途。
在大肠杆菌细胞的混合培养中,这种寡核苷酸的数量即使在多次分裂和分裂操作中也保持稳定,即将一种培养基分成两种,再继续生长,然后再次分裂。
通过DNA测序读取细胞的数字数据内容,发现是正确的。阅读过程涉及携带数字信息的质粒,从一个大的液体培养物中分离出来。然后通过消化过程恢复大量寡核苷酸。宿主细胞自身的DNA几乎没有受到污染,这些污染是可用生物试剂去除的。
总而言之,研究人员总结道:“DNA储存在细胞内具有明显的优势,可以长期稳定地维持DNA,复制的成本也非常低。”
他们声称,他们的工作“是迄今为止报道的最大规模的活细胞档案数据存储,为生物数据存储铺平了道路,以经济高效的方式同时利用了体外合成能力和活细胞的生物能力,这对于大规模开发实用的冷数据存储至关重要。