用于数据存储的合成DNA

DNA是存储数字数据的一种强大而密集的替代品
2022年3月18日
通过Evelyna王

DNA-DATA.jpg

带有二进制数据(1和0)的DNA

分享

一项新的研究表明,合成DNA现在可以存储数据了……

每天都会产生数万亿字节的数据。这相当于每天生成的MP3音乐将近200万年的总量。不可避免地,所有这些数据都需要存储。

当前形式的数据存储,如硬盘驱动器或cd / dvd,在给定空间中存储的数据量有限。但是随着数据量的增加,需要更高密度的数据存储方法。

一种选择是DNA,它存储数据的密度是硬盘的1000多倍。DNA也令人难以置信的健壮,可以保持可读的时间远远超过普通硬盘驱动器的使用寿命。

一条DNA链类似于一条长链,其中DNA链中的每个链接称为核苷酸。特定的核苷酸序列可以用来编码数据位。每个位不是1就是0。

正如Olgica Milenkovic所解释的那样,“有四种自然产生的核苷酸,A, T, C, G,每个核苷酸可以存储两个比特,A为(0 0),T为(0 1),G为(1 1),C为(1 1)。”因此,一串读取“AGCTA”的DNA翻译成数据序列“0 0 1 0 1 1 0 0 0”。

但是如果使用八种类型的核苷酸,每个核苷酸(0 0 0),(0 0 1),(0 0 0),(0 0 0),(0 0 1),(0 0 1),(0 0 1),(1 0 0),(1 0 0),(1 1 0 0)和(1 1 1)可以存储50%以上的信息,即三个比特。这意味着相同数量的数据可以存储在更短的DNA字符串中。

现在,米连科维奇在4个天然核苷酸的基础上又添加了7个人工合成的核苷酸,形成了一个由11个DNA字母组成的基因字母表,而不仅仅是4个。这大约使DNA数据密度增加了一倍。

但是一旦数据被存储,它就需要被访问和读取。要做到这一点,可以使用一种称为纳米孔测序的技术。DNA通过一个小孔输送,就像项链上的珍珠被拉过橡胶片一样。当每颗珍珠“弹出”时,它会产生一个与该基因字母相对应的特征输出信号。

虽然纳米孔技术通常用于读取天然DNA,但它也能够读取新的合成DNA字母。

当前DNA数据存储的挑战是写入数据所需的时间。拼凑出一个精确的DNA序列可能需要几个小时。因此,它解决了我们的一些数据存储问题,但仍有工作要做!

评论

考虑到计算机数据的随意性,如果(不是如果)由于某人存储了新的数据而产生了新的病毒DNA序列,会发生什么?你是建议隔离存储设备吗?例如,Covid-19的基因组中只有29900个碱基对,你可以“在硬盘上”构建它,或者用更糟糕的方法进行实验。

单独来看,基因序列是无害的。天花基因组最终还是被解码和储存起来了。只有当这个基因序列被放置在一个环境中,它编码的指令可以被翻译成一个有生命的实体,才会有问题。

添加注释