生活中处处充满了数据
在地球上
我们每天都会产生
5亿条推文
400万GB的戴尔的数聊天数据
2940亿封电子邮件
……

根据IDC的数据 ,在2020年,科技全球创建 、越高有效捕获、据缩减比复制和消耗的提升数据总量约为64ZB,而到了2025年,存储全球数据总量可能会达到惊人的效率163ZB ,如果将其存储在艾字节数据中心里 ,戴尔的数整个数据中心可能有好几个足球场那么大 ,科技建造和维护成本高达数十亿美元 。越高有效
那么,高防服务器据缩减比有没有一种更有效的提升方式来存储这些数据呢?
当然是有的啦~许多科学家认为 ,另一种更加高效的存储解决方案就潜藏在我们的DNA当中:既然DNA能够承载遗传信息 ,那么它也能够储存数字信息。效率按照国际上广泛接受的戴尔的数说法,每一克DNA可存储215PB的数据。麻省理工学院生物工程教授马克·巴斯这样说到:
理论上 ,一个装满DNA的咖啡杯可以存储世界上所有的服务器租用数据。DNA的存储密度甚至比闪存要大一千倍,而当你制造出DNA聚合物后 ,它就不会消耗任何能量 ,你可以编写DNA,然后将其永久保存。

我们可以看到 ,相比于其他存储介质,将DNA作为存储介质拥有诸多优势 :
01
存储密度极高
每个核苷酸,最多相当于两个比特,约为1立方纳米。理论上讲 ,1立方毫米的DNA便能够存储大约1EB的数据,香港云服务器真正做到把EB级的数据“握到手心里”。
02
存储时间长
在合适的存储条件下,这些DNA可以存储上万年,且几乎没有后期维护成本 。
03
能耗极低
使用DNA作为存储介质无需额外的维护成本,由于其高密度的特性,存储数据不再像其他介质一样需要占用大量场地 ,能耗也远远小于传统介质 。
DNA的存储原理并不复杂 ,数字存储系统将文本 、照片等信息编码为0和1;同样的源码下载,遗传密码的四种核苷酸在DNA中编码为 :A、T、C和G。我们可以用0来表示G和C,用1来表示A和T。简单来讲就是用遗传代码ATGC来替代计算机的二进制代码。

整个DNA存储流程大致可以分为四个步骤:信息编码 、DNA合成 、DNA测序和信息解码 :
第一步:借助信息科学领域的编码算法,将数据转换为DNA中的四种碱基序列。云计算
第二步:利用DNA合成技术例如固相亚磷酰胺三脂法 、酶合成法进行DNA的合成 ,这一步骤相当于数据的写入 。
第三步:依靠基因测序技术,在众多信息中读取你所需要的DNA序列信息 。
第四步:将碱基序列重新转换成二进制序列,在经过纠错后便可得到原始数据。
当然 ,将DNA作为存储介质并不是一个新颖的话题 ,使用DNA存储数据的想法可以追溯到1959年 ,模板下载但以当时的技术条件,该项研究并未取得突破性进展。近年来 ,随着算力上限的不断突破、各科学领域不断交叉融合,才让几十年前近乎疯狂的想法逐渐变为可能 。
当然,人类在探索的路途中不止DNA存储一种,下一代颠覆性存储技术还有无惧湿热 、干冷的玻璃存储以及可行性更高的全息光存储 。我们可以发现,无论是哪一种存储技术 ,都在追求更小的体积和更大的容量,这也是存储的本质:通过提高读写效率以满足数据管理和数据应用的需求 。
尽管大规模使用下一代存储介质还不能完全实现,但我们一直在朝着这一方向努力着,例如数据缩减技术:在存储介质上保留一个唯一实例,将冗余数据替换为指向唯一数据副本的一个指针,从而做到在更少的空间储存更多的数据 ,节约存储成本并延长SSD的使用时间。越高的数据缩减比就意味着更多的有效空间,而这一比例也是衡量一款存储产品先进与否的重要标准 。
而在这方面,戴尔科技“第五代存储”家族的PowerStore绝对可以称作该领域的佼佼者,在不妥协性能的前提下至少实现4 :1的无损数据缩减