允许快速和永久擦除的基于杂交的DNA信息存储制造技术

技术编号:28568164 阅读:18 留言:0更新日期:2021-05-25 18:06
本文提供了用于以允许快速和永久擦除信息的方式在DNA分子中编码信息的方法。同样地,还提供了擦除此类信息的方法。本文还提供了如此编码信息的组合物。

【技术实现步骤摘要】
【国外来华专利技术】允许快速和永久擦除的基于杂交的DNA信息存储相关申请的交叉引用本申请要求2018年5月23日提交的美国临时申请号62/675,362的优先权权益,该美国临时申请的全文以引用方式并入本文。关于联邦政府赞助的研究的声明本专利技术是在美国国立卫生研究院授予的政府拨款号R01HG008752的支持下完成的。政府对本专利技术享有某些权利。序列表的参考本申请包含序列表,该序列表已通过EFS-WEB以ASCII格式提交,并且以全文引用的方式并入本文中。所述ASCII副本创建于2019年5月15日,命名为RICEP0045WO_ST25.TXT,大小为6.1KB。
本文提供了编码、复制、擦除和解码DNA分子中的信息的方法。还提供了包含其序列编码这种信息的DNA分子的组合物。
技术介绍
随着现代数据存储需求呈指数级增长,由于传统的硅基材料达到制造的量子力学极限,因此需要新的高密度信息存储介质。此外,必须可靠地存档以进行长期存储和检索的非常重要的信息,需要可靠的存储方法,这些方法不需要常规复制即可保持信息的完整性;例如,磁带信息存储必须每10年“重写”一次。DNA分子中的信息存储是满足以上两个需求的新兴解决方案:DNA信息高度密集,并且化学半衰期非常长,据某些估计超过500年。此外,高通量DNA合成和DNA测序的最新进展表明,在5-10年的时间范围内,DNA可能与其他信息存储介质相比在经济上具有竞争力。由于这些原因,许多最新的出版物已经描述并证明了用于证明利用DNA进行信息存储的概念验证实验。在当今世界,数据隐私和安全性日益引起人们的关注,敏感数据涵盖了患者的病史、保密的公司文档以及政府和军事机密。为了促进对机密信息的适当保护,存储在介质中的信息必须能够快速和永久地擦除。但是,当今所有常见的数据存储方法都难以永久擦除。例如,对硬盘驱动器进行消磁或物理破坏通常是不完整的,并且仍可以通过专门的努力来恢复信息。原则上,信息编码的DNA序列同样可以通过漂白或酸处理擦除,但可能需要较长的反应时间和严格的混合以确保完全破坏信息。因此,需要用于在DNA中编码信息以允许快速和永久擦除的方法。
技术实现思路
本文提供了编码、复制、擦除和解码DNA分子中的信息的方法。与计算机文件的标准信息存储方法(例如,固态硬盘、磁带)和其他基于DNA的信息存储方法不同,所描述的方法允许快速和永久擦除信息。对于高度敏感或保密信息(包括军事文件、机密的法院记录和HIPAA保护的患者病历),这预计具有重要价值。在一个实施例中,提供了包含DNA分子群体的组合物,其中所述群体包含真信息DNA分子、假混淆DNA分子和真标记DNA寡核苷酸,其中所述真信息DNA分子和所述假混淆DNA分子各自包含与所述真标记DNA寡核苷酸的序列的一部分互补的第一序列,其中所述真信息DNA分子的第一序列与所述真标记DNA寡核苷酸杂交,其中所述假混淆DNA分子的第一序列不与所述真标记DNA寡核苷酸杂交,其中所述真信息DNA分子和所述假混淆DNA分子各自包含地址区域,其中每个真信息DNA分子的所述地址区域在所述群体中的真信息DNA分子中是唯一的,其中每个假信息DNA分子的所述地址区域在所述群体中的假信息DNA分子中是唯一的,其中所述群体中的一个真信息DNA分子和至少一个假信息DNA分子共享相同的地址区域。在一些方面,所述假混淆DNA分子的所述第一序列是单链的。在一些方面,所述群体进一步包含假标记DNA寡核苷酸。在某些方面,所述假标记DNA寡核苷酸的一部分与所述真信息DNA分子和所述假混淆DNA分子两者的第一序列至少部分地互补。在某些方面,所述假标记DNA寡核苷酸和所述真标记DNA寡核苷酸包含不同的序列。在某些方面,所述假标记DNA寡核苷酸包含化学功能化。在某些方面,所述假混淆DNA分子的第一序列与所述假标记DNA寡核苷酸杂交。在某些方面,所述假标记DNA寡核苷酸包含防止DNA聚合酶延伸的3'功能化。在某些方面,所述第一序列的长度介于10个至50个核苷酸之间。在某些方面,所述真信息DNA分子和所述假混淆DNA分子的长度各自独立地介于50个至2000个核苷酸之间。在某些方面,所述真信息DNA分子的第一区域朝着所述真信息DNA分子的5'末端定位。在某些方面,所述真标记DNA寡核苷酸包含不与所述真信息DNA分子互补的引物结合区域。在一个实施例中,提供了一种在DNA分子中编码信息承载文件或混淆文件的方法,所述方法包括:(a)获得ASCII/十六进制格式的输入文件;(b)独立地将每个ASCII字符/字节从十六进制的00至FF转换为5个核苷酸的DNA序列;(c)将代表整个输入文件的级联DNA序列划分为一组消息序列;(d)在DNA中提供并编码唯一的地址序列,所述地址序列鉴别每个消息序列在所述DNA序列内的位置;(e)设计真标记结合区域序列;(f)通过将所述真标记结合区域序列、所述唯一的地址序列和相应的消息序列从5'级联到3'来构建信息DNA分子序列;以及(g)化学合成包含所述信息DNA分子序列的信息DNA分子。在一些方面,所述信息DNA分子进一步包含位于所述信息DNA分子序列的5'末端和/或3'末端上的一个或多个引物结合区域。在一些方面,所述混淆DNA分子进一步包含位于所述信息DNA分子序列的5'末端和/或3'末端上的一个或多个引物结合区域。在一些方面,每个ASCII字符/字节转换为一个2位区域和两个3位区域,其中所述2位区域映射到G、C、A或T,并且其中3位区域各自映射到CA、CT、GA、GT、TC、TG、AC或AG。在一个实施例中,本文提供了通过本公开的实施例中任一项所述的方法制备的信息DNA分子群体。在一个实施例中,提供了一种用于制备编码适于快速擦除的信息的DNA溶液的方法,所述方法包括:(a)根据本公开的实施例中任一项所述的方法制备编码信息承载文件的信息DNA分子溶液;(b)使所述信息DNA分子溶液与真标记DNA寡核苷酸分子溶液杂交;(c)根据本公开的实施例中任一项所述的方法制备编码混淆文件的至少一种混淆DNA分子溶液;以及(d)将(b)部分的杂交溶液与(c)部分的至少一种混淆DNA分子溶液组合。在一些方面,所述方法进一步包括在(d)部分中结合之前,将所述至少一种混淆DNA分子溶液与假标记DNA寡核苷酸分子溶液杂交。在一些方面,所述真标记DNA寡核苷酸以摩尔量存在,所述摩尔量小于或等于信息DNA分子的摩尔量。在一些方面,所述假标记DNA寡核苷酸以摩尔量存在,所述摩尔量大于或等于混淆DNA分子的摩尔量。在一些方面,(b)部分的杂交包括将组合溶液加热至至少70℃,然后将组合溶液冷却至50℃或更低。在一些方面,在(d)部分中组合之前,使所述至少一种混淆DNA分子溶液与假标记DNA寡核苷酸分子溶液杂交包括将所述组合溶液加热至至少70℃,然后将所述组合溶液冷却至50℃或更低。在一个实施例中,提供了编码适于快速擦除的信息的DNA溶液,其通过本公开的实施例中任一项所述的方法制备。在一个实施例中,提供了擦除编码在本公开本文档来自技高网
...

【技术保护点】
1.一种组合物,所述组合物包含DNA分子群体,所述群体包含真信息DNA分子、假混淆DNA分子和真标记DNA寡核苷酸,/n其中所述真信息DNA分子和所述假混淆DNA分子各自包含与所述真标记DNA寡核苷酸的序列的一部分互补的第一序列,/n其中所述真信息DNA分子的所述第一序列与所述真标记DNA寡核苷酸杂交,/n其中所述假混淆DNA分子的所述第一序列不与所述真标记DNA寡核苷酸杂交,/n其中所述真信息DNA分子和所述假混淆DNA分子各自包含地址区域,/n其中每个真信息DNA分子的所述地址区域在所述群体中的所述真信息DNA分子中是唯一的,/n其中所述群体中的一个真信息DNA分子和至少一个假信息DNA分子共享相同的地址区域。/n

【技术特征摘要】
【国外来华专利技术】20180523 US 62/675,3621.一种组合物,所述组合物包含DNA分子群体,所述群体包含真信息DNA分子、假混淆DNA分子和真标记DNA寡核苷酸,
其中所述真信息DNA分子和所述假混淆DNA分子各自包含与所述真标记DNA寡核苷酸的序列的一部分互补的第一序列,
其中所述真信息DNA分子的所述第一序列与所述真标记DNA寡核苷酸杂交,
其中所述假混淆DNA分子的所述第一序列不与所述真标记DNA寡核苷酸杂交,
其中所述真信息DNA分子和所述假混淆DNA分子各自包含地址区域,
其中每个真信息DNA分子的所述地址区域在所述群体中的所述真信息DNA分子中是唯一的,
其中所述群体中的一个真信息DNA分子和至少一个假信息DNA分子共享相同的地址区域。


2.根据权利要求1所述的组合物,其中所述假混淆DNA分子的所述第一序列是单链的。


3.根据权利要求1所述的组合物,其中所述群体进一步包含假标记DNA寡核苷酸。


4.根据权利要求3所述的组合物,其中所述假标记DNA寡核苷酸的一部分与所述真信息DNA分子和所述假混淆DNA分子两者的所述第一序列至少部分地互补。


5.根据权利要求3所述的组合物,其中所述假标记DNA寡核苷酸和所述真标记DNA寡核苷酸包含不同的序列。


6.根据权利要求3-5中任一项所述的组合物,其中所述假标记DNA寡核苷酸包含化学功能化。


7.根据权利要求3-6中任一项所述的组合物,其中所述假混淆DNA分子的所述第一序列与所述假标记DNA寡核苷酸杂交。


8.根据权利要求3-7中任一项所述的组合物,其中所述假标记DNA寡核苷酸包含防止DNA聚合酶延伸的3'功能化。


9.根据权利要求1-8中任一项所述的组合物,其中所述第一序列的长度介于10个至50个核苷酸之间。


10.根据权利要求1-9中任一项所述的组合物,其中所述真信息DNA分子和所述假混淆DNA分子的长度各自独立地介于50个至2000个核苷酸之间。


11.根据权利要求1-10中任一项所述的组合物,其中所述真信息DNA分子的第一区域朝着所述真信息DNA分子的5'末端定位。


12.根据权利要求1-11中任一项所述的组合物,其中所述真标记DNA寡核苷酸包含不与所述真信息DNA分子互补的引物结合区域。


13.一种在信息DNA分子中编码信息承载文件或混淆文件的方法,所述方法包括:
(a)获得ASCII/十六进制格式的输入文件;
(b)独立地将每个ASCII字符/字节从十六进制的00至FF转换为5个核苷酸的DNA序列;
(c)将代表所述整个输入文件的所述级联DNA序列划分为一组消息序列;
(d)在DNA中提供并编码唯一的地址序列,所述地址序列鉴别每个消息序列在所述DNA序列内的位置;
(e)设计真标记结合区域序列;
(f)通过将所述真标记结合区域序列、所述唯一的地址序列和相应的消息序列从5'级联到3'来构建信息DNA分子序列;以及
(g)化学合成包含所述信息DNA分子序列的信息DNA分子。


14.根据权利要求13所述的方法,其中所述信息承载DNA分子进一步包含位于所述信息DNA分子序列的5'末端和/或3'末端上的一个或多个引物结合区域。


15.根据权利要求13所述的方法,其中所述混淆DNA分子进一步包含位于所述信息DNA分子序列的5'末端和/或3'末端上的一个或多个引物结合区域。


16.根据权利要求13所述的方法,其中步骤(b)包括将每个十六进制字符转换为其二进制的8位表示,然后将每个二进制的8位表示转换为一个2位区域和两个3位区域,其中所述2位区域映射到G、C、A或T,并且其中所述3位区域各自映射到CA、CT、GA、GT、TC、TG、AC或AG。


17.一种信息DNA分子群体,其通过权利要求13-16中任一项所述的方法制备。


...

【专利技术属性】
技术研发人员:D·Y·张A·平特金状元
申请(专利权)人:威廉马歇莱思大学
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1