一种利用DNA进行信息存储的方法技术

技术编号：15640096 阅读：58 留言：0更新日期：2017-06-16 03:44

本发明专利技术涉及一种利用DNA进行信息存储的方法，其包括（1）将计算机原始文件二进制信息转化为四进制并进而编码转换成DNA全序列，其中二进制代码00、01、10、11分别对应转换为A、T、C、G四种脱氧核糖核苷酸；（2）将DNA全序列分成多个DNA片段，并组织构建长度为90‑110nt且包括由DNA片段构成的插入核苷酸编码序列、位于两端的侧翼引物序列以及位于各侧翼引物序列内侧的索引编码序列的输出DNA序列；（3）根据输出DNA序列合成人工DNA序列并保存。本发明专利技术方法具有通用性好，能够简化运算、提高DNA信息存储的连续性、存储效率和密度，以及可降低错误率和降低序列合成和检测成本等显著优势。

全部详细技术资料下载

【技术实现步骤摘要】
一种利用DNA进行信息存储的方法
本专利技术属于信息存储
，具体涉及一种利用人工合成DNA进行信息存储的方法。
技术介绍
近年来，全球数字化信息正在经历爆炸性增长，预计到2017年，全球数字化保存的资料需求将超过16泽它字节(ZB，zettabytes)，因此迫切需要开发出可靠的、用于大规模数字化信息管理的信息存储介质。然而，现有存储介质的容量并不能跟上数字化信息增长的速度。目前主要的存储介质是磁性和光学介质：磁性介质是目前市售的最密集的存储形式，磁带能存储高达185TB的数据，存储密度约10GB/mm3；最近还有研究报告了光盘存储1PB数据、约100GB/mm3的存储密度的可行性。尽管有种种改进，这些介质存储泽它字节的数据仍然需要数百万单位和大量物理空间。另外，存储密度只是信息存储的一个方面，耐久性也十分关键。目前，常规存储技术的耐久性十分有限，旋转盘的额定使用年限为3-5年，而磁带为10-30年，因此信息长期存储的解决方案仍需要擦除和更新损坏数据，以替换故障单元。综上，如果要保存全世界的数据，需要开发出具有更高存储密度和耐久性的存储介质。脱氧核糖核酸(deoxyribonucleicacid，DNA)，又称去氧核糖核酸，是一种由脱氧核糖、磷酸以及四种碱基(腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)、鸟嘌呤(G))组成的生物大分子，其主要生物功能是生物信息存储。DNA可组成遗传指令从而引导生物发育与生命机能运作，这一过程是建构细胞内其他的化合物所必须的。自1988年第一次提出使用DNA存储信息以来，由于其高密度和长期稳定性(半衰期>500年)...
一种利用DNA进行信息存储的方法

【技术保护点】
一种利用DNA进行信息存储的方法，其包括（1）将计算机中的原始文件信息转换为A、T、C、G四种脱氧核糖核苷酸表示的DNA全序列；（2）将步骤（1）所得DNA全序列打断分成多个DNA片段，然后分别将多个DNA片段进行组织构建获得多个输出DNA序列；（3）根据输出DNA序列合成相应的人工DNA序列并进行保存，其特征在于：步骤（1）中，读取原始文件信息的二进制信息，将其转换为四进制，并进而编码转换成DNA全序列，其中所述转换关系为：二进制代码00、01、10、11分别对应转换为A、T、C、G四种脱氧核糖核苷酸；步骤（2）中，各所述输出DNA序列包括由各所述DNA片段构成的插入核苷酸编码序列、分别位于所述插入核苷酸编码序列两端用于扩增和测序的侧翼引物序列以及位于各所述侧翼引物序列内侧用于指示信息恢复过程中数据块的位置的索引编码序列，所述输出DNA序列的长度为90‑110nt。

【技术特征摘要】
1.一种利用DNA进行信息存储的方法，其包括（1）将计算机中的原始文件信息转换为A、T、C、G四种脱氧核糖核苷酸表示的DNA全序列；（2）将步骤（1）所得DNA全序列打断分成多个DNA片段，然后分别将多个DNA片段进行组织构建获得多个输出DNA序列；（3）根据输出DNA序列合成相应的人工DNA序列并进行保存，其特征在于：步骤（1）中，读取原始文件信息的二进制信息，将其转换为四进制，并进而编码转换成DNA全序列，其中所述转换关系为：二进制代码00、01、10、11分别对应转换为A、T、C、G四种脱氧核糖核苷酸；步骤（2）中，各所述输出DNA序列包括由各所述DNA片段构成的插入核苷酸编码序列、分别位于所述插入核苷酸编码序列两端用于扩增和测序的侧翼引物序列以及位于各所述侧翼引物序列内侧用于指示信息恢复过程中数据块的位置的索引编码序列，所述输出DNA序列的长度为90-110nt。2.根据权利要求1所述的利用DNA进行信息存储的方法，其特征在于：步骤（2）中，所述输出DNA序列的长度为100nt。3.根据权利要求1或2所述的利用DNA进行信息存储的方法，其特征在于：步骤（2）中，各所述侧翼引物序列的长度为18-22nt，各所述索引编码序列长度为6-10nt。4.根据权利要求1所述的利用DNA进行信息存储的方法，其特征在于：当所述插入核苷酸编码序列、两侧翼引物序列、两索引编码序列的长度之和小于设定的输出DNA序列的长度时，在末端用随机序列补足。5.根据权利要求1所述的利用DNA进行信息存储的方法，其特征在于：步骤（2）中，按照同一设定序列长度对所述DNA全序列进行打断，且所述...

【专利技术属性】
技术研发人员：杨平，蔡晓辉，钟云鹏，盛付旭，李彦敏，祁姗姗，齐金才，田净净，朱沛煌，
申请(专利权)人：苏州泓迅生物科技股份有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人