DNA活字存储系统和方法技术方案

技术编号:26170761 阅读:44 留言:0更新日期:2020-10-31 13:39
本发明专利技术公开DNA活字存储系统和方法。DNA活字存储方法包括提供内容活字实物库和索引活字实物库;将目标文件中的待储存数据拆分为多个数据元素,并针对各数据元素标注索引信息,将数据元素的内容信息对应至内容活字实物库中的特定内容活字寡核苷酸片段,将索引信息对应至索引活字实物库中的特定索引活字寡核苷酸片段;然后,将内容活字寡核苷酸片段和索引活字寡核苷酸片段连接构成DNA活字单元,由多个DNA活字单元构成保存有全部待储存数据元素的DNA存储文件。本发明专利技术的DNA活字实物库可一次合成,多次重复使用,自由组合,极大降低DNA合成成本,且可以避免多次设计及合成DNA片段的人工与时间投入,并避免引入大量纠错序列所带来的成本负担。

【技术实现步骤摘要】
DNA活字存储系统和方法
本专利技术涉及DNA存储领域,具体地涉及一种基于DNA活字思想的存储系统和方法。
技术介绍
DNA存储技术是一种新兴的大数据存储技术,其突破了传统的以固体介质,例如硬盘、光盘、可移动磁盘等为媒介的存储方式。利用DNA碱基天然的信息存储能力,依据一定规则将文本、图片、声音、影像文件等传统数据0-1二进制编码转换为DNA(脱氧核糖核酸)核苷酸四进制编码(A、T、C、G组合),然后通过人工合成特定序列的DNA来存储文本、图片、声音以及视频文件等数据,并在随后利用相应的解码手段完整读取还原数据。简言之,DNA存储技术是利用人工合成特定序列DNA而实现数据编码存储和读取的技术。相比于现有的数据信息存储方式,DNA存储技术具有数据密度高、保存时间长、配套设备能耗低、便于携带、运输隐蔽性高和便于多重加密等优点。DNA保存数据和信息的想法提出较早,但直到2005年以后,随着高通量DNA合成技术和测序技术的飞速发展,DNA存储技术才开始有了实质性的进步。2007年,日本NozomuYachie等人首次利用16进制转码技术成功实现本文档来自技高网...

【技术保护点】
1.一种DNA活字存储方法,其特征在于,包括以下步骤:/n(1)提供内容活字实物库和索引活字实物库,其中,所述内容活字实物库由单独存放的多种内容活字寡核苷酸组成,每种内容活字寡核苷酸的碱基序列分别对应于待储存数据的不同数据元素的内容信息;所述索引活字实物库由单独存放的多种索引活字寡核苷酸组成,每种索引活字寡核苷酸的碱基序列分别对应于不同的索引信息;/n(2)将目标文件中的待储存数据拆分为多个数据元素,并针对各数据元素标注索引信息,针对每个数据元素内容信息,根据内容活字关联表将数据元素编码为碱基序列,并根据该碱基序列将数据元素内容信息对应至所述内容活字实物库的内容活字寡核苷酸;针对每个数据元素的...

【技术特征摘要】
1.一种DNA活字存储方法,其特征在于,包括以下步骤:
(1)提供内容活字实物库和索引活字实物库,其中,所述内容活字实物库由单独存放的多种内容活字寡核苷酸组成,每种内容活字寡核苷酸的碱基序列分别对应于待储存数据的不同数据元素的内容信息;所述索引活字实物库由单独存放的多种索引活字寡核苷酸组成,每种索引活字寡核苷酸的碱基序列分别对应于不同的索引信息;
(2)将目标文件中的待储存数据拆分为多个数据元素,并针对各数据元素标注索引信息,针对每个数据元素内容信息,根据内容活字关联表将数据元素编码为碱基序列,并根据该碱基序列将数据元素内容信息对应至所述内容活字实物库的内容活字寡核苷酸;针对每个数据元素的索引信息,根据索引活字关联表将索引信息编码为碱基序列,并根据该碱基序列将索引信息对应至所述索引活字实物库中的索引活字寡核苷酸;
(3)将步骤(2)中的内容活字寡核苷酸和索引活字寡核苷酸连接构成对应于每个数据元素的DNA活字单元,由多个DNA活字单元构成保存有全部待储存数据的存储文库。
(4)对(3)中存储文库中的寡核苷酸进行测序,并根据内容活字关联表、索引活字关联表及相应的解码软件将测序结果解码为储存数据。


2.根据权利要求1所述的DNA活字存储方法,其特征在于,所述待储存数据选自文本数据、图像数据、音频数据和视频数据中的至少一种。


3.根据权利要求1所述的DNA活字存储方法,其特征在于,所述数据元素选自字符、像素点、音频波幅、视频帧中的至少一种;所述索引信息包括数据元素的位置信息和文件属性信息。


4.根据权利要求3所述的DNA活字存储方法,其...

【专利技术属性】
技术研发人员:陈非卜东波马灌楠王晨阳邢晶
申请(专利权)人:中国科学院北京基因组研究所国家生物信息中心
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1