当前位置: 首页 > 专利查询>宋理富专利>正文

一种聚合物分子信息存储纠错编解码系统技术方案

技术编号:22004947 阅读:39 留言:0更新日期:2019-08-31 06:44
本发明专利技术属于信息存储技术领域,公开了一种聚合物分子信息存储纠错编解码系统。该编解码系统将聚合物单体以具有校验功能的方式插入聚合物分子序列内,结合其它路径保护编解码策略实现高容错路径保护编解码。该编解码系统不仅保证了存储的信息能够得到精准解码,同时显著降低了大规模信息编解码计算复杂度,提高了解码速率。该编解码系统首次实现了聚合物分子序列编码信息对聚合物降解引起的链断裂导致的编码信息丢失与错误的高度耐受能力。该编解码系统对聚合物分子序列中出现的单体插入、删除及替换错误,同样具有极高的纠正能力和纠正效率,保证了聚合物分子信息存储的可靠性周期得到有效延长。

An Error Correction Coding and Decoding System for Polymer Molecular Information Storage

【技术实现步骤摘要】
一种聚合物分子信息存储纠错编解码系统
本专利技术属于信息数据存储
,具体涉及一种聚合物分子信息存储纠错编解码系统。
技术介绍
世界范围的数字化浪潮带来全球数字信息的指数增长。据估计,到2040年,传统硅基存储介质将由于原料不足而无法满足全球数字信息的存储需求。寻找替代型存储介质是亟待解决的全球危机之一。以核酸信息存储技术为代表的聚合物分子信息存储技术以含不同单体的聚合物分子作为信息存储介质,通过聚合物合成技术实现对数据信息的记录和存储,具有数据存储密度高、保存时间长和后续维护成本低等显著优势,是目前解决全球数据存储危机的最有前景的技术。但现阶段已有的聚合物分子存储技术的编解码方案均依赖各类传统的纠错编码技术,无法有效抵抗聚合物降解引起的链断裂对数据准确性的影响,而且解码过程需要对大规模聚合物序列进行聚类计算,计算复杂度高,难以满足可靠大规模数据存储的需求。
技术实现思路
为了解决现有技术存在的上述问题,本专利技术目的在于提供一种聚合物分子信息存储纠错编解码系统。本专利技术所采用的技术方案为:一种聚合物分子信息存储纠错编解码系统,该系统包括:路径保护编码单元,用于以路径保护的编码方式将二进制信息转码为N进制聚合物分子信息编码,其中N为聚合物分子单体类型数;路径搜索解码单元,用于以路径搜索和路径校验的方式将聚合物分子序列数据信息中序列长度不一和包含有随机单体替换、删除与插入错误的数据信息解码为二进制信息。优选地,路径保护编码单元包括索引模块、路径校验编码模块、转码模块和校验单体插入模块;索引模块能够生成系列索引A,并以预设长度将待存储二进制信息分配至索引A;索引A经预设算法生成相对应的索引B;预设算法包括伪随机函数法和哈希算法;索引A与索引B构成双索引;路径校验编码模块包括路径校验码,路径校验码是索引A和分配至该索引A的二进制信息经预设算法生成的;预设算法包括循环冗余校验算法;索引A、二进制信息、索引B和路径校验码组成第一信息码矩阵;转码模块能够根据预设的二进制比特序列-N进制聚合物单体序列对应规则,将任意一个二进制信息序列转码为相对应的N进制聚合物序列,或将任意一个N进制聚合物序列转码为相对应的二进制比特序列;校验单体插入模块能够根据预设的校验规则选取方式在预设的校验单体校验规则序列表中选择初始的校验规则,之后根据预设的校验单体校验规则序列表依次选取对应的校验规则进行校验单体的插入;第一信息码矩阵经转码模块和校验单体插入模块编码后生成N进制的第二信息码矩阵。优选地,索引A为至少一个特定长度且值唯一的二进制信息序列;二进制比特序列-N进制聚合物单体序列对应规则为具有特定长度的任意二进制比特序列分别具有相对应的特定长度的、唯一的N进制聚合物单体序列;二进制比特序列的特定长度不小于1个位;N进制聚合物单体序列对应规则的序列特定长度不小于1个位。本专利技术提供的该特定长度的二进制信息序列是指将待储存信息转换为相对应的二进制信息(可以利用现有技术,例如选取待储存信息后传输至计算机终端,经过计算机终端对待储存信息中所含信息的计算或识别为二进制信息),根据本专利技术预设的每条二进制信息序列的长度将上述二进制信息进行分离,分离后得到预设长度的二进制信息序列,该特定长度与本专利技术预设的二进制序列长度一致。特定长度的N进制聚合物单位序列是根据上述特定长度的二进制信息序列经过转码得到的,其长度与每条二进制信息序列长度相匹配。优选地,校验单体校验规则是由至少一组符合预设要求的双单体组合分组,且每个分组都分配一个独特的单体类型作为校验单体;预设要求为每个分组的所有组合在相同位置分别具有不同的单体类型;预设的校验单体校验规则序列表是由预设的不同的校验单体校验规则按照预设的方式生成的;预设的方式包括随机序列、递增序列、递减序列和/或上述序列的任意组合序列。优选地,预设的校验单体校验规则序列表中任意相邻的校验规则的每个分组都具有不同的校验单体。优选地,初始插入校验单体的相对应的校验规则的选取方式包括以下任意一种:①通过将索引A的值与校验单体校验规则总数比值的余数作基准值,以基准值在校验单体校验规则序列表中选取初始校验单体插入所对应的校验规则;②通过将索引A的值与检验单体校验规则序列表长度比值的余数作基准值,以基准值在校验单体校验规则序列表中选取初始校验验单体插入所对应的校验规则;③通过将索引A的值与其他固定数字比值的余数作基准值,以基准值在校验单体校验规则序列表中选取初始校验单体插入所对应的校验规则。优选地,路径搜索解码单元包括德布莱英图构建模块、索引路径搜索模块、转码模块和路径校验模块;德布莱英图构建模块能够将长度不一致、含有随机单体替换、删除和插入错误的聚合物分子序列信息按照K-mer的长度、统计K-mer呈现的频率,构建得到德布莱英图网络;索引路径搜索模块能够以Q个单体为基数,根据预设的搜索模式,从索引A所含的序列起始,在构建的德布莱英图网络中,搜索得到与索引A相对应的长度为Q的路径;或从索引B所含的序列起始,搜索得到与索引B相对应的长度为Q的路径;或分别从索引A和索引B的端点处同时起始,搜索相对应的长度为Q的路径;路径校验模块能够通过路径纠错码对经索引路径搜索模块搜索得到的经转码模块转码后的路径进行校验并对正确路径进行选择。本专利技术提供的该编解码系统中K-mer是指将聚合物序列分成包含k个单体的字符串,一般长短为m的聚合物序列可以分为m-k+1个K-mers。本申请中的K-mer的长度与聚合物的降解率相关。优选地,预设的搜索模式是根据校验单体校验规则列出符合规则的、与当前K-mer相连的K-mer集合及其呈现频率,并根据K-mer的呈现频率,选择能够接受的不少于一个K-mer作为路径点;预设的搜索模式的搜索步骤能够循环延伸每个路径直至达到预设的序列长度;K-mer的长度不小于12bp。优选地,聚合物分子包括天然核酸聚合物、非天然碱基的核酸聚合物、天然氨基酸肽聚物和非天然氨基酸残基的肽聚物中的一种或几种。优选地,路径保护编码单元与路径搜索解码单元中采用的校验单体校验规则是一致的;路径保护编码单元与路径搜索解码单元中的转码模块是一致的。本专利技术的有益效果为:本专利技术提供了一种聚合物分子信息存储纠错编解码系统,该编解码系统的编码过程是将聚合物单体以具有校验功能的方式插入聚合物分子序列内,结合路径保护编码策略生成具高性能路径保护编码。该编码过程不仅保证了存储的数据信息能够得到精准解码,同时显著降低了大规模数据信息解码计算复杂度,提高了解码速率。该编解码系统首次实现了聚合物分子序列编码数据信息对聚合物降解引起的链断裂导致的编码数据丢失与错误的高度耐受能力。该编解码系统对聚合物分子序列中出现单体插入、删除及替换错误时,同样具有极高的纠正能力和纠正效率,保证了聚合物分子数据存储的可靠性周期得到有效延长。附图说明图1是本专利技术提供的实施例的聚合物信息存储纠错编解码系统整体流程图;图2是本专利技术提供的实施例的路径保护编码过程流程图;图3是本专利技术提供的实施例的路径保护编码后的数据结构图;图4是本专利技术提供的实施例的路径搜索解码过程的流程图。具体实施方式下面结合具体实施例对本专利技术做进一步阐释。本领域技术人员将会理解,下列所描述的实施例是本专利技术一部分实施例,而不是全部本文档来自技高网...

【技术保护点】
1.一种聚合物分子信息存储纠错编解码系统,其特征在于,包括:路径保护编码单元,用于以路径保护的编码方式将二进制信息转码为N进制聚合物分子信息编码,其中N为聚合物分子单体类型数;路径搜索解码单元,用于以路径搜索和路径校验的方式将聚合物分子序列数据信息中序列长度不一和包含有随机单体替换、删除与插入错误的数据信息解码为二进制信息。

【技术特征摘要】
1.一种聚合物分子信息存储纠错编解码系统,其特征在于,包括:路径保护编码单元,用于以路径保护的编码方式将二进制信息转码为N进制聚合物分子信息编码,其中N为聚合物分子单体类型数;路径搜索解码单元,用于以路径搜索和路径校验的方式将聚合物分子序列数据信息中序列长度不一和包含有随机单体替换、删除与插入错误的数据信息解码为二进制信息。2.根据权利要求1所述的一种聚合物分子信息存储纠错编解码系统,其特征在于,所述路径保护编码单元包括索引模块、路径校验编码模块、转码模块和校验单体插入模块;所述索引模块能够生成系列索引A,并以预设长度将待存储二进制信息分配至索引A;索引A经预设算法生成相对应的索引B;所述预设算法包括伪随机函数法和哈希算法;所述索引A与索引B构成双索引;所述路径校验编码模块包括路径校验码,所述路径校验码是索引A和分配至该索引A的二进制信息经预设算法生成的;所述预设算法包括循环冗余校验算法;所述索引A、二进制信息、索引B和路径校验码组成第一信息码矩阵;所述转码模块能够根据预设的二进制比特序列-N进制聚合物单体序列对应规则,将任意一个二进制信息序列转码为相对应的N进制聚合物序列,或将任意一个N进制聚合物序列转码为相对应的二进制比特序列;所述校验单体插入模块能够根据预设的校验规则选取方式在预设的校验单体校验规则序列表中选择初始的校验规则,之后根据预设的校验单体校验规则序列表依次选取对应的校验规则进行校验单体的插入;所述第一信息码矩阵经转码模块和校验单体插入模块编码后生成N进制的第二信息码矩阵。3.根据权利要求2所述的一种聚合物分子信息存储纠错编解码系统,其特征在于,所述索引A为至少一个特定长度且值唯一的二进制信息序列;所述二进制比特序列-N进制聚合物单体序列对应规则为具有特定长度的任意二进制比特序列分别具有相对应的特定长度的、唯一的N进制聚合物单体序列;所述二进制比特序列的特定长度不小于1个位;所述N进制聚合物单体序列对应规则的序列特定长度不小于1个位。4.根据权利要求2所述的一种聚合物分子信息存储纠错编解码系统,其特征在于,所述校验单体校验规则是由至少一组符合预设要求的双单体组合分组,且每个分组都分配一个独特的单体类型作为校验单体;所述预设要求为每个分组的所有组合在相同位置分别具有不同的单体类型;所述预设的校验单体校验规则序列表是由预设的不同的校验单体校验规则按照预设的方式生成的;所述预设的方式包括随机序列、递增序列、递减序列和/或上述序列的任意组合序列。5.根据权利要求4所述的一种聚合物分子信息存储纠错编...

【专利技术属性】
技术研发人员:宋理富元英进耿枫
申请(专利权)人:宋理富
类型:发明
国别省市:天津,12

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1