使用核酸用于可检索信息储存的方法技术

技术编号:17954643 阅读:55 留言:0更新日期:2018-05-16 03:25
本文提供了一种使用如核苷酸的单体储存信息的方法,其包括将一种格式的信息转换成比特流的多个比特序列,其各自具有相应的比特条码,使用每个编码的碱基一个比特将所述多个比特序列转换成多个相应的寡核苷酸序列,在具有多个反应位置的基材上合成多个相应的寡核苷酸序列,并且将合成的多个相应的寡核苷酸序列储存。

A method of using nucleic acids for retrievable information storage

This article provides a method for using a single body of nucleotides to store information, which includes converting a format information into a bit sequence of bits, each having corresponding bit barcode, and converting the plurality of bits to a number of corresponding oligonucleotide sequences with one bit of each coded base. A plurality of corresponding oligonucleotide sequences are synthesized on a substrate having multiple reaction sites, and a plurality of corresponding oligonucleotide sequences are stored.

【技术实现步骤摘要】
【国外来华专利技术】使用核酸用于可检索信息储存的方法
本专利技术主要涉及使用单体(如核苷酸)作为二进制比特信息以使用单体(如核苷酸)的序列形成聚合物来编码信息的方法。以这种方式,单体(如核苷酸)的序列可以被用于储存信息,如文本或图像或声音。
技术介绍
DNA被认为是信息储存的介质。参见Bancroft等,Science293,1763-1765(2001)。同样参见,Davis,ArtJournal55,70-74(1996);Gustafsson,Nature458,703(2009)以及Gibson,Science329,52-56(2010);US2003/0228611和WO2014/014991。同样参见US2010/0099080和WO2014/014991。
技术实现思路
本公开的实施方式是关于使用包括单体的一个或多个聚合物序列作为信息储存介质的方法。本公开的某些实施方式是关于使用包括核苷酸的一个或多个核酸序列作为信息储存介质的方法。信息在自然界中最小、最准确的复制比特——碱基对本身编码。常见核苷酸包括:腺嘌呤(“A”)、胞嘧啶(“C”)、鸟嘌呤(“G”)和胸腺嘧啶(“T”)。根据某些方面,可以使用尿嘧啶(“U”)代替或者补充胸腺嘧啶。也考虑本领域技术人员熟知的其它碱基对,如6碱基的3碱基对和12碱基的6碱基对。还可以使用核酸形成多肽,其编码与本文所述核苷酸类似的信息。本公开的方面是关于这样的方法,其使用下一代测序和合成技术稳定、大规模读取和写入数字信息。根据一个方面,将文本和/或图像,和/或声音转换成连续的比特,如兆比特。根据一个方面,将文本和/或图像,和/或声音转换成包括比特流的兆比特。然后将兆比特编码成寡聚物,如寡核苷酸。设计如寡核苷酸序列的寡聚物序列,然后将其合成。例如,设计寡核苷酸序列,然后使用酶促寡核苷酸合成反应将其合成,其中将酶和核苷酸在适当的反应条件下置于基材上的所需位点,并且核苷酸共价结合连接支持物的存在的核苷酸。寡核苷酸序列可以使用聚合酶(如易错聚合酶)在这样的条件下合成,所述条件中试剂在一段时间内位于基材的某个位置并且在这样的条件下使得添加单个核苷酸的可能性最大化。考虑到核苷酸添加的反应动力学,也可以在所需时间使用合适的洗涤以将试剂从所述位置去除,从而使得超过一种的核苷酸添加最小化。根据此方面,可以在合适的反应条件下将试剂以液体脉冲添加到基材上的某个位置,并且限定核苷酸能用于添加的时间,例如,在存在聚合酶的情况下。相似地,洗涤也可以液体脉冲添加到某个位置,以将试剂从该位置去除。根据一个方面,寡聚物(如寡聚核苷酸)包括数据块(datablock)序列。根据一个方面,寡聚物(如寡聚核苷酸)包括在比特流中指定数据块位置的地址序列(addresssequence)(如条码序列(barcodesequence))。根据一个方面,寡核苷酸包括位于寡核苷酸各末端用于扩增和测序的侧接共同序列(flankingcommonsequence)。根据一个方面,寡核苷酸包括一个或多个或所有数据块序列,在比特流中指定数据块位置的地址序列(如条码序列),以及位于寡核苷酸各末端用于扩增和测序的侧接共同序列。根据本公开的一个方面,每个碱基编码一个比特。根据该方面,可以多种方式编码单个信息,即,A或C对应0、G或T对应数字1。设想了其它组合,如A或G对应0、C或T对应1,或A或T对应0、G或C对应数字1。如本文所讨论考虑了其它组合。根据一个方面,将比特流分成编址的数据块(addresseddatablock)。根据该方面,建立数据块库,其表示记录的信息。以这种方式,不在需要以其全长表示记录的信息的单个长核酸序列或相对长的核酸序列。根据一个方面,使用高通量、下一代技术合成、储存并测序各单个寡核苷酸的多个拷贝。因为合成和测序中的错误很少同时发生,所以各分子拷贝在其它拷贝中校正错误。根据一个方面,使用本领域技术人员已知的方法对寡核苷酸进行测序。出于将核苷酸序列转换成二进制信息比特的目的,将可能是由于使用易错聚合酶所产生的特定核苷酸的均聚物运行(即,相同核苷酸或系列中的其它单体的序列)当作单个核苷酸,以实现分配二进制信息比特(即,0或1)的目的。根据某些其它方面,为了在比特流中区分比邻的0或比邻的1,例如,将表示0的两个单体(如核苷酸A和T)在寡核苷酸序列的设计中改变。当在寡核苷酸合成期间可能导致均聚物运行时,这允许将比邻的0或1区分为不同的二进制信息比特。例如,当两个0在比特流中彼此邻近时,即-00-,将对应的核苷酸序列选择为–AT-或–TA-。以这种方法,如果在合成设计的寡核苷酸序列期间导致均聚物运行,如–AAATTT-,那么该均聚物运行将被解释成单个核苷酸并将会被读取成–AT-,对应于-00-。因此,本公开的方法涉及将二进制比特流编码成核酸序列以及将核酸序列解码回二进制比特流,其允许可变核苷酸均聚物运行长度,并能够准确将核酸解码至二进制比特流。根据一个方面,提供了一种使用核苷酸作为比特的代表来储存信息的方法,其包括将一种格式的信息转换成比特流的多个比特序列,其各自具有相应的比特条码,使用每个编码的碱基一个比特将所述多个比特序列转换成多个相应的寡核苷酸序列,通过脉冲和同步酶试剂和洗剂合成多个相应的寡核苷酸序列,从而使得核苷酸添加至生长的寡核苷酸链,并且将合成的多个相应的寡核苷酸序列储存。根据一个方面,寡核苷酸序列包括一个或多个或所有数据块序列,在比特流中指定数据块位置的地址序列,或位于寡核苷酸各末端用于扩增和测序的侧接共同序列。根据一个方面,可以使用易错聚合酶以合成多个相应的寡核苷酸序列。根据一个方面,提供了一种从多个合成的寡核苷酸序列检索一种格式的信息的方法,所述合成的寡核苷酸序列编码该格式信息的比特序列,所述方法包括扩增多个寡核苷酸序列,对扩增的寡核苷酸序列进行测序,通过将均聚物运行解释成单个核苷酸将寡核苷酸序列转化成比特序列,并且将比特序列转换成该格式的信息。根据一个方面,寡核苷酸序列包括一个或多个或所有数据块序列,在比特流中指定数据块位置的地址序列,或位于寡核苷酸各末端用于扩增和测序的侧接共同序列。出于将核苷酸序列转换成二进制信息比特的目的,将可能是由于使用易错聚合酶所产生的特定核苷酸的均聚物运行当作单个核苷酸,以实现分配二进制信息比特(即,0或1)的目的。根据一个方面,提供了一种由多个合成的寡核苷酸序列访问一种格式的信息的方法,所述合成的寡核苷酸序列编码该格式信息的比特序列,所述方法包括扩增多个寡核苷酸序列,对扩增的寡核苷酸序列进行测序,通过将均聚物运行解释成单个核苷酸将寡核苷酸序列转化成比特序列,将比特序列转换成该格式的信息,并且将该格式的信息可视化,或者将该格式的信息制作成音频。根据一个方面,寡核苷酸序列包括一个或多个或所有数据块序列,在比特流中指定数据块位置的地址序列,或位于寡核苷酸各末端用于扩增和测序的侧接共同序列。出于将核苷酸序列转换成二进制信息比特的目的,将可能是由于使用易错聚合酶所产生的特定核苷酸的均聚物运行当作单个核苷酸,以实现分配二进制信息比特(即,0或1)的目的。根据一个方面,提供了一种使用核苷酸储存信息的方法,其包括将一种格式的信息转换成比特流,将比特序列编码至相应的寡核苷酸序列,合成本文档来自技高网...
使用核酸用于可检索信息储存的方法

【技术保护点】
一种产生二进制编码的聚合物的方法,所述方法包括:用这样的延伸产物重复延伸生长的聚合物链,所述延伸产物是:(i)第一单体对的第一单体或第二单体中的一种或超过一种的延伸产物,或(ii)第二单体对的第一单体或第二单体中的一种或超过一种的延伸产物,并且其中,所述延伸产物表示对应由文本或图像或视频或音频格式转换的比特流的二进制信息比特,并且其中,所述第一单体对的第一单体和第二单体各自表示第一二进制信息比特,并且其中,所述第二单体对的第一单体和第二单体各自表示第二二进制信息比特,并且当延伸产物表示相同二进制信息比特并且连续直接出现时,在给定的单体对的所述第一单体和所述第二单体之间交替,并且其中,所述二进制编码的聚合物编码所述文本或图像或视频或音频格式。

【技术特征摘要】
【国外来华专利技术】2015.07.13 US 62/191,9821.一种产生二进制编码的聚合物的方法,所述方法包括:用这样的延伸产物重复延伸生长的聚合物链,所述延伸产物是:(i)第一单体对的第一单体或第二单体中的一种或超过一种的延伸产物,或(ii)第二单体对的第一单体或第二单体中的一种或超过一种的延伸产物,并且其中,所述延伸产物表示对应由文本或图像或视频或音频格式转换的比特流的二进制信息比特,并且其中,所述第一单体对的第一单体和第二单体各自表示第一二进制信息比特,并且其中,所述第二单体对的第一单体和第二单体各自表示第二二进制信息比特,并且当延伸产物表示相同二进制信息比特并且连续直接出现时,在给定的单体对的所述第一单体和所述第二单体之间交替,并且其中,所述二进制编码的聚合物编码所述文本或图像或视频或音频格式。2.如权利要求1所述的方法,其中,所述聚合物是核酸。3.如权利要求1所述的方法,其中,所述第一单体对的第一单体或第二单体是核苷酸。4.如权利要求1所述的方法,其中,所述第二单体对的第一单体或第二单体是核苷酸。5.如权利要求1所述方法,其中,所述第一单体对包括腺嘌呤(A)和胸腺嘧啶(T)或尿嘧啶(U)。6.如权利要求1所述的方法,其中,所述第二单体对包括胞嘧啶(C)和鸟嘌呤(G)。7.如权利要求1所述的方法,其中,使用酶和选定单体在催化所述选定单体添加的条件下形成所述延伸产物。8.如权利要求1所述的方法,其中,使用聚合酶和选定单体在催化所述选定单体添加的条件下形成所述延伸产物。9.如权利要求1所述的方法,其中,使用非模板依赖性聚合酶和选定单体在催化所述选定单体添加的条件下形成所述延伸产物。10.如权利要求1所述的方法,所述生长的聚合物链连接基材。11.如权利要求1所述的方法,包括由步骤(i)和(ii)形成的多个生长的聚合物链。12.如权利要求1所述的方法,包括由步骤(i)和(ii)形成的多个生长的聚合物链,并且其中所述多个生长的聚合物链连接基材。13.如权利要求1所述的方法,其中,所述第一单体对的第一单体或第二单体是天然核苷酸。14.如权利要求1所述的方法,其中,所述第二单体对的第一单体或第二单体是天然核苷酸。15.如权利要求1所述的方法,其中,所述第一和第二单体对包括天然核苷酸,并且在足以添加单个核苷酸或超过一个核苷酸的条件下通过催化天然核苷酸添加来制备延伸产物。16.如权利要求1所述的方法,其中,所述第一和第二单体对包括天然核苷酸,并且这样制备延伸产物;通过在基材上一个或多个位置交替用核苷酸缺陷型缓冲液给予聚合酶和选定核苷酸,在足以添加核苷酸的条件下催化天然核苷酸添加。17.一种产生二进制编码的聚合物的方法,所述方法包括:用这样的延伸产物重复延伸生长的聚合物链,所述延伸产物是:(i)第一单体对的第一单体或第二单体中的一种或超过一种的延伸产物,或(ii)第二单体对的第一单体或第二单体中的一种或超过一种的延伸产物,并且其中,所述延伸产物表示对应由文本或图像或视频或音频格式转换的比特流的二进制信息比特,并且其中,所述第一单体对的第一单体和第二单体各自表示第一二进制信息比特,并且其中,所述第二单体对的第一单体和第二单体各自表示第二二进制信息比特,并且当延伸产物表示相同二进制信息比特并且连续直接出现时,在给定的单体对的所述第一单体和所述第二单体之间交替,并且其中,所述延伸产物包括所述第一单体对的第一单体或第二单体的至少一个均聚物或所述第二单体对的第一单体或第二单体的至少一个均聚物,并且其中,所述二进制编码的聚合物编码所述文本或图像或视频或音频格式。18.一种将二进制编码的核酸由核酸序列转换成表示文本或图像或视频或音频格式的二进制信息比特序列的方法,其中腺嘌呤和胸腺嘧啶或尿嘧啶表示第一二进制信息比特,并且胞嘧啶和鸟嘌呤表示第二二进制信息比特,所述方法包括:读取所述核酸序列,并且将所述第一二进制信息比特分配给各腺嘌呤或连续的超过一个腺嘌呤,将所述第一二进制信息比特分配给各胸腺嘧啶或连续的超过一个胸腺嘧啶,将所述第一二进制信息比特分配给各尿嘧啶或连续的超过一个尿嘧啶,将所述第二二进制信息比特分配给各胞嘧啶或连续的超过一个胞嘧啶,和将所述第二二进制信息比特分配给各鸟嘌呤或连续的超过一个鸟嘌呤,其中,所述核酸序列包括以下至少其一:连续的两个或多个腺嘌呤,连续的两个或多个胸腺嘧啶,连续的两个或多个尿嘧啶,连续的两个或多个胞嘧啶或连续的两个或多个鸟嘌呤。19.一种对文本或图像或视频或音频格式进行编码和解码的方法,所述方法包括:将所述文本或图像或视频或音频格式转换成比特流的多个比特序列,通过将腺嘌呤或胸腺嘧啶分配给第一二进制信息比特并将胞嘧啶或鸟嘌呤分配给第二二进制信息比特,设计对应所述比特流的多个比特序列的核酸序列,其中,当相同二进制信息比特直接连续出现时,交替分配给腺嘌呤或胸腺嘧啶,其中,当相同二进制信息比特直接连续出现时,交替分配给胞嘧啶或鸟嘌呤,合成所述核酸序列,储存所述合成的核酸序列,读取所述合成的核酸序列,并且通过将所述第一二进制信息比特分配到腺嘌呤或胸腺嘧啶并将所述第二二进制信息比特分配到胞嘧啶或鸟嘌呤,将所述合成的核酸序列解码成所述比特流的多个比特序列。20.如权利要求19所述的方法,其中,所述合成的核酸序列包括腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤至少其一的聚合物,并且其中所述将合成的核酸序列解码包括将所述第一二进制信息比特分配给腺嘌呤或胸腺嘧啶均聚物,或将所述第二二进制信息比特分配给胞嘧啶或鸟嘌呤均聚物。21.一种使用核酸序列在基材上储存信息的方法,所述核酸序列表示编码文本或图像或视频或音频格式的比特流的多个比特序列,所述方法包括:提供具有连接阵列上区域的单链核酸引发剂序列的基材,用...

【专利技术属性】
技术研发人员:G·M·丘奇
申请(专利权)人:哈佛学院董事及会员团体
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1