An estimate of the first DNA chain or \probe\ and \target\ or second DNA chain length form hybridization affinity with the hybrid method of Lbp, the method comprises the following steps: in each partition of the hybrid group M partition, the number of each hybrid counting a set of P DNA chain hybrids exist in the partition, the hybrid body length k, length less than Lbp, or \K hybrids\; for length for each one hybrid Lbp in combination with a set of L mismatch combinations, determine the mismatch in the presence of the hybrid; and according to the following formula to calculate the affinity:
【技术实现步骤摘要】
【国外来华专利技术】估计DNA芯片探针-靶亲和性的方法和制造DNA芯片的方法本专利技术涉及转录物组领域,尤其是DNA链之间的杂交研究。本专利技术特别用于设计杂交支持物的领域,尤其是DNA芯片。
DNA芯片测量转录物表达水平,这是根据简单DNA链与互补DNA链一起时自发重新形成双链的性质,即其与互补链杂交的性质。为了解生物样品中的转录物表达水平,DNA芯片包括含氮碱基的序列,称为“探针”,其设计成与一组感兴趣转录物或“靶”转录物特异杂交。为提高测量的稳健性,转录物由数个探针靶向,共同形成“探针组”。出于高速筛选的目的,DNA芯片因而包括靶向I个转录物的I个“探针组”,总共J个不同探针。出于测量目的,每一探针同样重复大量次数,重复的探针布置在孔中。寻求表达的靶转录物能产生数千个或数以万计的含氮碱基A、G、C、T,其首先通过扩增过程转化成含较小DNA片段的溶液,所述片段长度通常为25-200个含氮碱基,由荧光着色剂标记。如此获得的溶液随后沉积于DNA芯片孔中。每一孔对应于重复数次并针对转录物设计的探针,这因而引起一些这类片段与孔中探针的杂交。洗涤DNA芯片以仅保持孔中形成的杂交体后,每一孔荧光的测量随后通过高分辨率扫描仪实施,该量度代表孔中存在的杂交体数量。随后应用表述“探针荧光”或“探针强度”。为较好理解以下内容,必须引入下列定义。因此,术语“探针”指构成DNA芯片、更常指采用与探针杂交的任何装置的含氮碱基或“核苷酸”序列。术语“靶”指来自转录物的含氮碱基序列,能与其探针形成杂交体。表述“特异靶”涉及这样的靶,其对应于已鉴定的转录物的一部分、根据碱基序列和转录物中的定位针对其 ...
【技术保护点】
一种估计第一DNA链或“探针”与第二DNA链或“靶”杂交以形成长度为Lbp的杂交体的亲和性φ的方法,所述方法包括:‑在杂交体的一组M个分区的每一分区内,计数一组P个DNA链杂交体的每一杂交体存在于所述分区中的次数,所述DNA链杂交体长度为k,小于长度Lbp,或是“k‑杂交体”;‑对于长度为Lbp的杂交体中一组L个错配组合的每一错配组合,确定所述错配对是否存在于所述杂交体中;和‑根据以下关系式计算亲和性φ:
【技术特征摘要】
【国外来华专利技术】2014.12.01 FR 14617221.一种估计第一DNA链或“探针”与第二DNA链或“靶”杂交以形成长度为Lbp的杂交体的亲和性φ的方法,所述方法包括:-在杂交体的一组M个分区的每一分区内,计数一组P个DNA链杂交体的每一杂交体存在于所述分区中的次数,所述DNA链杂交体长度为k,小于长度Lbp,或是“k-杂交体”;-对于长度为Lbp的杂交体中一组L个错配组合的每一错配组合,确定所述错配对是否存在于所述杂交体中;和-根据以下关系式计算亲和性φ:该表达式中:是当一组P个k-杂交体中第p个k-杂交体存在于所述分区的第m个区域时,定量此第p个k-杂交体对亲和性φ的贡献的预定标量,且xm,p是此第p个k-杂交体在所述分区第m个区域中被计数的次数;和α是实数项。2.如权利要求1所述的方法,其中该表达式中是定量所述第l对错配对亲和性φ的贡献的预定标量,如果所述第l对错配存在于所述杂交体中,则否则yl=0,π是实数,有利地等于0。3.如权利要求2所述的方法,其包括:-对于一组N个学习对的每一对,各包括能共同形成长度为Lbp的杂交体的第一和第二DNA链,集合一定量的所述对的第一DNA链和一定量的所述对的第二DNA链,并测量代表此集合后形成的DNA链杂交体的量的强度In,所述校准对的杂交体包括至少一次的P个k-杂交体组的每一k-杂交体;和-最小化所测强度的向量与所测强度的向量I的预测向量之间的距离D来计算向量向量和向量所述计算通过根据以下关系式解答优化问题来进行:Mn=θn.(Xn.B+Yn.Δ)该表达式中:Θ=(θ1…θn…θN)T是的向量,其中θn是编码为第n个校准对而集合在一起的一定量的第一和/或第二DNA链的标量;Xn=(Xn,1…Xn,m…Xn,M)是的预定设计的行矩阵,其中Xn,m=(xn,m,1…xn,m,p…xn,m,P)是的行矩阵且xn,m,p是对于由第n个校准对的第一和第二DNA链形成的杂交体,第p个k-杂交体存在于所述分区的第m个区域中的次数;B=(B1…Bm…BM)T是的向量,其中Bm=(βm,1…βm,p…βm,P)T是的向量,并且βm,p是当P个k-杂交体组的第p个k-杂交体存在于所述分区的第m个区域时,定量此第p个k-杂交体对长度为Lbp的杂交体亲和性的贡献的标量;Yn=(yn,1…yn,l…yn,L)是的预定设计的行矩阵,其中如果所述第l对错配存在于第n个校准对的第一和第二DNA链形成的杂交体中,则yn,l=1;和Δ=(δ1…δl…δL)T是的向量,其中δl是定量所述第l对错配对长度为Lbp的杂交体亲和性的贡献的标量。4.如权利要求1-3中任一项所述的方法,其特征在于:k-杂交体具有的长度k为2至7;和所述分区的区域数M是2至25-k。5.如权利要求4所述的方法,其特征在于,所述区域数M是3至15。6.如权利要求4或5所述的方法,其特征在于,所述k-杂交体具有的长度k为3至5。7.如权利要求2-6中任一项所述的方法,其特征在于,所述解答优化问题通过根据以下关系式的额外约束来解决:其中I是不同RNA的数,α是预定的正标量,有利地等于I。8.如权利要求2-7中任一项所述的方法,其特征在于,所述优化...
【专利技术属性】
技术研发人员:J·贝克尔,P·佩罗,F·马莱,
申请(专利权)人:生物梅里埃公司,里昂公立收容所,
类型:发明
国别省市:法国,FR
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。