【技术实现步骤摘要】
【国外来华专利技术】基因组、代谢组学和微生物组学搜索引擎相关申请的交叉引用本申请要求于2016年3月21日提交的美国临时申请序列号No.62/311,333和于2016年3月21日提交的美国临时申请序列号No.62/311,337的权益,其全部内容通过引用整体合并于此。
技术介绍
自从在2001年对第一个人类基因组进行测序以来,基因组数据在研究中的使用已经大大增加。在那个时候,用于个体的全基因组序列的价格已经下降到许多个体可及的范围内的水平。随着遗传信息的增加和用户的多样化,如何组织、访问和挖掘这些数据的问题已经成为个性化医学革命的前沿。
技术实现思路
当前的生物信息学技术、软件和用户界面遭受若干致命缺陷,这些缺陷阻止对基因组信息的个人访问(事实上,它时常阻止非专业医师的访问)。一个问题是要搜索的巨量信息;单个基因组可以包含数千兆字节的信息。另一个问题是关于基因组序列变异(尤其是低频等位基因)的有限信息和基因组序列变异的不良验证。这些变异的分散性和关于它们的信息导致排序评分和索引(rankingscoringandindexing)算法的性能不佳。当前的用户界面需要用户的高度技巧,对用户不是非 ...
【技术保护点】
1.一种提供基因组搜索引擎的计算机实现的方法,包括:a)将多个索引存储在计算机储存器中,所述索引包括标记化的基因组数据;b)提供索引管道,所述索引管道摄取基因组数据和与所述基因组数据相关联的注释,在保留基因名称和基因变异名称的同时将数据标记化,并用标记化的数据更新所述索引;c)呈现允许用户输入用户查询的用户界面;以及d)提供查询引擎,所述查询引擎接受所述用户查询、选择一个或多个相关索引、并将排序准则应用于所选索引以返回排序结果。
【技术特征摘要】
【国外来华专利技术】2016.03.21 US 62/311,333;2016.03.21 US 62/311,3371.一种提供基因组搜索引擎的计算机实现的方法,包括:a)将多个索引存储在计算机储存器中,所述索引包括标记化的基因组数据;b)提供索引管道,所述索引管道摄取基因组数据和与所述基因组数据相关联的注释,在保留基因名称和基因变异名称的同时将数据标记化,并用标记化的数据更新所述索引;c)呈现允许用户输入用户查询的用户界面;以及d)提供查询引擎,所述查询引擎接受所述用户查询、选择一个或多个相关索引、并将排序准则应用于所选索引以返回排序结果。2.根据权利要求1所述的方法,进一步包括呈现用户界面,所述用户界面允许用户提供关于结果的内容和排序的用户反馈。3.根据权利要求1或2所述的方法,进一步包括提供相关性学习引擎,所述相关性学习引擎接受所述用户反馈并基于所述反馈调整所述排序准则。4.根据权利要求1至3中任一项所述的方法,其中,所述基因组数据包括全基因组序列数据、全外显子组序列数据、SNP序列数据或基因组变异数据。5.根据权利要求1至4中任一项所述的方法,还包括呈现用户界面,所述用户界面允许用户将基因组或SNP序列数据上传到所述索引管道中。6.根据权利要求1至5中任一项所述的方法,其中,所述用户查询包括基因组序列文件、变异调用格式文件、基因、基因变异或突变、个体标识符、药物、表型或其组合。7.根据权利要求1至6中任一项所述的方法,其中,允许用户输入用户查询的所述界面是接受以下各项中的任一项的通用界面:基因组序列文件、基因、基因变异或突变、个体标识符、药物、表型或其组合。8.根据权利要求1至7中任一项所述的方法,其中,所述用户查询包括基因名称,并且所述排序结果包括与所述基因相关联的变异。9.根据权利要求1至8中任一项所述的方法,其中,所述用户查询包括个体标识符,并且所述排序结果包括个体的基因组中的基因变异。10.根据权利要求1至9中任一项所述的方法,其中,所述用户查询包括个体标识符和表型,并且所述排序结果包括与所述表型相关联的个体的基因组中的基因变异。11.根据权利要求1至10中任一项所述的方法,其中,所述用户查询包括基因变异,并且所述排序结果包括在其基因组中具有变异的患者的患者标识符。12.根据权利要求1至11中任一项所述...
【专利技术属性】
技术研发人员:维克托·拉夫连科,阿马利奥·特伦蒂,弗朗茨·约瑟夫·欧奇,
申请(专利权)人:细胞结构公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。