当前位置: 首页 > 专利查询>ILLUMINA公司专利>正文

用于个性化医学的自定义数据文件制造技术

技术编号:37136740 阅读:33 留言:0更新日期:2023-04-06 21:37
公开了方法和系统,这些方法和系统可以从核酸测序技术和装置收集大型数据集,从各种格式的文件中过滤生物样品的相关基因组信息和序列变体信息,以标准化格式生成仅具有相关信息的自定义数据文件,并且向下游分析提供所生成的信息以用于个性化医学用途。成的信息以用于个性化医学用途。成的信息以用于个性化医学用途。

【技术实现步骤摘要】
【国外来华专利技术】用于个性化医学的自定义数据文件
[0001]相关申请的交叉引用
[0002]本申请要求2020年9月14日提交的美国临时申请63/078,215的优先权,该临时申请的内容全文以引用方式并入本文。
[0003]计算机程序列表的引用
[0004]本申请提交了计算机程序列表附录,包括2019年7月19日创建的一个名称为“biomarker_definitions.schema.txt”的文件(2,139字节),2019年8月5日创建的一个名称为“nirvana_definitions.schema.txt”的文件(6,721字节),2019年8月12日创建的一个名称为“sample_analysis_results.txt”的文件(16,154字节),2019年7月24日创建的一个名称为“sample_analysis_results.schema.txt”的文件(9,368字节),以及2019年8月12日创建的一个名称为“variant_definitions.schema.txt”的文件(6,857字节),该计算机程序列表以引用方式并入本文,用于所有目的。本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种生成自定义文件的计算机实现的方法,所述方法包括:接收对与期望样品相关联的信息的查询;确定用于构建所述自定义文件的模式;根据所述模式,获得多个核酸测序分析文件,其中所述多个核酸测序分析文件中的每个核酸测序分析文件包括多个生物样品的核酸序列信息、遗传变体信息、基因表达信息或其任何组合,其中所述多个生物样品包括所述期望样品;对于所述多个核酸测序分析文件中的每个核酸测序分析文件:根据所述模式确定所述核酸测序分析文件中的待存储在所述自定义文件中的多个数据对象;根据所述模式确定所述自定义文件中的多个自定义数据字段以存储所述数据对象;以及将所述数据对象存储在所述自定义数据字段中;通过针对根据所述模式的所述自定义文件的一部分,评估密码哈希函数来生成校验和;以及将所述校验和存储在所述自定义文件中。2.根据权利要求1所述的方法,其中确定用于构建所述自定义文件的模式包括:从多个预定义模式中选择模式;任选地接收用于修改所述模式的用户修改;以及将所述用户修改和与所述模式相关联的版本值存储在所述自定义文件中。3.根据权利要求1所述的方法,其中根据所述模式获得多个核酸测序分析文件包括:在数据库中搜索包括由所述模式指定的一个或多个关键词的多个文件;以及复制所述多个文件。4.根据权利要求1所述的方法,其中根据所述模式确定所述核酸测序分析文件中的待存储在所述自定义文件中的多个数据对象包括:解析所述核酸测序分析文件;根据所述模式识别待存储的所述多个数据对象;以及提取所述多个数据对象。5.根据权利要求1所述的方法,其中所述核酸测序分析文件中的每个核酸测序分析文件还包括以下项中的至少一者:测序装置状况、测序相关数据、分析软件信息、分析流程信息、碱基调用、运行质量控制度量、DNA质量控制度量、RNA质量控制度量、DNA小变体输出、拷贝数变体输出、RNA融合输出、DNA融合输出、剪接变体输出、肿瘤突变负荷生物标志物输出和微卫星不稳定性生物标志物输出。6.根据权利要求5所述的方法,其中所述测序装置状况包括测序参数和/或关于所述测序装置中的错误的信息。7.根据权利要求1所述的方法,其中所述核酸测序分析文件中的每个核酸测序分析文件还包括以下项中的至少一者:样品制备相关数据、样品识别号、样品清单、患者身份、组织类型、感兴趣的基因组区域、疾病信息和治疗信息。8.根据权利要求1所述的方法,所述方法还包括:接收与所述期望样品相关联的用户输入;
根据所述模式确定所述用户输入中的待存储在所述自定义文件中的多个数据对象;根据所述模式确定所述自定义文件中的多个自定义数据字段以存储所述数据对象;以及将所述数据对象存储在所述自定义数据...

【专利技术属性】
技术研发人员:伊根
申请(专利权)人:ILLUMINA公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1