【技术实现步骤摘要】
本申请涉及致病变异筛选,尤其涉及一种大语言模型微调方法、致病变异筛选方法、计算机设备和存储介质。
技术介绍
1、遗传性疾病是指由于遗传物质改变(如基因的突变或染色体畸形)而造成的疾病,分为单基因遗传病、多基因遗传病、染色体病等,对患者和家庭的影响往往是长期的、严重的。基于下一代测序(ngs)的诊断如外显子组和基因组测序目前已经广泛应用于临床遗传疾病相关的诊断中。然而,由于其能同时检测大量基因上的变异,导致鉴定真正疾病致病性的变异变得极具挑战性。传统的寻找相关致病变异的方法,如xrare,exmiser主要通过患者表型加基因型注释信息来对候选的变异进行优先级排序,这种方法往往需要明确的标准化的患者表型作为输入,并且排序结果并不理想,仍有大量位点需要人工解读。
技术实现思路
1、本申请的目的旨在至少能解决上述的技术缺陷之一,特别传统技术中的致病变异筛选对输入的要求高,导致存在人工审核工作量大的问题。
2、第一方面,本申请提供了一种大语言模型微调方法,包括:
3、获取训练
...【技术保护点】
1.一种大语言模型微调方法,其特征在于,包括:
2.根据权利要求1所述的大语言模型微调方法,其特征在于,在所述根据训练变异位点的所述表型信息和所述特征信息得到知识提示词之前,还包括:
3.根据权利要求2所述的大语言模型微调方法,其特征在于,所述根据所述训练变异位点与各所述可选变异位点的表型相似度,从中确定预设数量的目标变异位点,包括:
4.根据权利要求1所述的大语言模型微调方法,其特征在于,所述特征信息包括人群频率、基因相关信息、相关功能改变、保守性预测、危害性预测和疾病致病性中的至少一种。
5.根据权利要求4所述的大语
...【技术特征摘要】
1.一种大语言模型微调方法,其特征在于,包括:
2.根据权利要求1所述的大语言模型微调方法,其特征在于,在所述根据训练变异位点的所述表型信息和所述特征信息得到知识提示词之前,还包括:
3.根据权利要求2所述的大语言模型微调方法,其特征在于,所述根据所述训练变异位点与各所述可选变异位点的表型相似度,从中确定预设数量的目标变异位点,包括:
4.根据权利要求1所述的大语言模型微调方法,其特征在于,所述特征信息包括人群频率、基因相关信息、相关功能改变、保守性预测、危害性预测和疾病致病性中的至少一种。
5.根据权利要求4所述的大语言模型微调方法,其特征在于,所述问题提示词还包括以下至少一种:
6.根据权利要求1-5任一项所述的大语言模型微调方法,其特征在于,所述利用所述微调训练集对预训练的大...
【专利技术属性】
技术研发人员:梁伦纲,靳济槊,王泰福,谌于蓝,庞焱萌,赵立见,戴文韬,唐美芳,姜丹,
申请(专利权)人:深圳华大医学检验实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。