一种大语言模型微调方法、致病变异筛选方法、计算机设备和存储介质技术

技术编号:42654898 阅读:29 留言:0更新日期:2024-09-06 01:47
本申请提供了一种大语言模型微调方法、致病变异筛选方法、计算机设备和存储介质。该方法包括:获取训练变异位点及其对应的表型信息;训练变异位点的种类包括致病性和非致病性;对训练变异位点进行注释,得到对应的特征信息;根据训练变异位点的表型信息和特征信息得到知识提示词,根据训练变异位点的种类得到答案提示词,并将知识提示词、问题提示词和答案提示词组成训练问答提示词,以得到微调训练集;其中,问题提示词包括变异位点是否致病性的提问;利用微调训练集对预训练的大语言模型进行微调,得到筛选大语言模型。该微调方法训练出的筛选大语言模型不仅能对标准化输入解答,更可以适用于非标准化的输入,减少人工工作量、提高解读效率。

【技术实现步骤摘要】

本申请涉及致病变异筛选,尤其涉及一种大语言模型微调方法、致病变异筛选方法、计算机设备和存储介质


技术介绍

1、遗传性疾病是指由于遗传物质改变(如基因的突变或染色体畸形)而造成的疾病,分为单基因遗传病、多基因遗传病、染色体病等,对患者和家庭的影响往往是长期的、严重的。基于下一代测序(ngs)的诊断如外显子组和基因组测序目前已经广泛应用于临床遗传疾病相关的诊断中。然而,由于其能同时检测大量基因上的变异,导致鉴定真正疾病致病性的变异变得极具挑战性。传统的寻找相关致病变异的方法,如xrare,exmiser主要通过患者表型加基因型注释信息来对候选的变异进行优先级排序,这种方法往往需要明确的标准化的患者表型作为输入,并且排序结果并不理想,仍有大量位点需要人工解读。


技术实现思路

1、本申请的目的旨在至少能解决上述的技术缺陷之一,特别传统技术中的致病变异筛选对输入的要求高,导致存在人工审核工作量大的问题。

2、第一方面,本申请提供了一种大语言模型微调方法,包括:

3、获取训练变异位点及其对应的表本文档来自技高网...

【技术保护点】

1.一种大语言模型微调方法,其特征在于,包括:

2.根据权利要求1所述的大语言模型微调方法,其特征在于,在所述根据训练变异位点的所述表型信息和所述特征信息得到知识提示词之前,还包括:

3.根据权利要求2所述的大语言模型微调方法,其特征在于,所述根据所述训练变异位点与各所述可选变异位点的表型相似度,从中确定预设数量的目标变异位点,包括:

4.根据权利要求1所述的大语言模型微调方法,其特征在于,所述特征信息包括人群频率、基因相关信息、相关功能改变、保守性预测、危害性预测和疾病致病性中的至少一种。

5.根据权利要求4所述的大语言模型微调方法,其特...

【技术特征摘要】

1.一种大语言模型微调方法,其特征在于,包括:

2.根据权利要求1所述的大语言模型微调方法,其特征在于,在所述根据训练变异位点的所述表型信息和所述特征信息得到知识提示词之前,还包括:

3.根据权利要求2所述的大语言模型微调方法,其特征在于,所述根据所述训练变异位点与各所述可选变异位点的表型相似度,从中确定预设数量的目标变异位点,包括:

4.根据权利要求1所述的大语言模型微调方法,其特征在于,所述特征信息包括人群频率、基因相关信息、相关功能改变、保守性预测、危害性预测和疾病致病性中的至少一种。

5.根据权利要求4所述的大语言模型微调方法,其特征在于,所述问题提示词还包括以下至少一种:

6.根据权利要求1-5任一项所述的大语言模型微调方法,其特征在于,所述利用所述微调训练集对预训练的大...

【专利技术属性】
技术研发人员:梁伦纲靳济槊王泰福谌于蓝庞焱萌赵立见戴文韬唐美芳姜丹
申请(专利权)人:深圳华大医学检验实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1