System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 目标模型的训练方法及相关方法、装置、设备和介质制造方法及图纸_技高网

目标模型的训练方法及相关方法、装置、设备和介质制造方法及图纸

技术编号:40921334 阅读:4 留言:0更新日期:2024-04-18 14:46
本申请公开了一种目标模型的训练方法及相关方法、装置、设备和介质,其中,目标模型的训练方法包括:获取样本报告不同于标准报告的至少一个样本异常字段;以标准报告和至少一个样本异常字段为模型实际输入,并以样本报告为模型期望输出,构造得到模型训练数据;基于模型训练数据对预设模型进行训练,得到目标模型。上述方案,能够在提高报告生成效率的前提下,提高报告生成的准确性和针对性。

【技术实现步骤摘要】

本申请涉及人工智能,特别是涉及一种目标模型的训练方法及相关方法、装置、设备和介质


技术介绍

1、在现实场景中,在对某目标对象执行检查之后,通常需要检查者手动撰写检查报告。以医疗行业为例,在对患者执行医疗检查之后,通常需要由医生手动撰写医疗报告,以供留档或在后续阶段之用。

2、但是,上述方式完全依赖于人工工作,报告生成效率较低。虽然,近年来生成式大模型在诸如文案撰写等常规场景中得到越来越多应用。但是,由于与报告生成相关的训练数据较为稀缺,难以训练出比较完备的预训练大模型,导致现有的生成式大模型在报告生成任务中倾向于提供通用且泛化的回答,无法确保准确性和针对性。有鉴于此,如何在提高报告生成效率的前提下,提高报告生成的准确性和针对性,成为亟待解决的问题。


技术实现思路

1、本申请提供一种目标模型的训练方法及相关方法、装置、设备和介质。

2、本申请第一方面提供了一种目标模型的训练方法,包括:获取样本报告不同于标准报告的至少一个样本异常字段;以标准报告和至少一个样本异常字段为模型实际输入,并以样本报告为模型期望输出,构造得到模型训练数据;基于模型训练数据对预设模型进行训练,得到目标模型。

3、因此,获取样本报告不同于标准报告的至少一个样本异常字段,从而以标准报告和至少一个样本异常字段为模型实际收入,并以样本报告为模型期望输出,构造得到模型训练数据,进而基于模型训练数据对预设模型进行训练,得到目标模型,一方面通过目标模型有助于医疗报告生成无需完全依赖于人工工作,从而能够提高医疗报告生成效率,另一方面通过先获取样本异常字段再结合其与标准报告作为模型实际输入且以样本报告作为模型期望输出,以构造得到模型训练数据,并据此训练预设模型,能够使训练大模型既尽可能符合模板要求来生成报告,又尽可能针对体现异常字段。故此,能够在提高报告生成效率的前提下,提高报告生成的准确性和针对性。

4、其中,获取样本报告不同于标准报告的至少一个样本异常字段,包括:将样本报告、标准报告和第一提示输入至大语言模型,得到大语言模型输出的至少一个样本异常字段;其中,第一提示用于指示大语言模型在样本报告中寻找不同于标准报告的异常字段。

5、因此,将样本报告、标准报告和第一提示输入至大语言模型,得到大语言模型输出的至少一个样本异常字段,且第一提示用于指示大语言模型在样本报告中寻找不同于标准报告的异常字段,从而能够充分利用大语言模型的知识理解能力,进而有助于提升挖掘样本异常字段的效率和精度。

6、其中,获取样本报告不同于标准报告的至少一个样本异常字段,包括:基于文档比较模型对样本报告和标准报告进行比对,得到至少一个样本异常字段。

7、因此,基于样本文档比较模型对样本报告和标准报告进行比对,得到至少一个样本异常字段,相较于部署大语言模型挖掘样本异常字段而言,部署文档比较模型能够尽可能地降低挖掘样本异常字段对计算资源的消耗和要求。

8、其中,基于模型训练数据对预设模型进行训练,得到目标模型,包括:构造第二提示;其中,第二提示用于指示预设模型结合标准报告和至少一个样本异常字段生成报告;将标准报告、至少一个样本异常字段和第二提示输入至预设模型,得到预设模型输出的预测报告;基于预测报告和样本报告之间的差异,调整预设模型的网络参数,直至预设模型经若干轮训练收敛,得到目标模型。

9、因此,构造第二提示,且第二提示用于指示预设模型结合标准报告和至少一个样本异常字段生成报告,并将标准报告、至少一个样本异常字段和第二提示输入至预设模型,得到预设模型输出的预测报告,从而基于预测报告和样本报告之间的差异,调整预设模型的网络参数,直至预设模型经若干轮训练收敛,得到目标模型,故能够迫使目标模型结合标准报告和异常字段尽可能地生成真实医疗报告,有助于提升目标模型的准确性。

10、其中,构造第二提示,包括:构造多个第二提示;其中,各个第二提示的指示含义相同;将标准报告、至少一个样本异常字段和第二提示输入至预设模型,得到预设模型输出的预测报告,包括:分别选择各个第二提示,作为当前提示;将标准报告、至少一个样本异常字段和当前提示输入至预设模型,得到预设模型在当前提示下输出的预测报告;基于预测报告和样本报告之间的差异,调整预设模型的网络参数,包括:基于预设模型在各个第二提示下输出的预测报告分别与样本报告之间的差异,调整预设模型的网络参数。

11、因此,构造多个第二提示,且各个第二提示的指示含义相同,再分别选择各个第二提示,作为当前提示,并将标准报告、指示一个样本异常字段和当前提示输入至预设模型,得到预设模型在当前提示下输出的预测报告,从而基于预设模型在各个第二提示下的预测报告分别与样本报告之间的差异,调整预设模型的网络参数,故能够迫使目标模型在不同下都可以尽可能地生成真实报告,有助于提升目标模型的鲁棒性。

12、其中,在样本报告存在多个不同于标准报告的样本异常字段情况下,在将标准报告、至少一个样本异常字段和第二提示输入至预设模型,得到预设模型输出的预测报告之前,方法还包括:随机打乱各个样本异常字段。

13、因此,在样本报告存在多个不同于标准报告的样本异常字段情况下,在将标准报告、至少一个样本异常字段和第二提示输入至预设模型之前,先随机打乱各个样本异常字段,能够尽可能地增强预设模型对字段顺序的学习能力。

14、本申请第二方面提供了一种报告生成方法,包括:获取目标对象的检查异常字段,并获取标准报告;将标准报告、检查异常字段和生成提示输入至目标模型,得到目标模型输出的目标报告;其中,生成提示用于指示目标模型结合标准报告和检查异常字段生成报告,且预设模型基于上述第一方面的训练方法训练得到。

15、因此,获取目标对象的检查异常字段,并获取标准报告,再将标准报告、异常检查字段和生成提示输入至目标模型,得到目标模型输出的目标报告,且生成提示用于指示目标模型结合标准报告和检查异常字段生成报告,预设模型基于上述训练方法训练得到,一方面通过目标模型来生成报告,有助于提升报告生成效率,另一方面采用前述训练方法训练得到的预设模型应用于报告生成的下游任务中,能够提高报告生成的准确性和针对性。

16、其中,检查异常字段在目标对象被执行目标检查之后所确定,获取标准报告,包括:获取与目标检查相匹配的标准报告。

17、因此,检查异常字段在目标对象被执行目标检查之后所确定,从而在获取标准报告时具体获取与目标检查相匹配的标准报告,从而能够进一步提升报告生成的针对性。

18、本申请第三方面提供了一种目标模型的训练装置,包括:异常获取模块、样本构造模块和模型训练模块,异常获取模块,用于获取样本报告不同于标准报告的至少一个样本异常字段;样本构造模块,用于以标准报告和至少一个样本异常字段为模型实际输入,并以样本报告为模型期望输出,构造得到模型训练数据;模型训练模块,用于基于模型训练数据对预设模型进行训练,得到目标模型。

19本文档来自技高网...

【技术保护点】

1.一种目标模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取样本报告不同于标准报告的至少一个样本异常字段,包括:

3.根据权利要求1所述的方法,其特征在于,所述获取样本报告不同于标准报告的至少一个样本异常字段,包括:

4.根据权利要求1至3任一项所述的方法,其特征在于,所述基于所述模型训练数据对预设模型进行训练,得到目标模型,包括:

5.根据权利要求4所述的方法,其特征在于,所述构造第二提示,包括:

6.根据权利要求4或5所述的方法,其特征在于,在所述样本报告存在多个不同于所述标准报告的样本异常字段情况下,在所述将所述标准报告、所述至少一个样本异常字段和所述第二提示输入至所述预设模型,得到所述预设模型输出的预测报告之前,所述方法还包括:

7.一种报告生成方法,其特征在于,包括:

8.根据权利要求7所述的方法,其特征在于,所述检查异常字段在所述目标对象被执行目标检查之后所确定,所述获取标准报告,包括:

9.一种目标模型的训练装置,其特征在于,包括:</p>

10.一种医疗报告生成装置,其特征在于,包括:

11.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述处理器用于执行所述存储器中存储的程序指令,以实现权利要求1至6任一项所述的目标模型的训练方法,或权利要求7或8所述的报告生成方法。

12.一种计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现权利要求1至6任一项所述的目标模型的训练方法,或权利要求7或8所述的报告生成方法。

...

【技术特征摘要】

1.一种目标模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取样本报告不同于标准报告的至少一个样本异常字段,包括:

3.根据权利要求1所述的方法,其特征在于,所述获取样本报告不同于标准报告的至少一个样本异常字段,包括:

4.根据权利要求1至3任一项所述的方法,其特征在于,所述基于所述模型训练数据对预设模型进行训练,得到目标模型,包括:

5.根据权利要求4所述的方法,其特征在于,所述构造第二提示,包括:

6.根据权利要求4或5所述的方法,其特征在于,在所述样本报告存在多个不同于所述标准报告的样本异常字段情况下,在所述将所述标准报告、所述至少一个样本异常字段和所述第二提示输入至所述预设模型,得到所述预设模型输出的预测报告之前,...

【专利技术属性】
技术研发人员:张少霆罗凯艺
申请(专利权)人:上海商汤善萃医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1