System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 目标模型训练方法及相关方法、装置、设备和介质制造方法及图纸_技高网

目标模型训练方法及相关方法、装置、设备和介质制造方法及图纸

技术编号:40929928 阅读:3 留言:0更新日期:2024-04-18 14:51
本申请公开了一种目标模型训练方法及相关方法、装置、设备和介质,其中,目标模型训练方法包括:将报告模板和第一提示输入至大语言模型,得到样本模板;其中,样本模板包含至少一个样本项目以及表征问询样本项目的样本问题;将样本模板和第二提示输入至大语言模型,得到样本实例;其中,样本实例包含样本项目的样本回答;将样本实例和第三提示输入至大语言模型,得到样本对话;基于样本对话和样本实例,对预设模型进行训练得到目标模型。上述方案,能够获取可稳定用于自动访问的目标模型。

【技术实现步骤摘要】

本申请涉及人工智能,特别是涉及一种目标模型训练方法及相关方法、装置、设备和介质


技术介绍

1、通过访问提升服务质量或了解受访者动态,为众多行业普遍采用。以医疗行业为例,通常会对曾在医疗机构就诊的病人以通讯或其他的方式进行医疗随访,以定期了解患者病情变化和指导患者康复。

2、近年来,随着生成式大规模语言模型在众多领域的推广应用,其在访问场景中如何推广应用,也逐渐受到关注。但是,现有技术受限于真实世界中稀缺的行业数据,难以训练得到可稳定用于自动访问的目标模型。有鉴于此,如何获取可稳定用于自动访问的目标模型,成为亟待解决的问题。


技术实现思路

1、本申请提供一种目标模型训练方法及相关方法、装置、设备和介质。

2、本申请第一方面提供了一种目标模型训练方法,包括:将报告模板和第一提示输入至大语言模型,得到样本模板;其中,第一提示用于指示大语言模型根据报告模板构造样本模板,且样本模板包含至少一个样本项目以及表征问询样本项目的样本问题;将样本模板和第二提示输入至大语言模型,得到样本实例;其中,第二提示用于指示大语言模型作为受访者回答样本问题,样本实例包含样本项目的样本回答;将样本实例和第三提示输入至大语言模型,得到样本对话;其中,第三提示用于指示大语言模型根据样本实例构造样本对话;基于样本对话和样本实例,对预设模型进行训练得到目标模型。

3、因此,将报告模板和第一提示输入至大语言模型,得到样本模板,且第一提示用于指示大语言模型根据报告模板构造样本模板,样本模板包含至少一个样本项目,再将样本模板和第二提示输入至大语言模型,得到样本实例,且第二提示用于指示大语言模型作为受访者回答样本项目以及表征问询样本项目的样本问题,样本实例包含样本项目的样本回答,从而将样本实例和第三提示输入至大语言模型,得到样本对话,且第三提示用于指示大语言模型根据样本实例构造样本对话,进而基于样本对话和样本实例,对预设模型进行训练得到目标模型,故相较于通用数据上训练的大规模语言模型而言,通过以依次在三个阶段采用不同提示,利用大语言模型最终构造出专用于访问场景的训练样本,以训练预设模型,能够获取可稳定用于自动访问的目标模型。

4、其中,将样本模板和第二提示输入至大语言模型,得到样本实例,包括:将样本项目的样本问题和第二提示输入至大语言模型,得到样本项目的样本回答;将样本模板中各个样本项目的样本回答,分别附于样本模板中对应的样本项目,得到样本实例。

5、因此,样本模板还定义有表征问询样本项目的样本问题,从而将样本项目的样本问题和第二提示输入至大语言模型,得到样本项目的样本回答,并将样本模板中各个样本项目的样本回答,分别附于样本模板中对应的样本项目,得到样本实例,从而能够尽可能地确保大语言模型作为受访者准确回答样本项目且样本实例保持与样本模板具有相同格式。

6、其中,样本对话包括分别与各个样本项目对应的至少一轮对话,且每轮对话包括样本问题和样本回答。

7、因此,样本对话包括分别与各个样本项目对应的至少一轮对话,且每轮对话包括样本问题和样本回答,故能够尽可能清楚地区分各个样本项目的相关对话。

8、其中,样本模板还定义有回答封闭式样本项目的候选回答和可选范围,在将样本模板和第二提示输入至大语言模型,得到样本实例之前,方法还包括:构造第二提示;其中,第二提示用于指示大语言模型作为受访者遵循可选范围选择样本项目的候选回答作为样本项目的样本回答。

9、因此,样本模板还定义有回答封闭式样本项目的候选回答和可选范围,从而据此构造第二提示,且第二提示用于指示大语言模型作为受访者遵循可选范围选择样本项目的候选回答作为样本项目的样本回答,故能够进一步使大语言模型尽可能准确地回答样本项目。

10、其中,基于样本对话和样本实例,对预设模型进行训练得到目标模型,包括:将样本对话输入至预设模型,得到预设模型生成的预测实例;基于样本实例与预测实例之间的差异,调整预设模型的网络参数,直至预设模型经若干轮训练收敛,得到目标模型。

11、因此,将样本对话输入至预设模型,得到预设模型生成的预测实例,并基于样本实例与预测实例之间的差异,调整预设模型的网络参数,直至预设模型经若干轮训练收敛,得到目标模型,故能够通过样本对话和样本实例进行有效训练,有助于进一步提升目标模型的稳定性和准确性。

12、其中,样本模板为结构化数据,且样本模板中各个样本项目分别为彼此独立的结构体;和/或,报告模板为病例报告模板,样本模板为样本随访模板,样本项目为所述样本随访项目,样本问题为样本随访问题。样本回答为所述样本受访回答,样本实例为样本随访实例,样本对话为样本随访对话。

13、因此,样本模板为结构化数据,且样本模板中各个样本项目分别为彼此独立的结构体,故能够使样本数据尽可能地便于被机器解析,有助于进一步提升目标模型的稳定性和准确性。此外,将报告模板设置为病例报告模板,样本模板设置为样本随访模板,样本项目设置为所述样本随访项目,样本问题设置为样本随访问题。样本回答设置为所述样本受访回答,样本实例设置为样本随访实例,样本对话设置为样本随访对话,能够使得目标模型进一步稳定适用于医疗随访场景。

14、本申请第二方面提供了一种自动访问方法,包括:确定目标对象;基于目标模型与目标对象进行交互,得到目标对象的访问实例;其中,目标模型基于上述第一方面中的训练方法训练得到。

15、因此,确定目标对象,并基于目标模型与目标对象进行交互,得到目标对象的访问实例,且目标模型基于上述目标模型训练方法训练得到,故一方面能够无需人工访问,有助于提高访问自动化程度,降低人力成本,另一方面通过上述目标模型训练方法所训练得到的目标模型与目标对象进行自动访问,也有助于提升访问稳定性。

16、其中,基于目标模型与目标对象进行交互,得到目标对象的访问实例,包括:获取与目标对象匹配的访问模板;其中,访问模板包括至少一个访问项目以及表征问询访问项目的访问问题;基于目标对象对模板中各个访问项目其访问问题的受访回答,得到目标模型与目标对象之间的问答对话;将问答对话输入至目标模型,得到访问实例。

17、因此,获取与目标对象匹配的访问模板,且访问模板包括至少一个访问项目以及表征问询访问项目的访问问题,再基于目标对象对访问模板中各个访问项目的受访回答,得到目标模型与目标对象之间的问答对话,从而将问答对话输入至目标模型,得到访问实例,故能够对目标对象进行个性化访问。

18、其中,获取与目标对象匹配的访问模板,包括:获取与目标对象的对象信息相匹配的报告模板;将与目标对象的对象信息相匹配的报告模板和第一提示输入至大语言模型,得到访问模板。

19、因此,获取与目标对象的对象信息相匹配的报告模板,并将与目标对象的对象信息相匹配的报告模板和第一提示输入至大语言模型,得到访问模板,故能够针对不同对象的对象信息通过目标模型自动开展个性化访问。

20、其中本文档来自技高网...

【技术保护点】

1.一种目标模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述样本模板和第二提示输入至所述大语言模型,得到样本实例,包括:

3.根据权利要求1或2所述的方法,其特征在于,所述样本对话包括分别与各个所述样本项目对应的至少一轮对话,且每轮对话包括所述样本问题和所述样本回答。

4.根据权利要求1至3任一项所述的方法,其特征在于,所述样本模板还定义有回答封闭式所述样本项目的候选回答和可选范围,在所述将所述样本模板和第二提示输入至所述大语言模型,得到样本实例之前,所述方法还包括:

5.根据权利要求1至4任一项所述的方法,其特征在于,所述基于所述样本对话和所述样本实例,对预设模型进行训练得到目标模型,包括:

6.根据权利要求1至5任一项所述的方法,其特征在于,所述样本模板为结构化数据,且所述样本模板中各个所述样本项目分别为彼此独立的结构体;

7.一种自动访问方法,其特征在于,包括:

8.根据权利要求7所述的方法,其特征在于,所述基于目标模型与所述目标对象进行交互,得到所述目标对象的访问实例,包括:

9.根据权利要求8所述的方法,其特征在于,所述获取与所述目标对象匹配的访问模板,包括:

10.根据权利要求8所述的方法,其特征在于,在所述获取与所述目标对象匹配的访问模板之后,以及在所述基于所述目标对象对所述模板中各个所述项目其访问问题的受访回答,得到所述目标模型与所述目标对象之间的问答对话之前,所述方法还包括:

11.一种目标模型训练装置,其特征在于,包括:

12.一种自动访问装置,其特征在于,包括:

13.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述处理器用于执行所述存储器中存储的程序指令,以实现权利要求1至6任一项所述的目标模型训练方法,或权利要求7至10任一项所述的自动访问方法。

14.一种计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现权利要求1至6任一项所述的目标模型训练方法,或权利要求7至10任一项所述的自动访问方法。

...

【技术特征摘要】

1.一种目标模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述样本模板和第二提示输入至所述大语言模型,得到样本实例,包括:

3.根据权利要求1或2所述的方法,其特征在于,所述样本对话包括分别与各个所述样本项目对应的至少一轮对话,且每轮对话包括所述样本问题和所述样本回答。

4.根据权利要求1至3任一项所述的方法,其特征在于,所述样本模板还定义有回答封闭式所述样本项目的候选回答和可选范围,在所述将所述样本模板和第二提示输入至所述大语言模型,得到样本实例之前,所述方法还包括:

5.根据权利要求1至4任一项所述的方法,其特征在于,所述基于所述样本对话和所述样本实例,对预设模型进行训练得到目标模型,包括:

6.根据权利要求1至5任一项所述的方法,其特征在于,所述样本模板为结构化数据,且所述样本模板中各个所述样本项目分别为彼此独立的结构体;

7.一种自动访问方法,其特征在于,包括:

8.根据权利要求7所述的方法,其特征在于...

【专利技术属性】
技术研发人员:张少霆
申请(专利权)人:上海商汤善萃医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1