System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于大语言模型的医药解答方法、装置、设备及介质制造方法及图纸_技高网

基于大语言模型的医药解答方法、装置、设备及介质制造方法及图纸

技术编号:41303744 阅读:2 留言:0更新日期:2024-05-13 14:49
本申请提供了一种基于大语言模型的医药解答方法、装置、设备及介质,该方法应用于人工智能技术领域。该方法包括:采用训练数据集对底座大语言模型进行连续预训练,得到候选模型;训练数据集,包括:通用领域的数据和医药领域的数据;采用训练指令集对所述候选模型中的至少部分网络参数进行调整,得到医药解答模型;训练指令集,包括:通用领域的指令和医药领域的指令;在进行医药查询信息的医药解答时,采用医药解答模型,确定医药查询信息匹配的目标医药解答数据。该方法通过医药解答模型能够快速且精准地为患者端提供医药解答数据,既能够减少医师端的工作量,还能够提高输出的医药解答数据的精确度。

【技术实现步骤摘要】

本申请涉及人工智能,并且更具体地,涉及人工智能中一种基于大语言模型的医药解答方法、装置、设备及介质


技术介绍

1、随着外卖平台服务水平的提高和医疗卫生服务的普及,越来越多的人选择通过外卖平台进行药品购买,但是局限于医药知识的专业性,用户希望能够通过在线平台与医生进行交流咨询,以获取更好的信息服务。基于此,外卖类应用程序中具备药品购买前的医师咨询功能。医师需要对患者的病情、症状进行全方面的询问,推理出病情诊断,并最终推荐用户所需要购买的药品。但是在医师端资源不足的情况下,大量的医药查询信息使得医师端不能够及时为用户端提供解答。


技术实现思路

1、本申请提供了一种基于大语言模型的医药解答方法、装置、设备及介质,该方法通过医药解答模型能够快速且精准地为患者端提供医药解答数据,既能够减少医师端的工作量,还能够提高输出的医药解答数据的精确度。

2、第一方面,提供了一种基于大语言模型的医药解答方法,该方法包括:

3、采用训练数据集对底座大语言模型进行连续预训练,得到候选模型;其中,所述训练数据集,包括:通用领域的数据和医药领域的数据;

4、采用训练指令集对所述候选模型中的至少部分网络参数进行调整,得到医药解答模型;其中,所述训练指令集,包括:所述通用领域的指令和所述医药领域的指令;

5、在进行医药查询信息的医药解答时,采用所述医药解答模型,确定所述医药查询信息匹配的目标医药解答数据。

6、上述技术方案中,首先通过包括通用领域的数据和医药领域的数据的训练数据集对底座大语言模型进行持续预训练,以实现第一阶段的训练过程,得到候选模型;这样,将通用领域的数据和医药领域的数据作为训练数据,对底座大语言模型进行持续预训练,使得到的候选模型既具有更好地泛化能力,同时在医药领域也具有更好的性能。之后,采用训练指令集对候选模型中的至少部分网络参数进行调整,以实现第二阶段的训练过程,得到医药解答模型;这样,通过通用领域的指令和医药领域的指令对候选模型进行训练,使得到的医药解答模型能够更加准确地进行医药解答。在进行医药查询信息的医药解答时,通过医药解答模型能够快速且精准地为患者端提供医药解答数据,既能够减少医师端的工作量,还能够提高输出的医药解答数据的精确度。

7、结合上述第一方面,在一些可能的实现方式中,采用训练指令集对所述候选模型中的至少部分网络参数进行调整,得到医药解答模型之前,所述方法还包括:

8、获取历史医患对话数据;

9、基于所述历史医患对话数据和预设提示词,构建所述医药领域的指令。

10、在上述方式中,通过对历史医患对话数据结合预设提示词,构建医药领域的指令,从而能够使得医药领域的指令中既包括医师和患者的多轮对话,还包括医师端最终给出的医药解答数据,进而使得训练指令集中的医药领域的指令更加丰富。

11、结合上述第一方面,在一些可能的实现方式中,所述基于所述历史医患对话数据和预设提示词,构建所述医药领域的指令,包括:

12、在所述历史医患对话数据中,确定医师端的历史医药解答数据;

13、将所述历史医患对话数据中除所述历史医药解答数据之外的对话数据和预设提示词作为所述医药领域的指令中的输入,将所述历史医药解答数据作为所述医药领域的指令中的输出,以构建所述医药领域的指令。

14、在上述方式中,通过将医师端末次回复的历史医药解答数据作为输出,预设提示词和剩余的历史医患对话作为输入,以构建医药领域的指令,能够丰富该医药领域的指令,还能够使得该医药领域的指令更加具有针对性,从而通过该医药领域的指令训练后的医药解答模型能够在医药领域具有更好的性能。

15、结合上述第一方面,在一些可能的实现方式中,所述基于所述历史医患对话数据和预设提示词,构建所述医药领域的指令,包括:

16、基于预设命令信息对所述预设提示词进行更新,得到已更新提示词;其中,所述预设命令信息用于表示所述医药领域的指令中所需的医药解答数据的条目数以及字符数;

17、采用所述候选模型基于所述已更新提示词和所述历史医患对话数据进行数据增强,得到满足所述字符数和所述条目数的中间医药解答数据;

18、将所述历史医患对话数据和所述已更新提示词作为所述医药领域的指令中的输入,将所述中间医药解答数据作为所述医药领域的指令中的输出,以构建所述医药领域的指令。

19、在上述方式中,通过在预设提示词中增加预设命令信息,从而通过候选模型的数据增强能力,使得候选模型能够按照预设命令信息中所指示的医药解答数据的条目数以及字符数,生成多条中间医药解答数据作为输出,能够使得构建的医药领域的指令更加充足且丰富;这样,通过该医药领域的指令训练得到医药解答模型,能够提高该医药解答模型在医药领域的定向性功能。

20、结合上述第一方面,在一些可能的实现方式中,所述将所述历史医患对话数据和所述已更新提示词作为所述医药领域的指令中的输入,将所述中间医药解答数据作为所述医药领域的指令中的输出,以构建所述医药领域的指令,包括:

21、在所述历史医患对话数据中滤除医师端的历史医药解答数据,得到已处理对话数据;

22、对所述已更新提示词中所命令的条目数进行调整,得到已调整提示词;

23、在所述中间医药解答数据中,确定与所述已调整提示词中的条目数相匹配的候选医药解答数据;

24、将所述已处理对话数据和所述已调整提示词作为所述医药领域的指令中的输入,将所述候选医药解答数据作为所述医药领域的指令中的输出,以构建所述医药领域的指令。

25、在上述方式中,在得到的多条中间医药解答数据的基础上,通过更改已更新提示词中的条目数,在多条中间医药解答数据中选择出与更改后的条目数匹配的候选医药解答数据,从而通过已处理对话数据和已调整提示词作为输入,候选医药解答数据作为输出,构建多条医药领域的指令,能够提高该医药领域的指令的多样性。

26、结合上述第一方面,在一些可能的实现方式中,所述方法还包括:

27、在所述历史医患对话数据中,识别表征进行药品推荐的关键词;

28、基于所述关键词在所述历史医患对话数据中的位置,对所述历史医患对话数据进行划分,得到第一对话数据和第二对话数据;其中,所述第一对话数据位于所述关键词所在语句之前,所述第二对话数据位于所述关键词所在语句之后且包括多少关键词所在的语句;

29、在所述第二对话数据中,确定目标药品数据;

30、将所述第一对话数据作为输入,所述目标药品数据作为输出,以构建所述医药领域的指令。

31、在上述方式中,通过对表征进行药品推荐的关键词进行识别,并在该关键词所在位置对历史医患对话数据进行截断,从而能够精准确定出该对话中的目标药品数据,进而将预设提示词和第一对话数据作为输入,目标药品数据作为输出,使得构建得到的医药领域的指令能够应用于药品推荐的训练过程,以提本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的医药解答方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述采用训练指令集对所述候选模型中的至少部分网络参数进行调整,得到医药解答模型之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述历史医患对话数据和预设提示词,构建所述医药领域的指令,包括:

4.根据权利要求2或3所述的方法,其特征在于,所述基于所述历史医患对话数据和预设提示词,构建所述医药领域的指令,包括:

5.根据权利要求4所述的方法,其特征在于,所述将所述历史医患对话数据和所述已更新提示词作为所述医药领域的指令中的输入,将所述中间医药解答数据作为所述医药领域的指令中的输出,以构建所述医药领域的指令,包括:

6.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述通用领域的数据,包括:非餐饮类数据和餐饮类数据,所述采用训练数据集对基座大语言模型进行连续预训练,得到候选模型,包括:

8.根据权利要求1所述的方法,其特征在于,所述采用训练数据集对底座大语言模型进行连续预训练,得到候选模型之前,所述方法还包括:

9.一种基于大语言模型的医药解答方法,其特征在于,所述方法包括:

10.一种基于大语言模型的医药解答装置,其特征在于,包括:

11.一种基于大语言模型的医药解答装置,其特征在于,包括:

12.一种服务器,其特征在于,包括:

13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在电子设备上运行时,使得所述电子设备执行如权利要求1至8中任一项所述的方法,或,当所述计算机指令在电子设备上运行时,使得所述电子设备执行如权利要求9所述的方法。

...

【技术特征摘要】

1.一种基于大语言模型的医药解答方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述采用训练指令集对所述候选模型中的至少部分网络参数进行调整,得到医药解答模型之前,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述历史医患对话数据和预设提示词,构建所述医药领域的指令,包括:

4.根据权利要求2或3所述的方法,其特征在于,所述基于所述历史医患对话数据和预设提示词,构建所述医药领域的指令,包括:

5.根据权利要求4所述的方法,其特征在于,所述将所述历史医患对话数据和所述已更新提示词作为所述医药领域的指令中的输入,将所述中间医药解答数据作为所述医药领域的指令中的输出,以构建所述医药领域的指令,包括:

6.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的方法,...

【专利技术属性】
技术研发人员:胡盼盼
申请(专利权)人:浙江口碑网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1