基于大语言模型的医药解答方法、装置、设备及介质制造方法及图纸

技术编号：41303744 阅读：2 留言：0更新日期：2024-05-13 14:49

本申请提供了一种基于大语言模型的医药解答方法、装置、设备及介质，该方法应用于人工智能技术领域。该方法包括：采用训练数据集对底座大语言模型进行连续预训练，得到候选模型；训练数据集，包括：通用领域的数据和医药领域的数据；采用训练指令集对所述候选模型中的至少部分网络参数进行调整，得到医药解答模型；训练指令集，包括：通用领域的指令和医药领域的指令；在进行医药查询信息的医药解答时，采用医药解答模型，确定医药查询信息匹配的目标医药解答数据。该方法通过医药解答模型能够快速且精准地为患者端提供医药解答数据，既能够减少医师端的工作量，还能够提高输出的医药解答数据的精确度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，并且更具体地，涉及人工智能中一种基于大语言模型的医药解答方法、装置、设备及介质。

技术介绍

1、随着外卖平台服务水平的提高和医疗卫生服务的普及，越来越多的人选择通过外卖平台进行药品购买，但是局限于医药知识的专业性，用户希望能够通过在线平台与医生进行交流咨询，以获取更好的信息服务。基于此，外卖类应用程序中具备药品购买前的医师咨询功能。医师需要对患者的病情、症状进行全方面的询问，推理出病情诊断，并最终推荐用户所需要购买的药品。但是在医师端资源不足的情况下，大量的医药查询信息使得医师端不能够及时为用户端提供解答。

技术实现思路

1、本申请提供了一种基于大语言模型的医药解答方法、装置、设备及介质，该方法通过医药解答模型能够快速且精准地为患者端提供医药解答数据，既能够减少医师端的工作量，还能够提高输出的医药解答数据的精确度。

2、第一方面，提供了一种基于大语言模型的医药解答方法，该方法包括：

3、采用训练数据集对底座大语言模型进行连续预训练，得到候选模型；其中，所述训练数据集，包括：通用领域的数据和医药领域的数据；

4、采用训练指令集对所述候选模型中的至少部分网络参数进行调整，得到医药解答模型；其中，所述训练指令集，包括：所述通用领域的指令和所述医药领域的指令；

5、在进行医药查询信息的医药解答时，采用所述医药解答模型，确定所述医药查询信息匹配的目标医药解答数据。

6、上述技术方案中，首先通过包括通用领域的数据和

7、结合上述第一方面，在一些可能的实现方式中，采用训练指令集对所述候选模型中的至少部分网络参数进行调整，得到医药解答模型之前，所述方法还包括：

8、获取历史医患对话数据；

9、基于所述历史医患对话数据和预设提示词，构建所述医药领域的指令。

10、在上述方式中，通过对历史医患对话数据结合预设提示词，构建医药领域的指令，从而能够使得医药领域的指令中既包括医师和患者的多轮对话，还包括医师端最终给出的医药解答数据，进而使得训练指令集中的医药领域的指令更加丰富。

11、结合上述第一方面，在一些可能的实现方式中，所述基于所述历史医患对话数据和预设提示词，构建所述医药领域的指令，包括：

12、在所述历史医患对话数据中，确定医师端的历史医药解答数据；

13、将所述历史医患对话数据中除所述历史医药解答数据之外的对话数据和预设提示词作为所述医药领域的指令中的输入，将所述历史医药解答数据作为所述医药领域的指令中的输出，以构建所述医药领域的指令。

14、在上述方式中，通过将医师端末次回复的历史医药解答数据作为输出，预设提示词和剩余的历史医患对话作为输入，以构建医药领域的指令，能够丰富该医药领域的指令，还能够使得该医药领域的指令更加具有针对性，从而通过该医药领域的指令训练后的医药解答模型能够在医药领域具有更好的性能。

15、结合上述第一方面，在一些可能的实现方式中，所述基于所述历史医患对话数据和预设提示词，构建所述医药领域的指令，包括：

16、基于预设命令信息对所述预设提示词进行更新，得到已更新提示词；其中，所述预设命令信息用于表示所述医药领域的指令中所需的医药解答数据的条目数以及字符数；

17、采用所述候选模型基于所述已更新提示词和所述历史医患对话数据进行数据增强，得到满足所述字符数和所述条目数的中间医药解答数据；

18、将所述历史医患对话数据和所述已更新提示词作为所述医药领域的指令中的输入，将所述中间医药解答数据作为所述医药领域的指令中的输出，以构建所述医药领域的指令。

19、在上述方式中，通过在预设提示词中增加预设命令信息，从而通过候选模型的数据增强能力，使得候选模型能够按照预设命令信息中所指示的医药解答数据的条目数以及字符数，生成多条中间医药解答数据作为输出，能够使得构建的医药领域的指令更加充足且丰富；这样，通过该医药领域的指令训练得到医药解答模型，能够提高该医药解答模型在医药领域的定向性功能。

20、结合上述第一方面，在一些可能的实现方式中，所述将所述历史医患对话数据和所述已更新提示词作为所述医药领域的指令中的输入，将所述中间医药解答数据作为所述医药领域的指令中的输出，以构建所述医药领域的指令，包括：

21、在所述历史医患对话数据中滤除医师端的历史医药解答数据，得到已处理对话数据；

22、对所述已更新提示词中所命令的条目数进行调整，得到已调整提示词；

23、在所述中间医药解答数据中，确定与所述已调整提示词中的条目数相匹配的候选医药解答数据；

24、将所述已处理对话数据和所述已调整提示词作为所述医药领域的指令中的输入，将所述候选医药解答数据作为所述医药领域的指令中的输出，以构建所述医药领域的指令。

25、在上述方式中，在得到的多条中间医药解答数据的基础上，通过更改已更新提示词中的条目数，在多条中间医药解答数据中选择出与更改后的条目数匹配的候选医药解答数据，从而通过已处理对话数据和已调整提示词作为输入，候选医药解答数据作为输出，构建多条医药领域的指令，能够提高该医药领域的指令的多样性。

26、结合上述第一方面，在一些可能的实现方式中，所述方法还包括：

27、在所述历史医患对话数据中，识别表征进行药品推荐的关键词；

28、基于所述关键词在所述历史医患对话数据中的位置，对所述历史医患对话数据进行划分，得到第一对话数据和第二对话数据；其中，所述第一对话数据位于所述关键词所在语句之前，所述第二对话数据位于所述关键词所在语句之后且包括多少关键词所在的语句；

29、在所述第二对话数据中，确定目标药品数据；

30、将所述第一对话数据作为输入，所述目标药品数据作为输出，以构建所述医药领域的指令。

31、在上述方式中，通过对表征进行药品推荐的关键词进行识别，并在该关键词所在位置对历史医患对话数据进行截断，从而能够精准确定出该对话中的目标药品数据，进而将预设提示词和第一对话数据作为输入，目标药品数据作为输出，使得构建得到的医药领域的指令能够应用于药品推荐的训练过程，以提本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的医药解答方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述采用训练指令集对所述候选模型中的至少部分网络参数进行调整，得到医药解答模型之前，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述历史医患对话数据和预设提示词，构建所述医药领域的指令，包括：

4.根据权利要求2或3所述的方法，其特征在于，所述基于所述历史医患对话数据和预设提示词，构建所述医药领域的指令，包括：

5.根据权利要求4所述的方法，其特征在于，所述将所述历史医患对话数据和所述已更新提示词作为所述医药领域的指令中的输入，将所述中间医药解答数据作为所述医药领域的指令中的输出，以构建所述医药领域的指令，包括：

6.根据权利要求2或3所述的方法，其特征在于，所述方法还包括：

7.根据权利要求1所述的方法，其特征在于，所述通用领域的数据，包括：非餐饮类数据和餐饮类数据，所述采用训练数据集对基座大语言模型进行连续预训练，得到候选模型，包括：

8.根据权利要求1所述的方法

9.一种基于大语言模型的医药解答方法，其特征在于，所述方法包括：

10.一种基于大语言模型的医药解答装置，其特征在于，包括：

11.一种基于大语言模型的医药解答装置，其特征在于，包括：

12.一种服务器，其特征在于，包括：

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，当所述计算机指令在电子设备上运行时，使得所述电子设备执行如权利要求1至8中任一项所述的方法，或，当所述计算机指令在电子设备上运行时，使得所述电子设备执行如权利要求9所述的方法。

...

【技术特征摘要】

1.一种基于大语言模型的医药解答方法，其特征在于，所述方法包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述历史医患对话数据和预设提示词，构建所述医药领域的指令，包括：

4.根据权利要求2或3所述的方法，其特征在于，所述基于所述历史医患对话数据和预设提示词，构建所述医药领域的指令，包括：

6.根据权利要求2或3所述的方法，其特征在于，所述方法还包括：

7.根据权利要求1所述的方法，...

【专利技术属性】
技术研发人员：胡盼盼，
申请(专利权)人：浙江口碑网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人