对话生成方法、装置、电子设备及介质制造方法及图纸

技术编号:39062912 阅读:11 留言:0更新日期:2023-10-12 19:55
本发明专利技术涉及数字医疗场景下的人工智能技术,揭露一种对话生成方法,包括:提取对话数据集中的对话拼接数据和参考回复数据,根据对话拼接数据和参考回复数据构建训练数据对;将训练数据对中的对话拼接数据输入至对话生成模型中,根据核采样算法生成对话拼接数据对应的多个模型回复;计算多个模型回复与真实回复之间的相似度,得到多个相似度值,基于多个相似度值构建对话生成模型的最终优化损失函数,利用最终优化损失函数对对话生成模型进行训练得到标准生成模型;将待处理数据输入至标准生成模型中,得到待处理数据对应的对话集。本发明专利技术还提出一种对话生成装置、电子设备以及存储介质。本发明专利技术可以提高数字医疗场景下对话生成的效率。的效率。的效率。

【技术实现步骤摘要】
对话生成方法、装置、电子设备及介质


[0001]本专利技术涉及人工智能领域,尤其涉及一种对话生成方法、装置、电子设备及存储介质。

技术介绍

[0002]在数字医疗领域中,互联网医院也在普及,患者希望能够在互联网医院中进行问诊并得到准确的回复。在互联网医院问诊的背后,是通过医学对话模型来实现对患者进行回复,其中,医学对话模型可以学习海量的医学文本和医患对话,来模拟医生与患者进行沟通,同时收集症状信息来提供诊断或者提供用药建议。因此,医学对话模型的优化十分重要,现有的优化模型方法通常是通过有监督微调的方法实现,有监督微调的方法需要非常高质量的标注数据去训练模型,以激发大模型的生成能力,但是这种方法对标注数据的要求很高,进而导致对话生成的效率较低。因此,亟待提出一种效率更高的对话生成方法。

技术实现思路

[0003]本专利技术提供一种对话生成方法、装置、电子设备及存储介质,其主要目的在于提高数字医疗场景下对话生成的效率。
[0004]为实现上述目的,本专利技术提供的一种对话生成方法,包括:
[0005]获取对话数据集,提取所述对话数据集中的对话拼接数据和参考回复数据,并根据所述对话拼接数据和所述参考回复数据构建训练数据对;
[0006]将所述训练数据对中的对话拼接数据输入至预设对话生成模型中,并根据核采样算法生成所述对话拼接数据对应的多个模型回复;
[0007]利用预设指标公式计算所述多个模型回复与预设真实回复之间的相似度,得到多个相似度值,基于所述多个相似度值构建对话所述生成模型的最终优化损失函数,利用所述最终优化损失函数对所述对话生成模型进行训练处理,得到标准生成模型;
[0008]将待处理数据输入至所述标准生成模型中,得到所述待处理数据对应的对话集。
[0009]可选地,所述提取所述对话数据集中的对话拼接数据,包括:
[0010]识别所述对话数据集中不同对话数据对应的对话标识,并根据所述对话标识对所述对话数据集进行数据划分,得到多个对话数据;
[0011]将所述多个对话数据进行拼接处理,得到对话拼接数据。
[0012]可选地,所述根据核采样算法生成所述对话拼接数据对应的多个模型回复,包括:
[0013]将所述对话拼接数据输入至所述对话生成模型中,得到多个初始回复;
[0014]根据预构建的核采样矩阵对所述多个初始回复进行排序处理,得到排序后的初始回复;
[0015]抽取所述排序后的初始回复中符合预设筛选要求的回复作为筛选回复集,并对所述筛选回复集中的回复进行随机采样,得到多个模型回复。
[0016]可选地,所述根据预构建的核采样矩阵对所述多个初始回复进行排序处理之前,
所述方法还包括:
[0017]获取预设参考阈值和温度参数,根据所述参考阈值和温度参数构造核采样函数;
[0018]根据所述核采样函数构造对应的核采样矩阵。
[0019]可选地,所述抽取所述排序后的初始回复中符合预设筛选要求的回复作为筛选回复集,包括:
[0020]识别所述排序后的初始回复中不同初始回复对应的回复概率,并按照排序后的初始回复的顺序对回复的概率进行逐个相加;
[0021]当逐个相加后的概率相加值大于预设参考阈值时,将相加之前的初始回复作为筛选回复集。
[0022]可选地,所述基于所述多个相似度值构建对话所述生成模型的最终优化损失函数,包括:
[0023]根据预设排序值计算公式计算所述训练数据对的训练排序值,根据所述训练排序值和所述多个相似度值构建排序损失函数;
[0024]构建所述真实回复对应的回复损失函数,将所述排序损失函数和所述回复损失函数进行求和处理,得到最终优化损失函数。
[0025]可选地,所述利用所述最终优化损失函数对所述对话生成模型进行训练处理,得到标准生成模型,包括:
[0026]根据所述最终优化损失函数计算所述对话生成模型中训练数据对的最终优化损失值;
[0027]将所述最终优化损失值与预设的参考阈值进行比较,当所述最终优化损失值大于或者等于所述参考阈值时,对所述对话生成模型进行参数调整,直至参数调整后的对话生成模型的最终优化损失值小于所述参考阈值时,将参数调整后的对话生成模型作为标准生成模型;
[0028]当所述最终优化损失值小于所述参考阈值时,将对话生成模型作为标准生成模型。
[0029]为了解决上述问题,本专利技术还提供一种对话生成装置,所述装置包括:
[0030]数据对构建模块,用于获取对话数据集,提取所述对话数据集中的对话拼接数据和参考回复数据,并根据所述对话拼接数据和所述参考回复数据构建训练数据对;
[0031]模型回复生成模块,用于将所述训练数据对中的对话拼接数据输入至预设对话生成模型中,并根据核采样算法生成所述对话拼接数据对应的多个模型回复;
[0032]模型训练模块,用于利用预设指标公式计算所述多个模型回复与预设真实回复之间的相似度,得到多个相似度值,基于所述多个相似度值构建对话所述生成模型的最终优化损失函数,利用所述最终优化损失函数对所述对话生成模型进行训练处理,得到标准生成模型;
[0033]对话生成模块,用于将待处理数据输入至所述标准生成模型中,得到所述待处理数据对应的对话集。
[0034]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
[0035]至少一个处理器;以及,
[0036]与所述至少一个处理器通信连接的存储器;其中,
[0037]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的对话生成方法。
[0038]为了解决上述问题,本专利技术还提供一种存储介质,所述存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的对话生成方法。
[0039]本专利技术实施例中,通过核采样算法生成预设对话生成模型的多个模型回复,并根据模型回复对预设对话生成模型进行模型优化处理,在优化处理的过程中以指标公式作为衡量对话生成模型质量的奖励函数,不需要额外的复杂算法和网络结构,进一步提高了对话生成模型的优化效率。提升了根据对话生成模型生成待处理数据对应的对话集的效率。因此本专利技术提出的对话生成方法、装置、电子设备及存储介质,可以提高数字医疗场景下对话生成的效率低的问题。
附图说明
[0040]图1为本专利技术一实施例提供的对话生成方法的流程示意图;
[0041]图2为图1中其中一个步骤的详细实施流程示意图;
[0042]图3为本专利技术一实施例提供的对话生成装置的功能模块图;
[0043]图4为本专利技术一实施例提供的实现所述对话生成方法的电子设备的结构示意图。
[0044]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0045]应本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话生成方法,其特征在于,所述方法包括:获取对话数据集,提取所述对话数据集中的对话拼接数据和参考回复数据,并根据所述对话拼接数据和所述参考回复数据构建训练数据对;将所述训练数据对中的对话拼接数据输入至预设对话生成模型中,并根据核采样算法生成所述对话拼接数据对应的多个模型回复;利用预设指标公式计算所述多个模型回复与预设真实回复之间的相似度,得到多个相似度值,基于所述多个相似度值构建对话所述生成模型的最终优化损失函数,利用所述最终优化损失函数对所述对话生成模型进行训练处理,得到标准生成模型;将待处理数据输入至所述标准生成模型中,得到所述待处理数据对应的对话集。2.如权利要求1所述的对话生成方法,其特征在于,所述提取所述对话数据集中的对话拼接数据,包括:识别所述对话数据集中不同对话数据对应的对话标识,并根据所述对话标识对所述对话数据集进行数据划分,得到多个对话数据;将所述多个对话数据进行拼接处理,得到对话拼接数据。3.如权利要求1所述的对话生成方法,其特征在于,所述根据核采样算法生成所述对话拼接数据对应的多个模型回复,包括:将所述对话拼接数据输入至所述对话生成模型中,得到多个初始回复;根据预构建的核采样矩阵对所述多个初始回复进行排序处理,得到排序后的初始回复;抽取所述排序后的初始回复中符合预设筛选要求的回复作为筛选回复集,并对所述筛选回复集中的回复进行随机采样,得到多个模型回复。4.如权利要求3所述的对话生成方法,其特征在于,所述根据预构建的核采样矩阵对所述多个初始回复进行排序处理之前,所述方法还包括:获取预设参考阈值和温度参数,根据所述参考阈值和温度参数构造核采样函数;根据所述核采样函数构造对应的核采样矩阵。5.如权利要求3所述的对话生成方法,其特征在于,所述抽取所述排序后的初始回复中符合预设筛选要求的回复作为筛选回复集,包括:识别所述排序后的初始回复中不同初始回复对应的回复概率,并按照排序后的初始回复的顺序对回复的概率进行逐个相加;当逐个相加后的概率相加值大于预设参考阈值时,将相加之前的初始回复作为筛选回复集。6.如权利要求1所述的对话生成方法,其特征在于,所述基于所述多个相似度值构建对话所述生成模型的...

【专利技术属性】
技术研发人员:王世朋刘佳瑞姚海申
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1