基于人工智能的自动回复对话方法、装置、设备及介质制造方法及图纸

技术编号:38326315 阅读:12 留言:0更新日期:2023-07-29 09:09
本申请提出一种基于人工智能的自动回复对话方法、装置、电子设备及存储介质,基于人工智能的自动回复对话方法包括:对采集到的对话文本进行预处理获得对话数据集;获取所述对话数据集中每个输入文本的回复候选池;对所述回复文本进行标注获得对话训练数据集;基于所述对话训练数据集和预设的神经网络模型进行多任务学习获得场景回复评估模型;实时采集对话文本以获取目标输入文本的目标回复候选池;基于所述场景回复评估模型对所述目标回复候选池中的回复文本进行评分获得目标回复评分值;基于所述目标回复评分值对所述目标输入文本进行回复。本申请能够从多个角度综合考虑回复文本是否合理,以筛选出合适的回复文本进行更为准确地回复。为准确地回复。为准确地回复。

【技术实现步骤摘要】
基于人工智能的自动回复对话方法、装置、设备及介质


[0001]本申请涉及人工智能
,尤其涉及一种基于人工智能的自动回复对话方法、装置、电子设备及存储介质。

技术介绍

[0002]自然语言处理一直是人工智能领域的热门方案,其中对话能力一直被认为是解决通用人工智能的终极命题之一。随着神经网络技术的日益成熟,开放域的对话系统也随着技术的发展被提出了越来越高的要求,即能够在开放域内进行有意义的对话,而不是完全的闲聊。
[0003]随着越来越多的大模型的提出、知识融合技术的应用等方法,神经对话生成模型生成的回复也越来越自然流畅。然而在目前的端到端的对话模型中,仍然经常出现很多低质量回复,如在智能客服系统中容易出现上下文逻辑冲突,回复信息与背景不符或通用模板导致的对话过程过于乏味,甚至是生成一些存在偏见的敏感回复。这些低质量回复使得这些大模型或系统不能够针对用户的输入文本进行准确回复,从而严重制约了这些大模型或系统的实际应用价值。

技术实现思路

[0004]鉴于以上内容,有必要提出一种基于人工智能的自动回复对话方法、装置、电子设备及存储介质,以解决如何针对用户的输入文本进行准确回复这一技术问题。
[0005]本申请提供一种基于人工智能的自动回复对话方法,所述方法包括:
[0006]对采集到的对话文本进行预处理获得对话数据集,所述对话数据集包括多轮对话文本,每一轮对话文本包括一个输入文本和一个回复文本;
[0007]依据对话生成模型获取所述对话数据集中每个输入文本的多个回复文本获得所述每个输入文本的回复候选池;
[0008]对所有的回复候选池中的回复文本进行标注获得对话训练数据集;
[0009]基于所述对话训练数据集和预设的神经网络模型进行多任务学习获得场景回复评估模型;
[0010]实时采集对话文本,并通过对话生成模型获取所述对话文本中目标输入文本的目标回复候选池;
[0011]基于所述场景回复评估模型对所述目标回复候选池中的回复文本进行评分获得目标回复评分值;
[0012]基于所述目标回复评分值筛选出与所述目标输入文本相匹配的回复文本以对所述目标输入文本进行回复。
[0013]在一些实施例中,所述对采集到的对话文本进行预处理获得对话数据集包括:
[0014]依据预设方式爬取对话文本获得对话文本数据集;
[0015]对所述对话文本数据集进行词语切分获得对话词语数据集;
[0016]统计所述对话词语数据集中的词语词频;
[0017]过滤所述对话词语数据集中的低频词语获得对话数据集。
[0018]在一些实施例中,所述对所有的回复候选池中的回复文本进行标注获得对话训练数据集,包括:
[0019]依据对话生成模型获取所述对话数据集每一轮对话中用户的输入文本对应的回复候选池;
[0020]依据预设的对话判别标签对所述回复候选池中的回复文本进行标注获得回复文本标签集,所述对话判别标签包括全局判别标签、局部判别标签、安全判别标签和场景判别标签;
[0021]遍历所述回复候选池获得每一轮对话所产生的回复文本标签集,并将所述对话数据集中所有的输入文本以及各输入文本对应的回复文本标签集作为对话训练数据集。
[0022]在一些实施例中,所述基于所述对话训练数据集和预设的神经网络模型进行多任务学习获得场景回复评估模型,包括:
[0023]依据所述对话训练数据集中的目标判别标签对预设的神经网络模型进行训练以使所述神经网络模型能够获取所述回复文本的目标判别评分值,所述目标判别标签为所述判别标签中的任意一种;
[0024]遍历所述全局判别标签、局部判别标签、安全判别标签和场景判别标签以使所述神经网络模型进行多任务学习,并在经过多任务学习后能够同时获取所述回复文本的全局判别评分值、局部判别评分值、安全判别评分值和场景判别评分值;
[0025]将能够同时获取所述回复文本的全局判别评分值、局部判别评分值、安全判别评分值和场景判别评分值的神经网络模型作为场景回复评估模型。
[0026]在一些实施例中,所述依据所述对话训练数据集中的目标判别标签对预设的神经网络模型进行训练以使所述神经网络模型能够获取所述回复文本的目标判别评分值,包括:
[0027]依据预设的神经网络模型将经过目标判别标签标注过的对话数据转化为对话词向量;
[0028]基于所述对话词向量构建对话词权重矩阵;
[0029]基于所述对话词权重矩阵将经过目标判别标签标注过的对话数据转化为对话语句向量;
[0030]基于所述对话语句向量构建所述回复文本的回复文本向量;
[0031]基于所述神经网络模型中的分类器对所述回复文本向量进行分类获得所述回复文本向量的输出目标判别评分值;
[0032]基于交叉熵损失函数计算所述输出目标判别评分值和对应的目标判别标签之间的分类损失;
[0033]基于所述分类损失对所述神经网络模型进行迭代训练以使所述神经网络模型能够获取所述回复文本的目标判别评分值。
[0034]在一些实施例中,所述基于所述场景回复评估模型对所述目标回复候选池中的回复文本进行评分获得目标回复评分值,包括:
[0035]基于所述场景回复评估模型计算所述目标回复候选池中各回复文本的全局判别
评分值、局部判别评分值、安全判别评分值和场景判别评分值;
[0036]依据所述目标回复候选池所在的场景分别对所述回复文本的全局判别评分值、局部判别评分值、安全判别评分值和场景判别评分值进行权重分配;
[0037]对所述回复文本的全局判别评分值、局部判别评分值、安全判别评分值、场景判别评分值和各判别评分值对应的权重进行加权求和获得目标回复评分值,所述目标回复评分值和所述回复文本一一对应。
[0038]在一些实施例中,所述基于所述目标回复评分值筛选出与所述目标输入文本相匹配的回复文本以对所述目标输入文本进行回复,包括:
[0039]对所述目标回复候选池内各回复文本的目标回复评分值按照由大到小的顺序进行排序;
[0040]选取排名在第一位的目标回复评分值所对应的回复文本作为与所述目标输入文本相匹配的回复文本;
[0041]依据与所述目标输入文本相匹配的回复文本对目标输入文本进行回复。
[0042]本申请实施例还提供一种基于人工智能的自动回复对话装置,所述装置包括预处理模块、获得模块、标注模块、学习模块、采集模块、评分模块以及筛选模块:
[0043]所述预处理模块,用于对采集到的对话文本进行预处理获得对话数据集,所述对话数据集包括多轮对话文本,每一轮对话文本包括一个输入文本和一个回复文本;
[0044]所述获得模块,用于依据对话生成模型获取所述对话数据集中每个输入文本的多个回复文本获得所述每个输入文本的回复候选池;
[0045]所述标注模块,用于对所有的回复候选池中的回复文本进行标注获得对话训练数据集;...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的自动回复对话方法,其特征在于,所述方法包括:对采集到的对话文本进行预处理获得对话数据集,所述对话数据集包括多轮对话文本,每一轮对话文本包括一个输入文本和一个回复文本;依据对话生成模型获取所述对话数据集中每个输入文本的多个回复文本获得所述每个输入文本的回复候选池;对所有的回复候选池中的回复文本进行标注获得对话训练数据集;基于所述对话训练数据集和预设的神经网络模型进行多任务学习获得场景回复评估模型;实时采集对话文本,并通过对话生成模型获取所述对话文本中目标输入文本的目标回复候选池;基于所述场景回复评估模型对所述目标回复候选池中的回复文本进行评分获得目标回复评分值;基于所述目标回复评分值筛选出与所述目标输入文本相匹配的回复文本以对所述目标输入文本进行回复。2.如权利要求1所述的基于人工智能的自动回复对话方法,其特征在于,所述对采集到的对话文本进行预处理获得对话数据集包括:依据预设方式爬取对话文本获得对话文本数据集;对所述对话文本数据集进行词语切分获得对话词语数据集;统计所述对话词语数据集中的词语词频;过滤所述对话词语数据集中的低频词语获得对话数据集。3.如权利要求1所述的基于人工智能的自动回复对话方法,其特征在于,所述对所有的回复候选池中的回复文本进行标注获得对话训练数据集,包括:依据对话生成模型获取所述对话数据集每一轮对话中用户的输入文本对应的回复候选池;依据预设的对话判别标签对所述回复候选池中的回复文本进行标注获得回复文本标签集,所述对话判别标签包括全局判别标签、局部判别标签、安全判别标签和场景判别标签;遍历所述回复候选池获得每一轮对话所产生的回复文本标签集,并将所述对话数据集中所有的输入文本以及各输入文本对应的回复文本标签集作为对话训练数据集。4.如权利要求3所述的基于人工智能的自动回复对话方法,其特征在于,所述基于所述对话训练数据集和预设的神经网络模型进行多任务学习获得场景回复评估模型,包括:依据所述对话训练数据集中的目标判别标签对预设的神经网络模型进行训练以使所述神经网络模型能够获取所述回复文本的目标判别评分值,所述目标判别标签为所述判别标签中的任意一种;遍历所述全局判别标签、局部判别标签、安全判别标签和场景判别标签以使所述神经网络模型进行多任务学习,并在经过多任务学习后能够同时获取所述回复文本的全局判别评分值、局部判别评分值、安全判别评分值和场景判别评分值;将能够同时获取所述回复文本的全局判别评分值、局部判别评分值、安全判别评分值和场景判别评分值的神经网络模型作为场景回复评估模型。
5.如权利要求4所述的基于人工智能的自动回复对话方法,其特征在于,所述依据所述对话训练数据集中的目标判别标签对预设的神经网络模型进行训练以使所述神经网络模型能够获取所述回复文本的目标判别评分值,包括:依据预设的神经网络模型将经过目标判别标签标注过的对话数据转化为对话词向量;基于所述对话词向量构建对话词权重矩阵;基于所述对话词权重矩阵将经过目标判别标签标注过的对话数据转化为对话语句向量;基于所述对话语句向量构建所述...

【专利技术属性】
技术研发人员:王世朋马凯宁姚海申刘佳瑞尹婧煜
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1