数据应答处理方法、系统、设备及存储介质技术方案

技术编号:39316425 阅读:13 留言:0更新日期:2023-11-12 15:59
本申请公开了一种数据应答处理方法、系统、设备及存储介质,该方法包括:获取用户待咨询信息和用户信息;对待咨询信息和用户信息进行特征化处理和多模态融合处理,得到预处理结果;将预处理结果输入预先训练好的文本标签匹配模型,得到待咨询信息对应的当前标签结果;基于当前标签结果和预设的标签匹配规则,确定与待咨询信息对应的应答信息。该技术方案使得文本匹配时能够参考更为全面的信息,进而通过采用文本标签匹配模型进行文本匹配处理,显著提高了标签匹配的准确性,并在此基础上结合具体的业务处理规则,能够在复杂的业务场景中更为精准地确定出用户意图标签,进而精准的解决了用户咨询问题,提高了应答效率。提高了应答效率。提高了应答效率。

【技术实现步骤摘要】
数据应答处理方法、系统、设备及存储介质


[0001]本专利技术一般涉及数据处理
,具体涉及一种数据应答处理方法、系统、设备及存储介质。

技术介绍

[0002]随着移动互联网技术的不断发展,很多智能系统或者应用程序中都存在自动应答服务,其通过关键字匹配预置应答内容实现简单的自动应答功能,但是随着业务的快速发展,用户量越来越大,咨询量也越来越大,在遇到复杂的问题时只能通过人工客服咨询。但是通过人工客服处理在时效上已无法满足企业和用户的需求。为了减少客服人员工作量,提升咨询服务的效率和质量,因此,如何在复杂问答场景中进行智能应答处理显得尤为重要。
[0003]目前,相关技术中一种方式是可以通过预置咨询与应答内容,通过识别关键词并匹配对应的咨询与应答内容,然而该方案无法准确识别咨询内容语义,导致匹配到的应答内容正确率较低;另一种方式可以是基于深度学习算法的文本匹配模型获取应答内容,但是该方案所依据的信息较为片面单一,使得匹配的应答内容准确率较低。

技术实现思路

[0004]鉴于现有技术中的上述缺陷或不足,期望提供一种数据应答处理方法、系统、设备及存储介质。
[0005]第一方面,本专利技术提供了一种数据应答处理方法,该方法包括:
[0006]获取用户待咨询信息和用户信息;
[0007]对所述待咨询信息和所述用户信息进行特征化处理和多模态融合处理,得到预处理结果;
[0008]将所述预处理结果输入预先训练好的文本标签匹配模型,得到所述待咨询信息对应的当前标签结果,所述文本标签匹配模型具有对所述待咨询信息进行标签匹配的能力;
[0009]基于所述当前标签结果和预设的标签匹配规则,确定与所述待咨询信息对应的应答信息。
[0010]在其中一个实施例中,对所述待咨询信息和所述用户信息进行特征化处理和多模态融合处理,得到预处理结果,包括:
[0011]对所述用户信息进行特征化处理,得到对应的用户特征编码;
[0012]对所述待咨询信息进行数据清洗处理,得到清洗后的待咨询信息;
[0013]将所述清洗后的待咨询信息进行分词、实体识别和词性标记处理,得到处理后的待咨询信息;
[0014]将所述用户特征编码和所述处理后的待咨询信息进行多模态融合处理,得到预处理结果。
[0015]在其中一个实施例中,基于所述当前标签结果和预设的标签匹配规则,确定与所
述待咨询信息对应的应答信息,包括:
[0016]从预设的意图标签树,确定所述当前标签结果的层级关系;
[0017]基于所述当前标签结果的层级关系,判断所述当前标签结果在所述用户意图标签树中是否存在子标签;
[0018]若存在子标签且所述子标签符合所述预设的标签匹配规则时,将所述子标签作为所述待咨询信息对应的最终标签结果;
[0019]根据所述最终标签结果,从预设应答模板库中查找与所述最终标签结果对应的应答结果,将所述应答结果作为与所述待咨询信息对应的应答信息。
[0020]在其中一个实施例中,所述文本标签匹配模型通过如下步骤构建:
[0021]获取历史应答数据、历史用户信息和人工客服操作流程数据;
[0022]根据所述历史应答数据和所述人工客服操作流程数据,按照业务类型进行梳理,建立意图标签树;
[0023]在所述意图标签树中标记出算法标签,并将所述算法标签关联对应的历史应答数据,得到关联历史应答数据;
[0024]基于所述算法标签、所述算法标签对应的关联历史应答数据和所述历史用户信息,构建文本标签匹配模型。
[0025]在其中一个实施例中,所述将所述算法标签关联对应的历史应答数据,得到关联历史应答数据,包括:
[0026]对所述历史应答数据进行预训练处理,得到预训练模型;
[0027]获取部分历史应答数据的标注种子数据,基于所述标注种子数据对所述预训练模型进行参数调整,得到深度学习模型;
[0028]获取测试数据和测试数据对应的算法标签;
[0029]基于所述测试数据、所述测试数据对应的算法标签和所述深度学习模型进行迭代处理,确定每个所述算法标签的准确率,直至所述全部算法标签的准确率均高于预设阈值时,将所述全部算法标签对应的训练数据进行关联存储,得到对应的关联历史应答数据。
[0030]在其中一个实施例中,基于所述测试数据、所述测试数据对应的算法标签和所述深度学习模型进行迭代处理,包括:
[0031]对于准确率低于预设阈值对应的的算法标签,基于所述深度学习模型,从所述历史应答数据中筛选出待标注数据;
[0032]将所述待标注数据进行标注,并与修正后的数据进行合并处理,得到下一轮标注数据;
[0033]将所述下一轮标注数据进行训练和测试,得到下一个深度学习模型;
[0034]基于所述测试数据、所述测试数据对应的算法标签和所述下一个深度学习模型进行处理,确定每个所述算法标签对应的准确率;
[0035]判断每个所述算法标签对应的准确率是否高于预设阈值,当所述全部算法标签的准确率均高于预设阈值时,迭代处理结束。
[0036]在其中一个实施例中,基于所述算法标签、所述算法标签对应的关联历史应答数据和所述历史用户信息,构建文本标签匹配模型,包括:
[0037]对于每个算法标签,在所述意图标签树上确定所述算法标签是否存在父标签;
[0038]若存在父标签,获取父标签信息,并对所述父标签信息、所述父标签信息的关联历史应答数据和所述历史用户信息进行特征化处理和多模态融合处理,采用深度学习算法构建文本标签匹配模型;
[0039]若不存在父标签,对所述算法标签、所述算法标签的关联历史应答数据和所述历史用户信息进行特征化处理和多模态融合处理,采用深度学习算法构建文本标签匹配模型。
[0040]在其中一个实施例中,所述文本标签匹配模型还通过如下步骤构建:
[0041]获取抽样数据、抽样数据对应的关联用户信息;
[0042]对所述抽样数据和所述关联用户信息进行特征化和多模态融合处理,得到融合处理结果;
[0043]采用预设算法对所述融合处理结果进行训练,构建文本标签匹配模型。
[0044]在其中一个实施例中,根据所述历史应答数据和所述人工客服操作流程数据,按照业务类型进行梳理,建立意图标签树,包括:
[0045]确定所述历史应答数据对应的业务类型;
[0046]获取前端功能对应的菜单节点;
[0047]按照所述业务类型和前端功能对应的菜单节点进行业务梳理,直至梳理遍历完所有的菜单节点;
[0048]根据所述人工客服操作流程数据,确定菜单节点对应的用户状态和具体处理规则,以构建意图标签树。
[0049]第二方面,本申请实施例提供了数据应答处理系统,该系统包括:
[0050]获取模块,用于获取用户待咨询信息和用户信息;
[0051]预处理模块,用于对所述待咨询本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据应答处理方法,其特征在于,该方法包括:获取用户待咨询信息和用户信息;对所述待咨询信息和所述用户信息进行特征化处理和多模态融合处理,得到预处理结果;将所述预处理结果输入预先训练好的文本标签匹配模型,得到所述待咨询信息对应的当前标签结果,所述文本标签匹配模型具有对所述待咨询信息进行标签匹配的能力;基于所述当前标签结果和预设的标签匹配规则,确定与所述待咨询信息对应的应答信息。2.根据权利要求1所述的方法,其特征在于,对所述待咨询信息和所述用户信息进行特征化处理和多模态融合处理,得到预处理结果,包括:对所述用户信息进行特征化处理,得到对应的用户特征编码;对所述待咨询信息进行数据清洗处理,得到清洗后的待咨询信息;将所述清洗后的待咨询信息进行分词、实体识别和词性标记处理,得到处理后的待咨询信息;将所述用户特征编码和所述处理后的待咨询信息进行多模态融合处理,得到预处理结果。3.根据权利要求1所述的方法,其特征在于,基于所述当前标签结果和预设的标签匹配规则,确定与所述待咨询信息对应的应答信息,包括:从预设的意图标签树,确定所述当前标签结果的层级关系;基于所述当前标签结果的层级关系,判断所述当前标签结果在所述意图标签树中是否存在子标签;若存在子标签且所述子标签符合所述预设的标签匹配规则时,将所述子标签作为所述待咨询信息对应的最终标签结果;根据所述最终标签结果,从预设应答模板库中查找与所述最终标签结果对应的应答结果,将所述应答结果作为与所述待咨询信息对应的应答信息。4.根据权利要求1所述的方法,其特征在于,所述文本标签匹配模型通过如下步骤构建:获取历史应答数据、历史用户信息和人工客服操作流程数据;根据所述历史应答数据和所述人工客服操作流程数据,按照业务类型进行梳理,建立意图标签树;在所述意图标签树中标记出算法标签,并将所述算法标签关联对应的历史应答数据,得到关联历史应答数据;基于所述算法标签、所述算法标签对应的关联历史应答数据和所述历史用户信息,构建文本标签匹配模型。5.根据权利要求4所述的方法,其特征在于,所述将所述算法标签关联对应的历史应答数据,得到关联历史应答数据,包括:对所述历史应答数据进行预训练处理,得到预训练模型;获取部分历史应答数据的标注种子数据,基于所述标注种子数据对所述预训练模型进行参数调整,得到深度学习模型;
获取测试数据和所述测试数据对应的算法标签;基于所述测试数据、所述测试数据对应的算法标签和所述深度学习模型进行迭代处理,确定每个所述算法标签的准确率,直至所述全部算法标签的准确率均高于预设阈值时,将所述全部算法标签对应的训练数据进行关联存储,得到对应的关联历史应答数据。6.根据权利要求5所述的方法,其特征在于,基于所述测试数据、所述测试数据对应的算法标签和所述深度学习模型进行迭代处理,包括:对于准确率低于预设阈值对应的的算法标签,基于所述深度学...

【专利技术属性】
技术研发人员:王安全李沫晗
申请(专利权)人:湖南微步信息科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1