识别话术意图的方法和装置制造方法及图纸

技术编号:27806771 阅读:13 留言:0更新日期:2021-03-30 09:22
本发明专利技术公开了一种识别话术意图的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:从干预话术集为用户话术匹配干预话术,并计算用户话术与匹配的干预话术的话术相似度;若话术相似度大于干预阈值,则根据匹配的干预话术的话术规则识别用户话术的话术意图;若话术相似度小于或等于干预阈值,则利用模版规则话术集或识别模型识别用户话术的话术意图;根据识别的话术意图更新干预话术集、模版规则话术集或识别模型。该实施方式能够快速准确地识别话术意图,以及对常用的话术进行快速响应;在实现识别用户话术的同时,对数据进行更新,使数据在迭代的过程中得到充分利用,减少了数据标注工作量。减少了数据标注工作量。减少了数据标注工作量。

【技术实现步骤摘要】
识别话术意图的方法和装置


[0001]本专利技术涉及计算机
,尤其涉及一种识别话术意图的方法和装置。

技术介绍

[0002]随着人工智能技术的发展,人机对话系统已经成为人工智能领域研究的一个关键技术。站在用户的角度,按照对话系统的指引,完成特定领域预先设定的任务,可以降低沟通成本,提升购物体验。站在京东业务的角度,将特定领域的用户行为,总结归纳为一系列的任务。不但可以让用户获得更佳的人机交互体验,还可以节约客服等人力成本。
[0003]现有的特定领域意图识别和槽值抽取的办法一般遵循如下流程:
[0004]1.应用意图识别方法,识别用户意图;通过预先定义的意图,对用户话术进行识别,并映射到某个预先定义的意图。
[0005]2.应用槽值抽取方法,抽取有用槽值;槽值抽取的主要任务是在特定领域和意图的前提下,从用户话术中尽量的抽取预先定义好的信息对应的槽位。即从用户话术中抽取有意义的信息。
[0006]3.将意图和槽值交给业务系统,执行业务动作。在正确识别用户意图与槽值抽取的基础上,按照预先定义的业务逻辑执行相应的业务动作。
[0007]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:
[0008]1.过度依赖预先定义的意图与槽值,可迭代性差;
[0009]2.无法针对识别错误的话术进行快速的反馈。

技术实现思路

[0010]有鉴于此,本专利技术实施例提供一种识别话术意图的方法和装置,能够快速准确地识别话术意图,以及对常用的话术进行快速响应;在实现识别用户话术的同时,对数据进行更新,使数据在迭代的过程中得到充分利用,减少了数据标注工作量。
[0011]为实现上述目的,根据本专利技术实施例的一个方面,提供了一种识别话术意图的方法。
[0012]本专利技术实施例的一种识别话术意图的方法包括:从干预话术集为用户话术匹配干预话术,并计算所述用户话术与匹配的干预话术的话术相似度;若所述话术相似度大于干预阈值,则根据所述匹配的干预话术的话术规则识别所述用户话术的话术意图;若所述话术相似度小于或等于干预阈值,则利用模版规则话术集或识别模型识别所述用户话术的话术意图;根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型。
[0013]可选地,从干预话术集为用户话术匹配干预话术,并计算所述用户话术与匹配的干预话术的话术相似度,包括:对所述用户话术进行分词,得到话术分词;基于所述话术分词从干预话术集为所述用户话术匹配干预话术;其中,所述干预话术集包括干预话术及其话术规则;计算所述用户话术与匹配的干预话术的词向量和词频逆文本频率;根据所述词向量和所述词频逆文本频率计算所述用户话术与所述匹配的干预话术的话术相似度;以及
根据所述匹配的干预话术的话术规则识别所述用户话术的话术意图之后,还包括:根据所述匹配的干预话术的话术规则提取所述用户话术的槽值。
[0014]可选地,所述识别模型包括意图识别模型和槽值抽取模型,利用模版规则话术集或识别模型识别所述用户话术的话术意图,包括:基于所述话术分词从模版规则话术集为所述用户话术匹配模版规则话术;其中,所述模版规则话术集包括模版规则话术及其话术规则;计算所述用户话术与匹配的模版规则话术的词向量和词频逆文本频率;根据所述词向量和所述词频逆文本频率计算所述用户话术与所述匹配的模版规则话术的话术相似度;若所述话术相似度大于模版阈值,则根据所述匹配的模版规则话术的话术规则确定所述用户话术的话术意图,并提取所述用户话术的槽值;若所述话术相似度小于或等于模版阈值,则利用所述意图识别模型确定所述用户话术的话术意图,以及利用所述槽值抽取模型提取所述用户话术的槽值。
[0015]可选地,从干预话术集为用户话术匹配干预话术之前,还包括:从历史数据筛选出能够与所述模版规则话术匹配的已知话术,为所述已知话术添加话术标注,并添加到训练数据集;从历史数据筛选出无匹配的所述模版规则话术、且所述识别模型的无法识别的未知话术;若所述未知话术是常见话术,则为所述未知话术设置话术规则,并添加到所述干预话术集;其中,所述话术规则包括话术意图和槽值位置。
[0016]可选地,根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型,包括:从历史数据中获取训练话术,为所述训练话术、所述干预话术和所述模版规则话术添加话术标注,并添加到所述训练数据集;利用所述训练数据集训练学习模型;计算学习模型在测试话术集和所述训练数据集中的准确率和召回率;若所述准确率大于或等于预设准确率且所述召回率大于或等于预设召回率,则通过训练,根据所述学习模型更新所述意图识别模型和所述槽值抽取模型;若所述准确率小于预设准确率或所述召回率小于预设召回率,则重新训练。
[0017]可选地,根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型,还包括:利用通过训练的所述学习模型对添加话术标注的所述未知话术和所述训练话术进行回归测试;将通过测试的所述未知话术和所述训练话术添加到所述测试话术集;基于未通过的所述未知话术和所述训练话术对所述模版规则话术集进行更新。
[0018]可选地,根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型,还包括:利用所述模版规则话术集对所述已知话术进行回归测试;将通过测试的所述已知话术添加到所述测试话术集;将未通过测试的所述已知话术记录为调整话术;基于所述调整话术对所述干预话术集进行更新。
[0019]为实现上述目的,根据本专利技术实施例的另一方面,提供了一种识别话术意图的装置。
[0020]本专利技术实施例的一种识别话术意图的装置包括:匹配单元,用于从干预话术集为用户话术匹配干预话术,并计算所述用户话术与匹配的干预话术的话术相似度;第一识别单元,用于若所述话术相似度大于干预阈值,则根据所述匹配的干预话术的话术规则识别所述用户话术的话术意图;第二识别单元,用于若所述话术相似度小于或等于干预阈值,则利用模版规则话术集或识别模型识别所述用户话术的话术意图;更新单元,用于根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型。
[0021]可选地,所述匹配单元还用于:对所述用户话术进行分词,得到话术分词;基于所述话术分词从干预话术集为所述用户话术匹配干预话术;其中,所述干预话术集包括干预话术及其话术规则;计算所述用户话术与匹配的干预话术的词向量和词频逆文本频率;根据所述词向量和所述词频逆文本频率计算所述用户话术与所述匹配的干预话术的话术相似度;以及所述第一识别单元还用于:根据所述匹配的干预话术的话术规则提取所述用户话术的槽值。
[0022]可选地,所述识别模型包括意图识别模型和槽值抽取模型,所述第二识别单元还用于:基于所述话术分词从模版规则话术集为所述用户话术匹配模版规则话术;其中,所述模版规则话术集包括模版规则话术及其话术规则;计算所述用户话术与匹配的模版规则话术的词向量和词频逆文本频率;根据所述词向量和所述词频逆文本频率计算所述用户话术与所述匹配的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种识别话术意图的方法,其特征在于,包括:从干预话术集为用户话术匹配干预话术,并计算所述用户话术与匹配的干预话术的话术相似度;若所述话术相似度大于干预阈值,则根据所述匹配的干预话术的话术规则识别所述用户话术的话术意图;若所述话术相似度小于或等于干预阈值,则利用模版规则话术集或识别模型识别所述用户话术的话术意图;根据识别的话术意图更新所述干预话术集、所述模版规则话术集或所述识别模型。2.根据权利要求1所述的方法,其特征在于,从干预话术集为用户话术匹配干预话术,并计算所述用户话术与匹配的干预话术的话术相似度,包括:对所述用户话术进行分词,得到话术分词;基于所述话术分词从干预话术集为所述用户话术匹配干预话术;其中,所述干预话术集包括干预话术及其话术规则;计算所述用户话术与匹配的干预话术的词向量和词频逆文本频率;根据所述词向量和所述词频逆文本频率计算所述用户话术与所述匹配的干预话术的话术相似度;以及根据所述匹配的干预话术的话术规则识别所述用户话术的话术意图之后,还包括:根据所述匹配的干预话术的话术规则提取所述用户话术的槽值。3.根据权利要求2所述的方法,其特征在于,所述识别模型包括意图识别模型和槽值抽取模型,利用模版规则话术集或识别模型识别所述用户话术的话术意图,包括:基于所述话术分词从模版规则话术集为所述用户话术匹配模版规则话术;其中,所述模版规则话术集包括模版规则话术及其话术规则;计算所述用户话术与匹配的模版规则话术的词向量和词频逆文本频率;根据所述词向量和所述词频逆文本频率计算所述用户话术与所述匹配的模版规则话术的话术相似度;若所述话术相似度大于模版阈值,则根据所述匹配的模版规则话术的话术规则确定所述用户话术的话术意图,并提取所述用户话术的槽值;若所述话术相似度小于或等于模版阈值,则利用所述意图识别模型确定所述用户话术的话术意图,以及利用所述槽值抽取模型提取所述用户话术的槽值。4.根据权利要求1所述的方法,其特征在于,从干预话术集为用户话术匹配干预话术之前,还包括:从历史数据筛选出能够与所述模版规则话术匹配的已知话术,为所述已知话术添加话术标注,并添加到训练数据集;从历史数据筛选出无匹配的所述模版规则话术、且所述识别模型的无法识别的未知话术;若所述未知话术是常见话术,则为所述未知话术设置话术规则,并添加到所述干预话术集;其中,所述话术规则包括话术...

【专利技术属性】
技术研发人员:高志群赵喆子健王世强曾兵
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1