基于先验知识的智能外呼方法技术

技术编号:33711343 阅读:9 留言:0更新日期:2022-06-06 08:45
本发明专利技术公开了一种基于先验知识的智能外呼方法,包含:获取训练数据;对训练数据进行特征处理;对处理后的训练数据进行人工标签;搭建意图识别模型;对意识识别模型加入先验知识;将打好标签的训练数据输入意图识别模型对其进行训练;将待识别语料输入训练好的意图识别模型中进行意图识别得到意识识别结果。本发明专利技术所提供的基于先验知识的智能外呼方法,给意图识别模型加入人为设计的先验信息,让意图识别模型预先学习到一些关键的特征,从而提高意识识别的准确率。识识别的准确率。识识别的准确率。

【技术实现步骤摘要】
基于先验知识的智能外呼方法


[0001]本专利技术涉及一种基于先验知识的智能外呼方法。

技术介绍

[0002]传统外呼服务存在客服人员流动性大、人力成本高、服务缺乏标准、服务效率低等问题,导致企业招聘难、培训时间长,增加了企业相关成本。因此引入AI智能外呼系统提供标准化的外呼服务。在智能外呼NLU模型训练过程中通常采用深度神经网络方法,端到端的深度神经网络是个黑盒子,虽然能够自动学习到一些可区分度好的特征,但是往往会拟合到一些非重要特征,导致模型会局部坍塌到一些不好的特征上面,严重影响了意图识别的准确度,降低用户体验。
[0003]现有的AI智能外呼系统存在以下弊端:一些数据保密部门,如银行政府等机构的数据保密性高,数据难以收集,训练数据有限;模型构建初期数据质量低,特征不明显;识别问题直接降低接听用户的体验,导致投诉率高。

技术实现思路

[0004]本专利技术提供了一种基于先验知识的智能外呼方法解决上述提到的技术问题,具体采用如下的技术方案:
[0005]一种基于先验知识的智能外呼方法,包含以下步骤:
[0006]获取训练数据;
[0007]对训练数据进行特征处理;
[0008]对处理后的训练数据进行人工标签;
[0009]搭建意图识别模型;
[0010]对意识识别模型加入先验知识;
[0011]将打好标签的训练数据输入意图识别模型对其进行训练;
[0012]将待识别语料输入训练好的意图识别模型中进行意图识别得到意识识别结果。<br/>[0013]进一步地,对意识识别模型加入先验知识的具体方法为:
[0014]将意图识别模型的网络权重替换为另一训练好的模型的网络权重。
[0015]进一步地,在将意图识别模型的网络权重替换为另一预训练好的模型的网络权重中,另一预训练好的模型为bert模型。
[0016]进一步地,在对处理后的训练数据进行人工标签之后,基于先验知识的智能外呼方法还包括:
[0017]从训练数据中提取特征词;
[0018]将打好标签的训练数据输入意图识别模型对其进行训练的具体方法为:
[0019]将打好标签的训练数据和其对应的特征词同时输入意图识别模型对其进行训练。
[0020]进一步地,从训练数据中提取特征词的具体方法为:
[0021]搭建特征词库,特征词库中包含若干关键词;
[0022]将训练数据与特征词库进行匹配,将训练数据中包含的关键词提取出来作为其特征词。
[0023]进一步地,在对处理后的训练数据进行人工标签后,基于先验知识的智能外呼方法还包括:
[0024]对处理后的训练数据添加位置标签。
[0025]进一步地,对处理后的训练数据添加位置标签的具体方法为:
[0026]将训练数据划分为前部、中部和后部三个区域;
[0027]根据训练数据中的重点信息所在的位置,对训练数据打上前部、中部和后部中的至少一个的位置标签。
[0028]进一步地,在将待识别语料输入训练好的意图识别模型中进行意图识别得到意识识别结果之后,基于先验知识的智能外呼方法还包含:
[0029]在将待识别语料输入训练好的辅助识别模型进行识别得到辅助识别结果;
[0030]综合意识识别结果和辅助识别结果得到最终识别结果。
[0031]进一步地,辅助识别模型为身份识别模型。
[0032]本专利技术的有益之处在于所提供的基于先验知识的智能外呼方法,给意图识别模型加入人为设计的先验信息,让意图识别模型预先学习到一些关键的特征,从而提高意识识别的准确率。
附图说明
[0033]图1是本专利技术的一种基于先验知识的智能外呼方法的示意图。
具体实施方式
[0034]以下结合附图和具体实施例对本专利技术作具体的介绍。
[0035]如图1所示为本申请的一种基于先验知识的智能外呼方法,包含以下步骤:S1:获取训练数据。S2:对训练数据进行特征处理。S3:对处理后的训练数据进行人工标签。S4:搭建意图识别模型。S5:对意识识别模型加入先验知识。S6:将打好标签的训练数据输入意图识别模型对其进行训练。S7:将待识别语料输入训练好的意图识别模型中进行意图识别得到意识识别结果。本申请的基于先验知识的智能外呼方法,给意图识别模型加入人为设计的先验信息让模型预先学习到一些关键的特征,从而提高意识识别的准确率。以下具体介绍上述步骤。
[0036]对于步骤S1:获取训练数据。
[0037]具体地,根据应用场景的不同,提前收集好训练数据。
[0038]对于步骤S2:对训练数据进行特征处理。
[0039]所谓特征处理是指对训练数据进行处理,将其转换为特征向量。特征处理是本领域通用技术手段,此处不再赘述。
[0040]对于步骤S3:对处理后的训练数据进行人工标签。
[0041]在本申请中,通过人工处理,对训练数据进行数据标注,人工标记每个训练预料的意图标签。
[0042]对于步骤S4:搭建意图识别模型。
[0043]在本申请中,意图识别模型能够通过意识识别算法识别话术文本的意图。
[0044]对于步骤S5:对意识识别模型加入先验知识。
[0045]具体而言,对意识识别模型加入先验知识的具体方法为:
[0046]将意图识别模型的网络权重替换为另一训练好的模型的网络权重。
[0047]在本申请中,在将意图识别模型的网络权重替换为另一预训练好的模型的网络权重中,另一预训练好的模型为谷歌bert的预训练模型,其基于海量数据训练得来,能够更好地学习语料中的普遍特征。
[0048]对于步骤S6:将打好标签的训练数据输入意图识别模型对其进行训练。
[0049]对于步骤S7:将待识别语料输入训练好的意图识别模型中进行意图识别得到意识识别结果。
[0050]作为一种优选的实施方式,在对处理后的训练数据进行人工标签之后,基于先验知识的智能外呼方法还包括:从训练数据中提取特征词。进而,将打好标签的训练数据输入意图识别模型对其进行训练的具体方法为:将打好标签的训练数据和其对应的特征词同时输入意图识别模型对其进行训练。在意图识别中,将语料中表征意图的特征词和整个语料作为神经网络的两路输入,在网络的后端再把两路输入的信息融合。以达到既关注局域,又关注整体的目的。
[0051]具体地,从训练数据中提取特征词的具体方法为:
[0052]搭建特征词库,特征词库中包含若干关键词。将训练数据与特征词库进行匹配,将训练数据中包含的关键词提取出来作为其特征词。
[0053]作为一种优选的实施方式,在对处理后的训练数据进行人工标签后,基于先验知识的智能外呼方法还包括:对处理后的训练数据添加位置标签。
[0054]可以理解的是,如某一意图语料中,重点信息并不会分布在语料的每一处,而是集中体现在预料的某一部分。如果意图识别模型能够快速识别出重点信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于先验知识的智能外呼方法,其特征在于,包含以下步骤:获取训练数据;对所述训练数据进行特征处理;对处理后的所述训练数据进行人工标签;搭建意图识别模型;对所述意识识别模型加入先验知识;将打好标签的训练数据输入所述意图识别模型对其进行训练;将待识别语料输入训练好的所述意图识别模型中进行意图识别得到意识识别结果。2.根据权利要求1所述的基于先验知识的智能外呼方法,其特征在于,所述对所述意识识别模型加入先验知识的具体方法为:将所述意图识别模型的网络权重替换为另一训练好的模型的网络权重。3.根据权利要求2所述的基于先验知识的智能外呼方法,其特征在于,在所述将所述意图识别模型的网络权重替换为另一预训练好的模型的网络权重中,另一预训练好的模型为bert模型。4.根据权利要求1所述的基于先验知识的智能外呼方法,其特征在于,在所述对处理后的所述训练数据进行人工标签之后,所述基于先验知识的智能外呼方法还包括:从所述训练数据中提取特征词;所述将打好标签的训练数据输入所述意图识别模型对其进行训练的具体方法为:将打好标签的训练数据和其对应的特征词同时输入所述意图识别模型对其进行训练。5.根据权利要求4所述的基于先验知识的智能外呼方法,其特征在于...

【专利技术属性】
技术研发人员:刘卫东宣明辉周鸿章
申请(专利权)人:信雅达科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1