基于客服录音的智能对话方法、系统、设备及存储介质技术方案

技术编号:27831109 阅读:27 留言:0更新日期:2021-03-30 11:35
本发明专利技术提供了基于客服录音的智能对话方法、系统、设备及存储介质,该方法包括:提供客服录音音频文件并转化为客服文本;通过不同词频相似度算法对对话语句以及客服语句进行向量化,将相似度最高的多个客服语句作为第一集合;进行分词,获得分词后的词向量和语句向量,将相似度最高的多个对话语句作为第二集合;基于语义相似度模型获得对话语句与对应的第二集合中的客服语句进行相似度排序筛选第三集合;将第三集合中的客服语句补充到对话语料库中;当需要表达对话语句时,自与对话语句相关联的客服语句中择一输出。本发明专利技术能够以现有的会话机器人配置话术为模板,通过文本相似度匹配的方法,挖掘更多的客服话术,减少人力投入,提高AI对话的多样性。提高AI对话的多样性。提高AI对话的多样性。

【技术实现步骤摘要】
基于客服录音的智能对话方法、系统、设备及存储介质


[0001]本专利技术涉及人工智能语言处理领域,具体地说,涉及基于客服录音的智能对话方法、系统、设备及存储介质。

技术介绍

[0002]目前智能客服的应用已经比较广泛,很多企业都会有自己的外呼系统或智能会话机器人。对于机器人的每一个行为指令,都需要配上对应的文本话术,作为机器人回复客人的话术。对于携程外呼任务型机器人而言,面对的服务对象都是酒店客服或者客人,因为具有服务的性质,所以智能机器人的话术不同于闲聊机器人,需要在不失正式得体的前提下,尽可能的丰富多样和逼近真人。目前的方法都是业务方通过整理真实的携程客服在与客人通话过程中的话术,来作为机器人的话术,需要大量的人力进行整理,大大增加了会话机器人的优化成本,对会话机器人的发展带来了瓶颈。
[0003]因此,本专利技术提供了一种基于客服录音的智能对话方法、系统、设备及存储介质。

技术实现思路

[0004]针对现有技术中的问题,本专利技术的目的在于提供基于客服录音的智能对话方法、系统、设备及存储介质,克服了现有技术的困难,能够以现有的会话机器人配置话术为模板,通过文本相似度匹配的方法,从线上真实语料库中挖掘更多的客服话术,作为机器人的话术补充,无需不断让业务方整理总结新的不同话术,既能减少人力投入,还能提高AI对话的多样性。
[0005]本专利技术的实施例提供一种基于客服录音的智能对话方法,包括以下步骤:
[0006]S110、提供客服录音音频文件,并将所述客服录音音频文件通过语音识别转化为客服文本;
[0007]S120、通过至少两种不同词频相似度算法对一对话语料库中的对话语句以及所述客服文本中的客服语句进行加权并向量化,基于所述对话语句获得不同相似度算法下与每句所述对话语句的相似度最高的多个客服语句作为基于所述对话语句的第一集合;
[0008]S130、分别对所述第一集合中客服语句与所述对话语句进行分词,获得分词后的词向量和语句向量,将所述第一集合中所述对话语句的语句向量与所述客服语句的语句向量的相似度最高的多个所述对话语句作为基于所述对话语句的第二集合;
[0009]S140、基于语义相似度模型获得所述对话语句与对应的所述第二集合中的客服语句进行相似度计算,筛选出满足预设阈值的客服语句作为基于所述对话语句的第三集合;
[0010]S160、将所述第三集合中的客服语句补充到所述对话语料库中;以及
[0011]S170、当需要表达所述对话语句时,自与所述对话语句相关联的客服语句中择一输出。
[0012]优选地,所述步骤S120中,同别采用TF

IDF词频相似度算法和BM25词频相似度算法对当前对话语料库中的对话语句以及所述客服文本中的客服语句进行加权并向量化。
[0013]优选地,所述步骤S120中,将两种相似度算法下与每句所述对话语句的平均相似度最高的多个客服语句作为第一集合,所述客服语句的总数满足预设总量。
[0014]优选地,所述步骤S130中包括以下步骤:
[0015]S131、对所述第一集合中客服语句与所述对话语句进行分词;
[0016]S132、根据预设的词向量获得分词后语句中每个词的词向量;
[0017]S133、根据对所述客服语句中的词向量求平均获得语句向量,并且,根据对所述第一集合中对话语句的词向量求平均获得语句向量;
[0018]S134、获得所述客服语句的语句向量与对应的所述第一集合中每个所述对话语句的语句向量的相似度;
[0019]S135、将所述第一集合中相似度排名靠前的预设数量的对话语句作为第二集合。
[0020]优选地,所述步骤S140中,采用经过训练得BERT模型对所述对话语句与对应的所述第二集合中的客服语句进行相似度计算。
[0021]优选地,所述步骤S140之后步骤S160之前还包括以下下步骤:
[0022]S150、对所述第三集合中的客服语句进行文本差错修正。
[0023]优选地,所述步骤S160中,将所述第三集合中的客服语句补充到所述对话语料库中,并根据所述对话语句与第三集合在所述对话语料库中建立所述对话语句与所述客服语句之间的映射关系;以及
[0024]所述步骤S170中,当需要表达所述对话语句时,自与所述对话语句具有映射关系的客服语句中择一输出。
[0025]本专利技术的实施例还提供一种基于客服录音的智能对话系统,用于实现上述的基于客服录音的智能对话方法,所述基于客服录音的智能对话系统包括:
[0026]客服录音模块,提供客服录音音频文件,并将所述客服录音音频文件通过语音识别转化为客服文本;
[0027]第一集合模块,通过至少两种不同词频相似度算法对一对话语料库中的对话语句以及所述客服文本中的客服语句进行加权并向量化,基于所述对话语句获得不同相似度算法下与每句所述对话语句的相似度最高的多个客服语句作为基于所述对话语句的第一集合;
[0028]第二集合模块,分别对所述第一集合中客服语句与所述对话语句进行分词,获得分词后的词向量和语句向量,将所述第一集合中所述对话语句的语句向量与所述客服语句的语句向量的相似度最高的多个所述对话语句作为基于所述对话语句的第二集合;
[0029]第三集合模块,基于语义相似度模型获得所述对话语句与对应的所述第二集合中的客服语句进行相似度计算,筛选出满足预设阈值的客服语句作为基于所述对话语句的第三集合;
[0030]语句补充模块,将所述第三集合中的客服语句补充到所述对话语料库中;以及
[0031]表达输出模块,当需要表达所述对话语句时,自与所述对话语句相关联的客服语句中择一输出。
[0032]本专利技术的实施例还提供一种基于客服录音的智能对话设备,包括:
[0033]处理器;
[0034]存储器,其中存储有所述处理器的可执行指令;
[0035]其中,所述处理器配置为经由执行所述可执行指令来执行上述基于客服录音的智能对话方法的步骤。
[0036]本专利技术的实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述基于客服录音的智能对话方法的步骤。
[0037]本专利技术的目的在于提供基于客服录音的智能对话方法、系统、设备及存储介质,能够以现有的会话机器人配置话术为模板,通过文本相似度匹配的方法,从线上真实语料库中挖掘更多的客服话术,作为机器人的话术补充,无需不断让业务方整理总结新的不同话术,既能减少人力投入,还能提高AI对话的多样性。
附图说明
[0038]通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显。
[0039]图1是本专利技术的基于客服录音的智能对话方法的流程图。
[0040]图2是本专利技术的基于客服录音的智能对话系统的模块示意图。
[0041]图3是本专利技术的基于客服录音的智能对话设备的结构示意图。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于客服录音的智能对话方法,其特征在于,包括以下步骤:S110、提供客服录音音频文件,并将所述客服录音音频文件通过语音识别转化为客服文本;S120、通过至少两种不同词频相似度算法对一对话语料库中的对话语句以及所述客服文本中的客服语句进行加权并向量化,基于所述对话语句获得不同相似度算法下与每句所述对话语句的相似度最高的多个客服语句作为基于所述对话语句的第一集合;S130、分别对所述第一集合中客服语句与所述对话语句进行分词,获得分词后的词向量和语句向量,将所述第一集合中所述对话语句的语句向量与所述客服语句的语句向量的相似度最高的多个所述对话语句作为基于所述对话语句的第二集合;S140、基于语义相似度模型获得所述对话语句与对应的所述第二集合中的客服语句进行相似度计算,筛选出满足预设阈值的客服语句作为基于所述对话语句的第三集合;S160、将所述第三集合中的客服语句补充到所述对话语料库中;以及S170、当需要表达所述对话语句时,自与所述对话语句相关联的客服语句中择一输出。2.根据权利要求1所述的基于客服录音的智能对话方法,其特征在于,所述步骤S120中,同别采用TF

IDF词频相似度算法和BM25词频相似度算法对当前对话语料库中的对话语句以及所述客服文本中的客服语句进行加权并向量化。3.根据权利要求2所述的基于客服录音的智能对话方法,其特征在于,所述步骤S120中,将两种相似度算法下与每句所述对话语句的平均相似度最高的多个客服语句作为第一集合,所述客服语句的总数满足预设总量。4.根据权利要求1所述的基于客服录音的智能对话方法,其特征在于,所述步骤S130中包括以下步骤:S131、对所述第一集合中客服语句与所述对话语句进行分词;S132、根据预设的词向量获得分词后语句中每个词的词向量;S133、根据对所述客服语句中的词向量求平均获得语句向量,并且,根据对所述第一集合中对话语句的词向量求平均获得语句向量;S134、获得所述客服语句的语句向量与对应的所述第一集合中每个所述对话语句的语句向量的相似度;S135、将所述第一集合中相似度排名靠前的预设数量的对话语句作为第二集合。5.根据权利要求1所述的基于客服录音的智能对话方法,其特征在于,所述步骤S140中,采用...

【专利技术属性】
技术研发人员:王思博罗超胡泓李巍邹宇
申请(专利权)人:携程计算机技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1