可配置智能语音机器人的实现方法、装置和存储介质制造方法及图纸

技术编号:33073930 阅读:15 留言:0更新日期:2022-04-15 10:09
本申请公开一种可配置智能语音机器人的实现方法、装置和存储介质,属于人工智能领域,方法包括:获取多个会话场景中的各会话场景的样本语料;针对每一会话场景,基于会话场景的样本语料,生成会话场景的场景特征,场景特征包括会话场景的特征词以及对特征词映射转换得到的特征词序列;基于预设的词向量空间模型以及各会话场景的场景特征,对智能语音机器人进行配置,词向量空间模型用以供智能语音机器人对用户会话与各会话场景的场景特征进行词向量相似度计算,以识别用户会话的意图场景。本申请针对同一业务领域,无论何种业务场景,都能够以一套通用的智能语音机器人解决方案进行处理,极大地降低了营销机器人的开发成本和定制化服务的门槛。和定制化服务的门槛。和定制化服务的门槛。

【技术实现步骤摘要】
可配置智能语音机器人的实现方法、装置和存储介质


[0001]本申请涉及人工智能领域,尤其涉及一种可配置智能语音机器人的实现方法、装置和存储介质。

技术介绍

[0002]目前,智能语音机器人广泛应用于在电话营销、客服系统中,通过IVR(互动式语音应答)服务,由机器人完成对特定客户的电话营销。其中,电话营销包括简单形式和复杂形式,简单形式指“单边营销宣传”,例如一句话营销内容播报;复杂形式还可以实现与客户的多轮语音问答交互,并且对客户潜在意向进行判断反馈。智能语音机器人可以解决传统人工电话营销的招聘成本高、培训周期长、业务水平不一致、服务质量不稳定等长期困扰行业的问题,通过基于自然语言模型的后台机器人,完成大规模、重复性劳动,帮助企业减少近80%的一般性外呼的人力成本。
[0003]在实现本专利技术的过程中,专利技术人发现目前可以进行场景问答交互的复杂形式的智能语音机器人普遍存在如下技术问题:
[0004]智能语音机器人在场景问答交互过程中,可以通过识别用户会话的意图场景,来给出相应回复。传统基于文本分类模型的意图识别算法采用的是离线训练的方式,模型通过学习历史标签语料,对未来新增的样本进行判断,将其分类到已习得的某一标签类别中。这种以贝叶斯理论为基础的算法模型只能处理已知的分类,对于历史语料中未出现的类别,依然只能归类到已知分类中,这就必然导致分类错误。在实际应用中,为了解决这个问题,开发人员一般只能在历史标签语料中添加新类别的标注语料,然后重新回滚训练模型。这种方式不仅效率低、成本高,而且无法保证模型正向收敛,即引入新语料再学习可能会降低原有类别的分类准确度,并且,由于算法底层依赖条件概率,各类别的判别概率不是相互独立的,这样针对不同的场景类别开发智能语音机器人时,需要分别定制化开发,彼此无法迁移复用,从而导致智能语音机器人的场景开发成本过高。

技术实现思路

[0005]为了解决上述
技术介绍
中提到的技术问题,本申请提供了可配置智能语音机器人的实现方法、装置和存储介质。本申请的技术方案如下:
[0006]第一方面,提供了一种可配置智能语音机器人的实现方法,所述方法包括:
[0007]获取多个会话场景中的各所述会话场景的样本语料;
[0008]针对每一所述会话场景,基于所述会话场景的样本语料,生成所述会话场景的场景特征,所述场景特征包括所述会话场景的特征词以及对所述特征词映射转换得到的特征词序列;
[0009]基于预设的词向量空间模型以及各所述会话场景的场景特征,对所述智能语音机器人进行配置,所述词向量空间模型用以供所述智能语音机器人对用户会话与各所述会话场景的场景特征进行词向量相似度计算,以识别所述用户会话的意图场景。
[0010]进一步地,所述针对每一所述会话场景,基于所述会话场景的样本语料,生成所述会话场景的场景特征,包括:
[0011]针对每一所述会话场景,基于预设的领域词典,获取所述会话场景的样本语料的离散表示;
[0012]基于所述会话场景的样本语料的离散表示,采用特征选择算法提取所述会话场景的特征词;
[0013]对所述会话场景的特征词映射转换到对应的词典索引,生成所述会话场景的特征词序列;
[0014]优选地,所述特征选择算法为卡方统计特征选择算法。
[0015]进一步地,所述方法还包括:
[0016]将各所述会话场景与各所述会话场景的场景特征保存至场景特征关系表中;
[0017]优选地,所述方法还包括:
[0018]接收针对任一所述会话场景输入的配置特征词;
[0019]基于所述会话场景的配置特征词以及对所述配置特征词映射转换得到的配置特征词序列,对所述场景特征关系表中的该会话场景的场景特征进行维护;
[0020]优选地,所述接收针对任一所述会话场景输入的配置特征词,包括:
[0021]接收具有特征配置权限的用户针对所述会话场景输入的配置特征词。
[0022]进一步地,所述基于所述会话场景的配置特征词以及对所述配置特征词映射转换得到的配置特征词序列,对所述场景特征关系表中的该会话场景的场景特征进行维护,包括:
[0023]在所述场景特征关系表中,将所述会话场景的配置特征词合并到所述会话场景的特征词中,并将合并后的所述配置特征词的配置特征词序列添加到所述会话场景的特征词序列中。
[0024]进一步地,所述词向量空间模型是采用如下方式训练得到:
[0025]使用各会话场景所属领域的领域语料对预训练后的BERT词向量空间进行训练,得到所述词向量空间模型。
[0026]进一步地,所述方法还包括:
[0027]针对任一所述会话场景,接收第一用户对所述会话场景输入的状态转移图,并接收第二用户对所述状态转移图输入的补充信息,以生成所述会话场景的状态转移矩阵;
[0028]基于所述会话场景的状态转移矩阵,生成用于包含状态转移逻辑关系的脚本文件,并基于所述脚本文件,生成有限状态机,以用于在识别出用户会话的意图场景时返回相应的话术。
[0029]进一步地,所述方法还包括:
[0030]配置好的所述智能语音机器人接收到用户会话后,对所述用户会话进行预处理以获取所述用户会话中的多个分词,并对所述多个分词进行映射转换,获得所述用户会话的特征词序列;
[0031]基于所述用户会话的特征词序列以及各所述会话场景的特征词序列,使用所述词向量空间模型构建所述用户会话的特征向量以及各所述会话场景的场景特征向量;
[0032]对所述用户会话的特征向量与各所述会话场景的场景特征向量进行相似度计算,
基于相似度计算结果,识别所述用户会话的意图,以返回所述意图对应的话术。
[0033]第二方面,提供了一种可配置智能语音机器人的实现装置,所述装置包括:
[0034]获取模块,用于获取多个会话场景中的各所述会话场景的样本语料;
[0035]生成模块,用于针对每一所述会话场景,基于所述会话场景的样本语料,生成所述会话场景的场景特征,所述场景特征包括所述会话场景的特征词以及对所述特征词映射转换得到的特征词序列;
[0036]配置模块,用于基于预设的词向量空间模型以及各所述会话场景的场景特征,对所述智能语音机器人进行配置,所述词向量空间模型用以供所述智能语音机器人对用户会话与各所述会话场景的场景特征进行词向量相似度计算,以识别所述用户会话的意图场景。
[0037]进一步地,所述生成模块包括:
[0038]表示单元,用于针对每一所述会话场景,针对每一所述会话场景,基于预设的领域词典,获取所述会话场景的样本语料的离散表示;
[0039]筛选单元,用于基于所述会话场景的样本语料的离散表示,采用特征选择算法提取所述会话场景的特征词;
[0040]生成单元,用于对所述会话场景的特征词映射转换到对应的词典索引,生成所述会话场景的特征词序列;
[0041]优选地,所述特征选择算法为卡方统本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种可配置智能语音机器人的实现方法,其特征在于,所述方法包括:获取多个会话场景中的各所述会话场景的样本语料;针对每一所述会话场景,基于所述会话场景的样本语料,生成所述会话场景的场景特征,所述场景特征包括所述会话场景的特征词以及对所述特征词映射转换得到的特征词序列;基于预设的词向量空间模型以及各所述会话场景的场景特征,对所述智能语音机器人进行配置,所述词向量空间模型用以供所述智能语音机器人对用户会话与各所述会话场景的场景特征进行词向量相似度计算,以识别所述用户会话的意图场景。2.根据权利要求1所述的方法,其特征在于,所述针对每一所述会话场景,基于所述会话场景的样本语料,生成所述会话场景的场景特征,包括:针对每一所述会话场景,基于预设的领域词典,获取所述会话场景的样本语料的离散表示;基于所述会话场景的样本语料的离散表示,采用特征选择算法提取所述会话场景的特征词;对所述会话场景的特征词映射转换到对应的词典索引,生成所述会话场景的特征词序列;优选地,所述特征选择算法为卡方统计特征选择算法。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:将各所述会话场景与各所述会话场景的场景特征保存至场景特征关系表中;优选地,所述方法还包括:接收针对任一所述会话场景输入的配置特征词;基于所述会话场景的配置特征词以及对所述配置特征词映射转换得到的配置特征词序列,对所述场景特征关系表中的该会话场景的场景特征进行维护。4.根据权利要求3所述的方法,其特征在于,所述基于所述会话场景的配置特征词以及对所述配置特征词映射转换得到的配置特征词序列,对所述场景特征关系表中的该会话场景的场景特征进行维护,包括:在所述场景特征关系表中,将所述会话场景的配置特征词合并到所述会话场景的特征词中,并将合并后的所述配置特征词的配置特征词序列添加到所述会话场景的特征词序列中。5.根据权利要求1所述的方法,其特征在于,所述词向量空间模型是采用如下方式训练得到:使用各会话场景所属领域的领域语料对预训练后的BERT词向量空间进行训练,得到所述词向量空间模型。...

【专利技术属性】
技术研发人员:王岗林健
申请(专利权)人:苏宁金融科技南京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1