基于深度学习的智慧客服语义检索方法、装置及系统制造方法及图纸

技术编号:34374107 阅读:39 留言:0更新日期:2022-07-31 12:37
本申请适用于深度学习技术领域,提供了基于深度学习的智慧客服语义检索方法、装置及系统,该方法包括:接收来自终端的用户问题,用户问题包括用户向智慧客服咨询的文本问题;基于命名实体识别模型对用户问题进行实体抽取,获得第一实体集;根据第一实体集与知识库数据进行实体链接,获得第二实体集,其中,第二实体集包括多个候选实体;确定目标实体,其中,目标实体为多个候选实体中与用户问题相似度最高的候选实体;基于目标实体生成检索结果,并向终端发送检索结果。本申请使智慧客服能够快速准确的检索出用户所要咨询的问题并予以答复,达到降低检索算力,提高沟通效率,提升用户服务满意度的效果。满意度的效果。满意度的效果。

Intelligent customer service semantic retrieval method, device and system based on deep learning

【技术实现步骤摘要】
基于深度学习的智慧客服语义检索方法、装置及系统


[0001]本申请属于深度学习
,尤其涉及基于深度学习的智慧客服语义检索方法、装置及系统。

技术介绍

[0002]传统电力行业的客服热线主要以人工客服和IVR(Interactive Voice Response)按键模式为主,随着用户数量增多、业务种类以及业务复杂性的增加,客服工作的压力不断增大。而且,用户咨询中大多数都是简单且重复率高的问题,不仅浪费了大量的客服人力,同时,不同人工客服职业素养之间的差别,也使得服务质量难以保证。
[0003]近年来云计算、大数据算法的日渐成熟,能够识别用户问题咨询的智慧客服应运而生。但由于用户的逻辑思维习惯以及文本表达习惯的巨大差异,使得智慧客服不能很好的检索出用户的真实语义,致使沟通效率低下,用户服务满意度差。
[0004]因此,亟需一种针对智慧客服的语义检索方法,可以使智慧客服能够快速准确的检索出用户所要咨询的问题,并予以答复,以此降低检索算力,提高沟通效率,提升用户服务满意度。

技术实现思路

[0005]为克服相关技本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的智慧客服语义检索方法,其特征在于,包括:接收来自终端的用户问题,所述用户问题包括用户向智慧客服咨询的文本问题;基于命名实体识别模型对所述用户问题进行实体抽取,获得第一实体集;根据所述第一实体集与知识库数据进行实体链接,获得第二实体集,其中,所述第二实体集包括多个候选实体;确定目标实体,其中,所述目标实体为所述多个候选实体中与所述用户问题相似度最高的候选实体;基于所述目标实体生成检索结果,并向所述终端发送所述检索结果。2.如权利要求1所述的方法,其特征在于,确定目标实体,包括:将所述第二实体集中的每个候选实体进行编码,获得每个候选实体对应的第一向量;将所述用户问题中的文本问题进行编码,获得第二向量;计算每个第一向量和所述第二向量之间的相似度;将与所述第二向量之间的相似度最高的第一向量所对应的候选实体,确定为所述目标实体。3.如权利要求2所述的方法,其特征在于,所述计算每个第一向量和所述第二向量之间的相似度,包括:通过余弦相似度计算公式,对所述第一向量与所述第二向量进行相似度比对,其中,所述余弦相似度计算公式为:式中,X为所述第一向量,Y为所述第二向量,||X||为第一向量的模值,||Y||为第二向量的模值。4.如权利要求1所述的方法,其特征在于,所述知识库数据包括多个第一候选实体集,每个第一候选实体集包括至少一个候选实体;所述根据所述第一实体集与知识库数据进行实体链接,获得第二实体集,包括:计算所述第一实体集与所述知识库数据中的每个第一候选实体集的相似度,将大于或等于相似度第一阈值的所述第一候选实体集,确定为第二候选实体集,其中,每个所述第二候选实体集包括至少一个候选实体;计算所述第一实体集与所述第二候选实体集的相似度,将等于所述相似度第二阈值的所述第二候选实体集,确定为所述第二实体集,将小于相似度第二阈值的所述第二候选实体集,确定为第三候选实体集,其中,每个所述第三候选实体集包括至少一个候选实体;计算所述第一实体集与所述第三候选实体集的相似度,将大于或等于相似度第三阈值的所述第三候选实体集,确定为所述第二实体集;所述相似度第一阈值小于所述相似度第三阈值,所述相似度第三阈值小于所述相似度第二阈值。5.如权利要求1所述的方法,其特征在于,所述相似度第一阈值为0.7,所述相似度第二阈值为1,所述相似度第三阈值为0.9。6.如权利要求4所述的方法,其特征在于,对所述第一实体集与所述知识库数据进行实
体链接之前,还包括:将所述知识库数据中的问题文本、问题属性、答案文本处理为三元组形式数据集合,并形成标注序列,以对所述知识库数据进行预处理;所述知识库数据中至少包括用户问题语料库、别名...

【专利技术属性】
技术研发人员:殷娣娣赵炜成思远魏勇付强王冬宇刘毅张小龙郭秋君李特王尧侯卓言石子昊靳琳
申请(专利权)人:国家电网有限公司北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1