System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 实时客服云端数据的管理方法、装置及计算机设备制造方法及图纸_技高网

实时客服云端数据的管理方法、装置及计算机设备制造方法及图纸

技术编号:40759185 阅读:4 留言:0更新日期:2024-03-25 20:11
本发明专利技术公开了一种实时客服云端数据的管理方法、装置及计算机设备,属于智能客服技术领域。方法包括步骤:将用户发送的问题文本进行分词和词性标注处理获得第一分词序列;识别第一分词序列中的敏感词,并进行脱敏处理获得第二分词序列;将第二分词序列输入意图识别模型,输出的值表示用户发送的问题文本的意图;根据问题文本的意图检索预设的应答模板库;根据问题文本的意图检索知识图谱获得第一关键词组合,知识图谱基于历史业务数据构建;将第一关键词组合输入应答文本生成模型,输出应答文本返回给用户。本发明专利技术通过词性标注结合对抗训练生成更符合应答模板的应答文本,并通过构建应答模板库和知识图谱加快生成应答文本的速度,提高用户满意度。

【技术实现步骤摘要】

本专利技术涉及一种实时客服云端数据的管理方法、装置及计算机设备,属于智能客服。


技术介绍

1、智能客服利用人工智能技术和自然语言处理技术,为用户提供高效、自动化的应答服务,减少了传统客服中人力成本高、服务效率低下以及难以保证服务质量的问题。

2、公开号为cn112995415b,专利名称为基于大数据分析的智能客服系统及方法的中国专利公开了:通过获取用户发送问题的时间间隔、发送频率以及问题文本与知识库中的文本信息的相似度,并通过设置阈值判断将用户接入智能客服还是人工客服。上述方案虽然优化了客服资源的分配,但是并没有提高生成答案的速度,当用户发送问题过多时,依然需要依赖大量的人工客服。

3、公开号为cn110162611a,专利名称为一种智能客服应答方法及系统的中国专利公开了:通过提取用户输入的问题文本中的关键词,先根据关键词意图识别后的意图识别结果检索到关键词答案,如果没有检索到关键词答案则计算关键词与预设关键词答案的相似度,将相似度较大的预设关键词答案返回给用户选择。

4、但是上述方案只能进行简单的答案匹配,零散的关键词答案组合缺乏深层的语义理解和上下文感知能力,导致生成的答案精确度较低。


技术实现思路

1、为了解决现有技术中零散的关键词答案组合缺乏深层的语义理解和上下文感知能力,导致生成的答案精确度较低的技术问题上述问题,本专利技术提出了一种实时客服云端数据的管理方法、装置及计算机设备。

2、本专利技术解决其技术问题采取的技术方案是

3、第一方面,本专利技术实施例提供的一种实时客服云端数据的管理方法,包括以下步骤:

4、步骤s101,将用户发送的问题文本进行分词处理和词性标注处理获得第一分词序列;第一分词序列表示为:a={a1…an},其中a1…an分别表示第1个至第n个分词和词性标注结果;

5、步骤s102,识别第一分词序列中的敏感词,并进行脱敏处理获得第二分词序列;第二分词序列与第一分词序列的表示相同;

6、步骤s103,将第二分词序列输入意图识别模型,输出的值表示用户发送的问题文本的意图;

7、步骤s104,根据用户发送的问题文本的意图检索预设的应答模板库,应答模板库中的应答模板都有一个唯一索引单词与之建立映射,如果检索到对应的应答模板则直接返回给用户,否则进入步骤s105;

8、步骤s105,根据用户发送的问题文本的意图检索知识图谱获得第一关键词组合,知识图谱基于历史业务数据构建,

9、所述历史业务数据包括用户发送问题数据、客服应答数据、服务质量数据和满意度数据,用户发送问题数据和客服应答数据均包括文字、语音和图片,服务质量数据为客服应答数据与用户发送问题数据的时间间隔,满意度数据为客服应答数据的满意度,客服应答数据的满意度属于满意度集合,满意度集合表示为:e={e1,e2,e3},其中e1,e2,e3分别表示满意度为不满意、一般和满意,满意度集合的元素值通过正整数表示,

10、所述知识图谱包括实体和实体的属性,实体包括问题实体、应答实体、服务质量实体和满意度实体,实体通过历史业务数据中的关键词表示,

11、实体与实体之间的链接关系包括:问题实体和应答实体存在链接关系表示问题实体对应的问题由应答实体对应的应答回复,服务质量实体和应答实体存在链接关系表示服务质量实体对应的服务质量属于应答实体对应的应答,满意度实体和应答实体存在链接关系表示满意度实体对应的满意度属于应答实体对应的应答;

12、步骤s106,将第一关键词组合输入应答文本生成模型,输出应答文本返回给用户。

13、作为本实施例一种可能的实现方式,在步骤s101中,通过现有的分词模型对用户发送的问题文本进行分词处理获得分词,通过现有的词性标注模型对分词进行词性标注处理获得词性标注结果。

14、作为本实施例一种可能的实现方式,在步骤s102中,通过构建敏感词库识别第一分词序列中的分词是否为敏感词,敏感词库中的敏感词通过人工添加设置,将第一分词序列中为敏感词的分词直接删除作为脱敏处理获得第二分词序列。

15、作为本实施例一种可能的实现方式,步骤s103中意图识别模型的分类标签与步骤s104中索引单词相同,其中索引单词通过人工添加设置,意图识别模型包括:第一隐藏层、第二隐藏层和全连接层;

16、第一隐藏层输入第二分词序列,输出第二分词向量序列;

17、第二隐藏层输入第二分词向量序列,输出意图识别特征;

18、全连接层输入意图识别特征,输出的值表示用户发送的问题文本的意图;

19、第一隐藏层基于现有的词向量模型构建,将第二分词序列中每个序列单元的分词和词性标注结果转换为向量表示;

20、第二隐藏层的计算公式如下:其中p表示意图识别特征,wq、wk和wv分别表示第一权重参数、第二权重参数和第三权重参数,di表示第二分词向量序列的第i个序列单元对应向量表示的维度的数量值,t表示矩阵的转置操作,softmax表示softmax激活函数,c=pilen(b),c表示第二分词向量序列的矩阵表示,b表示第二分词向量序列,pilen表示将第二分词向量序列的n个序列单元进行堆叠操作。

21、作为本实施例一种可能的实现方式,在步骤s104中,应答模板库中的应答模板通过人工添加设置。

22、作为本实施例一种可能的实现方式,在步骤s105中,问题实体通过用户发送问题数据中的关键词表示,应答实体通过客服应答数据中的关键词表示,服务质量实体通过服务质量数据中的关键词表示,满意度实体通过满意度数据中的关键词表示;历史业务数据中的关键词通过命名实体识别获得;实体的属性为文本类型则通过现有的词向量模型获得,实体的属性为数值类型则通过整数编码获得。

23、作为本实施例一种可能的实现方式,所述根据用户发送的问题文本的意图检索知识图谱获得第一关键词组合,包括以下步骤:

24、步骤s201,通过相似度计算公式计算用户发送的问题文本的意图和知识图谱中所有的问题实体对应关键词的相似度值,并判断相似度值是否大于等于相似度阈值;

25、步骤s202,如果大于相似度阈值则标记问题实体为候选问题实体,并进入步骤s203,否则直接选择相似度最大的问题实体作为候选问题实体,并进入步骤s204;

26、步骤s203,遍历与候选问题实体存在链接关系的应答实体,并优先选择与应答实体存在链接关系的满意度实体对应的属性值大于等于满意度阈值的应答实体作为候选应答实体,否则选择与应答实体存在链接关系的服务质量实体的属性值小于等于服务质量阈值的应答实体作为候选应答实体;

27、步骤s204,选择与该候选问题实体存在链接关系的应答实体作为候选应答实体;

28、步骤s205,将候选应答实体对应的关键词进行组合返回第一关键词组合。

29、作为本实施例一种可能的实现方式,在步骤s本文档来自技高网...

【技术保护点】

1.一种实时客服云端数据的管理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种实时客服云端数据的管理方法,其特征在于,在步骤S101中,通过现有的分词模型对用户发送的问题文本进行分词处理获得分词,通过现有的词性标注模型对分词进行词性标注处理获得词性标注结果。

3.根据权利要求1所述的一种实时客服云端数据的管理方法,其特征在于,在步骤S102中,通过构建敏感词库识别第一分词序列中的分词是否为敏感词,敏感词库中的敏感词通过人工添加设置,将第一分词序列中为敏感词的分词直接删除作为脱敏处理获得第二分词序列。

4.根据权利要求1所述的一种实时客服云端数据的管理方法,其特征在于,步骤S103中意图识别模型的分类标签与步骤S104中索引单词相同,其中索引单词通过人工添加设置,意图识别模型包括:第一隐藏层、第二隐藏层和全连接层;

5.根据权利要求1所述的一种实时客服云端数据的管理方法,其特征在于,在步骤S105中,问题实体通过用户发送问题数据中的关键词表示,应答实体通过客服应答数据中的关键词表示,服务质量实体通过服务质量数据中的关键词表示,满意度实体通过满意度数据中的关键词表示;历史业务数据中的关键词通过命名实体识别获得;实体的属性为文本类型则通过现有的词向量模型获得,实体的属性为数值类型则通过整数编码获得。

6.根据权利要求1所述的一种实时客服云端数据的管理方法,其特征在于,所述根据用户发送的问题文本的意图检索知识图谱获得第一关键词组合,包括以下步骤:

7.根据权利要求1所述的一种实时客服云端数据的管理方法,其特征在于,在步骤S106中,应答文本生成模型包括:第一生成器、第一判别器、第二生成器和第二判别器,第一生成器输入第一关键词组合,输出应答文本;第一判别器输入应答文本和真实应答文本,输出的值表示应答文本为真实应答文本的概率值;第二生成器输入应答文本,输出第二关键词组合,第二判别器输入第一关键词组合和第二关键词组合,输出的值表示第二关键词组合为第一关键词组合的概率值;

8.一种实时客服云端数据管理装置,其特征在于,包括:

9.一种计算机设备,其特征在于,包括处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当所述计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1-7任一所述的一种实时客服云端数据的管理方法的步骤。

10.一种存储介质,其特征在于,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1-7任一所述的一种实时客服云端数据的管理方法的步骤。

...

【技术特征摘要】

1.一种实时客服云端数据的管理方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种实时客服云端数据的管理方法,其特征在于,在步骤s101中,通过现有的分词模型对用户发送的问题文本进行分词处理获得分词,通过现有的词性标注模型对分词进行词性标注处理获得词性标注结果。

3.根据权利要求1所述的一种实时客服云端数据的管理方法,其特征在于,在步骤s102中,通过构建敏感词库识别第一分词序列中的分词是否为敏感词,敏感词库中的敏感词通过人工添加设置,将第一分词序列中为敏感词的分词直接删除作为脱敏处理获得第二分词序列。

4.根据权利要求1所述的一种实时客服云端数据的管理方法,其特征在于,步骤s103中意图识别模型的分类标签与步骤s104中索引单词相同,其中索引单词通过人工添加设置,意图识别模型包括:第一隐藏层、第二隐藏层和全连接层;

5.根据权利要求1所述的一种实时客服云端数据的管理方法,其特征在于,在步骤s105中,问题实体通过用户发送问题数据中的关键词表示,应答实体通过客服应答数据中的关键词表示,服务质量实体通过服务质量数据中的关键词表示,满意度实体通过满意度数据中的关键词表示;历史业务数据中的关键词通过命名实体识别获得;实体的属性为文本类型则通过现有的词向量模型获得,实体的属性为数...

【专利技术属性】
技术研发人员:胡源曹峰周爱广
申请(专利权)人:中国人寿保险股份有限公司山东省分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1