基于知识增强处理的FAQ相似度计算方法、装置及电子设备制造方法及图纸

技术编号：26342595 阅读：17 留言：0更新日期：2020-11-13 20:35

本申请实施例提出了基于知识增强处理的FAQ相似度计算方法、装置及电子设备，包括接收客户文本，确定对应客户文本的目标文本，对客户文本、目标文本进行基于知识分布的知识增强处理，基于处理结果进行FAQ相似度计算，根据相似度计算结果与预设阈值的大小关系进行不同处理。在经过上述处理后基于FAQ相似度结果与预设阈值的大小关系判定是否继续进行扩充客户文本、目标文本语义范围的同义句句组的操作，进而基于同义句句组进行FAQ相似度计算。通过在两种判断结果中分别采用不同的方式对目标文本进行扩容，扩大了用户提问和目标文本的相同词语范围，提升相似度的计算结果。

全部详细技术资料下载

【技术实现步骤摘要】
基于知识增强处理的FAQ相似度计算方法、装置及电子设备
本专利技术属于相似度计算领域，尤其涉及基于知识增强处理的FAQ相似度计算方法、装置及电子设备。
技术介绍
FAQ（FrequentlyAskedQuestions）相似度计算在各个业务领域中有着广泛的应用。如在证券行业，各大证券公司都会对客户常问的一些问题进行总结，将这些问题归纳成一系列的目标文本。然后利用FAQ相似度计算方法从目标文本中选出相似度最大的文本对应的答案作为客户提问的最佳答案。现有的FAQ相似度计算方法有专利多种，可以概括为三大类：基于词语匹配的方法、词语匹配和词向量混合的方法、基于词向量或句子向量的方法。上述相似度计算方法都是直接计算客户提问文本和目标文本的相似度。单句的用户提问和目标文本数据量都十分有限，使得两文本表达的语义不够丰富，容易造成用户提问与目标文本匹配不上的结果。如客户提问“我手续费多少”和目标文本“A股交易费用”之间差距过大，直接计算相似度容易匹配不到正确答案。因此，为了解决两文本直接计算相似度时，数据量有限和语义不够丰富的问题，需要对客户提问或者目标文本进行知识增强。
技术实现思路
为了解决现有技术中存在的缺点和不足，本专利技术提出了基于知识增强处理的FAQ相似度计算方法、装置及电子设备，通过针对客户文本的长短不同分别采取基于知识分布的知识增强处理、生成用于扩充客户文本、目标文本语义范围的同义句句组的方式扩大目标文本的词语范围，从而提升了相似度的计算结果。为了达到上述技术目的，根据本公开实施例...

【技术保护点】
1.基于知识增强处理的FAQ相似度计算方法，其特征在于，所述FAQ相似度计算方法包括：/n接收客户文本，确定对应客户文本的目标文本；/n对客户文本、目标文本进行基于知识分布的知识增强处理，基于处理结果进行FAQ相似度计算；/n如果FAQ相似度结果大于预设阈值，输出FAQ相似度结果；/n如果FAQ相似度结果不大于预设阈值，生成用于扩充客户文本、目标文本语义范围的同义句句组，基于同义句句组进行FAQ相似度计算。/n

【技术特征摘要】
1.基于知识增强处理的FAQ相似度计算方法，其特征在于，所述FAQ相似度计算方法包括：
接收客户文本，确定对应客户文本的目标文本；
对客户文本、目标文本进行基于知识分布的知识增强处理，基于处理结果进行FAQ相似度计算；
如果FAQ相似度结果大于预设阈值，输出FAQ相似度结果；
如果FAQ相似度结果不大于预设阈值，生成用于扩充客户文本、目标文本语义范围的同义句句组，基于同义句句组进行FAQ相似度计算。

2.根据权利要求1所述的基于知识增强处理的FAQ相似度计算方法，其特征在于，所述对客户文本、目标文本进行基于知识分布的知识增强处理，基于处理结果进行FAQ相似度计算，包括：
对客户文本以及目标文本进行分词处理；
选取与目标文本对应的同义句构建对应目标文本的知识分布集合，判断知识分布集合中是否存在对应客户文本中已得到的分词内容；
如果存在，则将已得到的分词内容增加至目标文本中，基于扩容后的目标文本进行对应客户文本的FAQ相似度计算。

3.根据权利要求2所述的基于知识增强处理的FAQ相似度计算方法，其特征在于，所述知识分布集合中还设有对应每个同义词组的权重值。

4.根据权利要求1所述的基于知识增强处理的FAQ相似度计算方法，其特征在于，所述生成用于扩充客户文本、目标文本语义范围的同义句句组，基于同义句句组进行FAQ相似度计算，包括：
构建同义句生成模型；
基于同义句生成模型分别生成对应客户文本、目标文本的预设数量的同义句，将得到的同义句进行组合得到客户文本同义句句组、目标文本同义句句组；
将客户文本同义句句组、目标文本同义句句组中的内容转换为向量进行相似度FAQ计算。

5.根据权利要求4所述的基于知识增强处理的FAQ相似度计算方法，其特征在于，所述构建同义句生成模型，包括：
构建初始深度学习模型；
在初始深度学习模型中依次调用长短期记忆人工神经网络、多层感知器将接收到的客户文本进行编码得到的已编码向量；
在初始深度学习模型中再度依次调用多层感知器、长短期记忆人工神经网络对已编码向量进行解码，得到与客户文本相近的同义句；
在得到同义句的过程中将客户文本作为初始深度学习模型的输入信号、将已得到的同义句作为同义句生成过程中的监督信号对初始深度学习模型进行训练，得到同义句生成模型。

6.根据权利要求4所述的基于知识增强处理的FAQ相似度计算方法，其特征在于，所述将客户文本同义句句组、目标文本同义句句组中的内容转换为向量进行相似度FAQ计算，包括：
调用长短期记忆人工神经网络将客户文本同义句句组、目标文本同义句句组中的内容进行编码得到句子向量；
基于余弦相似度计算公式计算客户文本同义句句组中的句子向量和目标文本同义句句组中句子向量的相似度，基于计算结果构建相似度矩阵；
选取相似度矩阵中最大值作为客户文本和目标文本的相似度数值。

7.基于知识增强处理的FAQ相似度计算装置，其特征在于，所述数据处理装置包括：
文本接收模块，用于接收客户文本，确定对应客户文本的目标文本；
相似度计算模块，用于对客户文本、目标文本进行基于知识分布的知识增强处理，基于处理结果进行FAQ相似度计算；
所述相似度计算模块，包括：

【专利技术属性】
技术研发人员：廖智霖，高峰，吕杨苗，林金曙，
申请(专利权)人：恒生电子股份有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人