一种文本匹配方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：35193898 阅读：25 留言：0更新日期：2022-10-12 18:19

本申请实施例公开了一种文本匹配方法、装置、计算机设备和存储介质；本申请实施例可以获取文本信息和知识图谱；对文本信息进行编码处理，得到文本信息对应的语义特征，以及对知识图谱进行编码处理，得到知识图谱对应的语义特征；基于文本信息对应的语义特征，对知识图谱对应的语义特征进行注意力特征提取，得到知识图谱对应的注意力特征；基于知识图谱对应的语义特征，对文本信息对应的语义特征进行注意力特征提取，得到文本信息对应的注意力特征；基于知识图谱对应的注意力特征和文本信息对应的注意力特征在知识图谱中的至少一个参考实体对象中筛选出和文本信息中的实体对象相匹配的目标参考实体对象，可以提高实体链指的准确性。准确性。准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种文本匹配方法、装置、计算机设备和存储介质

[0001]本申请涉及计算机
，具体涉及一种文本匹配方法、装置、计算机设备和存储介质。

技术介绍

[0002]互联网网页，如新闻、博客等文本信息里涉及大量实体对象。大部分网页本身并没有关于这些实体对象的相关说明和背景介绍。为了帮助人们更好地了解网页内容，很多网站或作者会把网页中出现的实体对象链接到相应的知识库词条上，为读者提供更详尽的背景材料。这种做法实际上将互联网网页与实体对象之间建立了链接关系，因此被称为实体链指。本申请的专利技术人对现有技术的实践发现，现有的实体链指方法存在准确性较低的问题。

技术实现思路

[0003]本申请实施例提出了一种文本匹配方法、装置、计算机设备和存储介质，可以提高实体链指的准确性。
[0004]本申请实施例提供了一种文本匹配方法，包括：
[0005]获取文本信息和知识图谱，所述文本信息包括实体对象，其中，所述知识图谱包括至少一个参考实体对象；
[0006]对所述文本信息进行编码处理，得到所述文本信息对应的语义特征，以及对所述知识图谱进行编码处理，得到所述知识图谱对应的语义特征；
[0007]基于所述文本信息对应的语义特征，对所述知识图谱对应的语义特征进行注意力特征提取，得到所述知识图谱对应的注意力特征；
[0008]基于所述知识图谱对应的语义特征，对所述文本信息对应的语义特征进行注意力特征提取，得到所述文本信息对应的注意力特征；
[0009]基于所述知识图谱对应的注意力特...

【技术保护点】

【技术特征摘要】
1.一种文本匹配方法，其特征在于，包括：获取文本信息和知识图谱，所述文本信息包括实体对象，其中，所述知识图谱包括至少一个参考实体对象；对所述文本信息进行编码处理，得到所述文本信息对应的语义特征，以及对所述知识图谱进行编码处理，得到所述知识图谱对应的语义特征；基于所述文本信息对应的语义特征，对所述知识图谱对应的语义特征进行注意力特征提取，得到所述知识图谱对应的注意力特征；基于所述知识图谱对应的语义特征，对所述文本信息对应的语义特征进行注意力特征提取，得到所述文本信息对应的注意力特征；基于所述知识图谱对应的注意力特征和文本信息对应的注意力特征在所述知识图谱中的至少一个参考实体对象中筛选出和所述文本信息中的实体对象相匹配的目标参考实体对象。2.根据权利要求1所述的方法，其特征在于，所述基于所述文本信息对应的语义特征，对所述知识图谱对应的语义特征进行注意力特征提取，得到所述知识图谱对应的注意力特征，包括：对所述文本信息对应的语义特征进行全连接映射，得到所述文本信息对应的全连接特征；对所述文本信息对应的全连接特征进行归一化处理，得到所述文本信息对应的归一化特征；利用所述文本信息对应的归一化特征将所述知识图谱对应的语义特征进行注意力映射，得到所述知识图谱对应的注意力特征。3.根据权利要求2所述的方法，其特征在于，所述对所述文本信息对应的语义特征进行全连接映射，得到所述文本信息对应的全连接特征，包括：确定所述知识图谱中参考实体对象的数量信息；基于所述数量信息，生成全连接映射信息和偏置信息；将所述文本信息对应的语义特征和所述全连接映射信息进行乘法运算，得到文本信息的初始全连接特征；将所述文本信息的初始全连接特征和所述偏置信息进行加法运算，得到所述文本信息的全连接特征。4.根据权利要求2所述的方法，其特征在于，所述文本信息对应的归一化特征包括多个归一化特征元素；所述知识图谱的语义特征包括多个语义特征元素；所述利用所述文本信息对应的归一化特征将所述知识图谱对应的语义特征进行注意力映射，得到所述知识图谱对应的注意力特征，包括：将知识图谱的语义特征元素和对应的文本信息的归一化特征元素进行逻辑运算处理，得到注意力特征元素；将注意力特征元素进行整合，得到所述知识图谱对应的注意力特征。5.根据权利要求1所述的方法，其特征在于，所述基于所述知识图谱对应的语义特征，对所述文本信息对应的语义特征进行注意力特征提取，得到所述文本信息对应的注意力特征，包括：
对所述知识图谱对应的语义特征进行统计运算，得到所述知识图谱对应的统计特征；对所述知识图谱的统计特征进行全连接映射，得到所述知识图谱对应的全连接特征；对所述知识图谱的全连接特征进行归一化处理，得到所述知识图谱对应的归一化特征；利用所述知识图谱对应的归一化特征将所述文本信息对应的语义特征进行注意力映射，得到所述文本信息对应的注意力特征。6.根据权利要求1所述的方法，其特征在于，所述对所述文本信息进行编码处理，得到所述文本信息对应的语义特征，包括：对所述文本信息进行特征提取，得到所述文本信息的初始特征；对所述文本信息的初始特征进行特征挖掘，得到所述文本信息的挖掘后特征；将所述文本信息的挖掘后特征映射至预设语义空间中，得到所述文本信息对应的语义特征。7.根据权利要求1所述的方法，其特征在于，所述对所述知识图谱进行编码处理，得到所述知识图谱对应的语义特征，包括：对所述知识图谱进行识别，得到所述知识图谱对应的实体信息和实体关系信息；对所述知识图谱的实体信息和所述实体关系信息进行空间特征提取，得到所述实体信息对应的空间特征和所述实体关系信息对应的空间特征；将所述实体信息对应的空间特征和所述实体关系信息对应的空间特征进行融合，得到目标空间特征；将所述目标空间特征映射至知识图谱语义空间，得到所述知识图谱对应的语义特征。8.根据权利要求1所述的方法，其特征在于，所述基于所述知识图谱对应的注意力特征和文本信息对应的注意力特征在所述知识图谱中的至少一个参考实体对象中筛选出和所述文本信息中的实体对象相匹配的目标参考实体对象，包括：将所述知识图谱对应的注意力特征和文本信息对应的注意力特征进行融合，得到融合后注意力特征；对所述融合后注意力特征进行概率分布映射，得到概率分布映射结果；基于所述概率分布映射结果在所述知识图谱中的至...

【专利技术属性】
技术研发人员：黄剑辉，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人