基于语义识别的文本匹配方法、设备及设备可读存储介质组成比例

技术编号：29527295 阅读：20 留言：0更新日期：2021-08-03 15:13

本发明专利技术实施方式提供了基于语义识别的文本匹配方法、电子设备及计算机可读存储介质，涉及计算机应用技术领域。其中，文本匹配方法包括：获取待匹配文本和目标文本的结构模型，其中，所述结构模型包括多个结构模块，所述结构模块包括：关键词及其对应的句子集；针对所述待匹配文本的结构模型的各结构模块，分别从所述目标文本的结构模型中识别出对应的结构模块，以构建模块组；根据各所述模块组内模块之间的相似度，生成所述待匹配文本的匹配结果。本发明专利技术所提供的方法基于关键词以及对应的句子集构建文本的结构模型来进行文本之间的匹配，可以充分利用文本的结构信息执行匹配任务，对于长文本而言，能够提供更高质量的文本匹配结果。

全部详细技术资料下载

【技术实现步骤摘要】
基于语义识别的文本匹配方法、设备及设备可读存储介质
本专利技术涉及计算机应用
，更为具体而言，涉及文本匹配方法、电子设备以及计算机可读存储介质。
技术介绍
近年来随着移动互联网的蓬勃发展，涌现了大量基于内容分发服务的应用程序和相关自媒体平台，它们在人们的日常生活中扮演着越来越重要的角色。常见的内容平台比如：今日头条、微信公众号、天天快报等随时为广大的用户群体提供及时且海量的资讯信息和多元的数字富媒体内容，同时深刻地改变了人们获取信息的方式和途径。这些平台不仅致力于为用户的搜索查询需求提供相关的内容服务，更重要的功能是主动向用户推荐其平台的内容，这样才能更好地满足用户潜在的需求，从而吸引用户停留来提升其使用对应软件的频率，最终提升软件自身的日活跃度。其中，这些平台所提供的内容信息很大一部分均以文字为主要载体，用户可以通过阅读文字来高效地从文本内容当中获取信息和观点评论。当用户完成阅读一篇文章，软件平台常常会根据用户的兴趣和习惯主动为其推荐相同或者相近话题的其他文章。而如何判断文章之间的主要内容是否关于相同或相近的...

【技术保护点】
1.一种文本匹配方法，其特征在于，所述方法包括：/n获取待匹配文本和目标文本的结构模型，其中，所述结构模型包括多个结构模块，所述结构模块包括：关键词及其对应的句子集；/n针对所述待匹配文本的结构模型的各结构模块，分别从所述目标文本的结构模型中识别出对应的结构模块，以构建模块组；/n根据各所述模块组内模块之间的相似度，生成所述待匹配文本的匹配结果。/n

【技术特征摘要】
1.一种文本匹配方法，其特征在于，所述方法包括：
获取待匹配文本和目标文本的结构模型，其中，所述结构模型包括多个结构模块，所述结构模块包括：关键词及其对应的句子集；
针对所述待匹配文本的结构模型的各结构模块，分别从所述目标文本的结构模型中识别出对应的结构模块，以构建模块组；
根据各所述模块组内模块之间的相似度，生成所述待匹配文本的匹配结果。

2.根据权利要求1所述的方法，其特征在于，在根据各所述模块组内模块之间的相似度，生成所述待匹配文本的匹配结果之前，所述方法还包括：
分别通过以下处理计算各所述模块组内模块之间的相似度：
计算模块之间所述关键词的相似度，作为第一子相似度；
计算模块之间所述句子集的相似度，作为第二子相似度；
基于所述第一子相似度与所述第二子相似度的加权平均值，生成模块之间的相似度。

3.根据权利要求1所述的方法，其特征在于，在获取待匹配文本和目标文本的结构模型之前，所述方法还包括：
分别通过以下处理构建所述待匹配文本和所述目标文本的结构模型：
从文本中抽取关键词；
基于文本中的句子与关键词之间的相关度，将句子进行划分，其中，被划分至同一关键词的一个或多个句子构成该关键词所对应的句子集；
将每个关键词及其对应的句子集定义为一个结构模块；
整合所有的结构模块以构建所述结构模型。

4.根据权利要求2所述的方法，其特征在于，在基于所述第一子相似度与所述第二子相似度的加权平均值，生成模块之间的相似度之前，所述方法还包括：
针对所述模块组中的各模块，分别计算其所包含的关键词与句子集之间的相关度；
将所述模块组的所述相关度的平均值与设定阈值进行比较；
若小于或等于所述设定阈值，则将所述第一子相似度的权重设置为小于所述第二子相似度的权重。

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：
若大于所述设定阈值，则将所述第一子相似度的权重设置为与所述第二子相似度的权重一致。

【专利技术属性】
技术研发人员：不公告发明人，
申请(专利权)人：武汉红火蚁智能科技有限公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人