一种文本匹配方法、装置、设备及介质制造方法及图纸

技术编号:28035446 阅读:15 留言:0更新日期:2021-04-09 23:17
本公开实施例涉及一种文本匹配方法、装置、设备及介质,其中该方法包括:获取目标短文本和目标长文本;确定与目标短文本相匹配的候选长文本;采用第一匹配模型对目标长文本和候选长文本进行匹配,确定第一匹配结果;基于第一匹配结果,得到目标短文本与目标长文本的第一匹配结果。采用上述技术方案,通过将短文本和长文本之间的匹配转换为两个长文本之间的匹配,可以避免因短文本信息量过少或短文本与长文本信息不对等导致的匹配不准确的问题,提高短文本和长文本之间匹配的准确性。

【技术实现步骤摘要】
一种文本匹配方法、装置、设备及介质
本公开涉及语义处理
,尤其涉及一种文本匹配方法、装置、设备及介质。
技术介绍
文本匹配是自然语言处理领域中一个核心问题,它通过计算文本之间的相关性在许多自然语言处理应用中起到核心支撑作用,如信息检索、问答系统、对话系统、推荐系统等。现有文本匹配技术,通常通过提取文本的特征,采用一些相似度度量方法计算文本之间的相似度或判断文本是否相关。除此之外,也有采用深度学习技术,基于神经网络训练得到文本的语义向量表示,再进行文本匹配;或者直接使用深度学习方法进行端到端的文本匹配。但是上述文本匹配方式均存在因短文本信息量少以及短文本与长文本信息不对等导致的匹配不准确的问题。
技术实现思路
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种文本匹配方法、装置、设备及介质。本公开实施例提供了一种文本匹配方法,所述方法包括:获取目标短文本和目标长文本;确定与所述目标短文本相匹配的候选长文本;采用第一匹配模型对所述目标长文本和所述候选长文本进行匹配,本文档来自技高网...

【技术保护点】
1.一种文本匹配方法,其特征在于,包括:/n获取目标短文本和目标长文本;/n确定与所述目标短文本相匹配的候选长文本;/n采用第一匹配模型对所述目标长文本和所述候选长文本进行匹配,确定第一匹配结果;/n基于所述第一匹配结果,得到所述目标短文本与所述目标长文本的匹配结果。/n

【技术特征摘要】
1.一种文本匹配方法,其特征在于,包括:
获取目标短文本和目标长文本;
确定与所述目标短文本相匹配的候选长文本;
采用第一匹配模型对所述目标长文本和所述候选长文本进行匹配,确定第一匹配结果;
基于所述第一匹配结果,得到所述目标短文本与所述目标长文本的匹配结果。


2.根据权利要求1所述的方法,其特征在于,确定与所述目标短文本相匹配的候选长文本,包括:
通过在预设的文本匹配库中进行查找,确定与所述目标短文本匹配的候选长文本,其中,所述候选长文本的数量为至少一个。


3.根据权利要求2所述的方法,其特征在于,通过在预设的文本匹配库中进行查找,确定与所述目标短文本匹配的候选长文本包括:
确定所述目标短文本与所述文本匹配库中的各短文本的文本相似度;
将文本相似度大于或等于相似度阈值的短文本所对应的长文本确定为所述候选长文本。


4.根据权利要求2所述的方法,其特征在于,所述文本匹配库按照短文本与长文本匹配的文本对的方式进行存储。


5.根据权利要求1所述的方法,其特征在于,采用第一匹配模型对所述目标长文本和所述候选长文本进行匹配,确定第一匹配结果,包括:
将所述目标长文本和所述候选长文本分别输入文本表征模型中,得到对应的语义向量;
根据所述目标长文本和所述候选长文本对应的语义向量确定融合特征向量,并将所述融合特征向量输入所述第一匹配模型中,得到第一匹配结果。


6.根据权利要求5所述的方法,其特征在于,根据所述目标长文本和所述候选长文本对应的语义向量确定融合特征向量,包括:
将所述目标长文本和所述候选长文本各自对应的语义向量经过融合处理后得到所述融合特征向量,其中,所述融合处理包括相加、相乘、相除、非线性变化中的至少一种。


7.根据权利要求1所述的方法,其特征在于,所述第一匹配模型通过以下方法训练获得:
获取长文本样本对,基于文本表征模型获得所述长文本样本对的语义向量;
将两个语义向量进行融合处理后得到样本融合特征向量;
基于样本融合特征向量以及所述长文本样本对的匹配标签,对基础第一匹配模型进行训练,得到所述第一匹配模型。


8.根据权...

【专利技术属性】
技术研发人员:傅玮萍许国伟丁文彪刘子韬
申请(专利权)人:北京世纪好未来教育科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1