文本匹配模型的构建方法、系统、计算机设备及存储介质技术方案

技术编号:27316259 阅读:53 留言:0更新日期:2021-02-10 09:48
本发明专利技术实施例涉及一种文本匹配模型的构建方法、系统、计算机设备及存储介质,将搜索文本样本集合和视频标题样本集合输入至特征抽取模块中,并将特征抽取模块的输出结果作为编码模块的输入,对文本匹配模型进行训练;采用语义交互模块对文本匹配模型的训练过程进行监督,以及确定文本匹配模型和语义交互模块之间的第一关联关系,第一关联关系用于表征文本匹配模型的训练结果;基于第一关联关系辅助文本匹配模型进行训练,直至第一关联关系满足预设收敛条件,确定文本匹配模型训练完成,相比于单一无其它模块的监督学习直接进行训练的文本匹配模型,精准度更高,文本匹配模型输出的结果更符合用户的需求。的结果更符合用户的需求。的结果更符合用户的需求。

【技术实现步骤摘要】
文本匹配模型的构建方法、系统、计算机设备及存储介质


[0001]本专利技术实施例涉及视频领域,尤其涉及一种文本匹配模型的构建方法、系统、计算机设备及存储介质。

技术介绍

[0002]随着科学技术的不断发展,电子技术也得到了飞速发展。人们可以通过例如智能手机、平板电脑等计算机设备下载安装各种视频/资讯类应用(如腾X视频或XX头条等)以观看视频。
[0003]现有技术中,用户可以在应用界面上通过输入搜索词来获取想要观看的视频,例如采用表示的文本匹配方法获取搜索结果,基于表示的文本匹配方法可以得到搜索词和搜索结果的表示抽取模型,在执行搜索操作时直接抽取高频的搜索词和搜索结果的表示,但是模型构建过程中仅仅考虑了句子级别的语义匹配,导致模型的精准度不高,经常会出现没有用户想要的视频或者搜索出的视频质量欠佳,不能很好的满足用户的观看需求。

技术实现思路

[0004]鉴于此,为解决上述技术问题或部分技术问题,本专利技术实施例提供一种文本匹配模型的构建方法、系统、计算机设备及存储介质。
[0005]第一方面,本专利技术实施例提供本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本匹配模型的构建方法,其特征在于,所述文本匹配模型包括特征抽取模块和编码模块,所述方法包括:将搜索文本样本集合和视频标题样本集合输入至所述特征抽取模块中,并将所述特征抽取模块的输出结果作为所述编码模块的输入,对所述文本匹配模型进行训练;采用所述语义交互模块对所述文本匹配模型的训练过程进行监督,以及确定所述文本匹配模型和所述语义交互模块之间的第一关联关系,所述第一关联关系用于表征所述文本匹配模型的训练结果;基于所述第一关联关系辅助所述文本匹配模型进行训练,直至所述第一关联关系满足预设收敛条件,确定所述文本匹配模型训练完成。2.根据权利要求1所述的方法,其特征在于,其特征在于,所述方法还包括:采用解码模块与所述语义交互模块对所述文本匹配模型的训练过程进行监督,以及确定所述文本匹配模型、所述语义交互模块和所述解码模块之间的第二关联关系,所述第二关联关系用于表征所述文本匹配模型的训练结果;基于所述第二关联关系辅助所述文本匹配模型进行训练,直至所述第二关联关系满足预设收敛条件,确定所述文本匹配模型训练完成。3.根据权利要求2所述的方法,其特征在于,其特征在于,所述将搜索文本样本集合和视频标题样本集合输入至所述特征抽取模块中,并将所述特征抽取模块的输出结果作为所述编码模块的输入,包括:通过所述特征抽取模块对搜索文本样本集合和视频标题样本集合进行向量化处理,得到所述搜索文本样本集合对应的第一文本向量,以及所述视频标题样本集合对应的第二文本向量,其中,所述第一文本向量和所述第二文本向量用于作为所述语义交互模块的输入向量;通过所述编码模块对所述第一文本向量和所述第二文本向量进行编码处理,得到所述搜索文本样本集合对应的第三文本向量,以及所述视频标题样本集合对应的第四文本向量,其中,所述第三文本向量和所述第四文本向量用于作为所述解码模块的输入向量。4.根据权利要求3所述的方法,其特征在于,所述采用解码模块与所述语义交互模块对所述文本匹配模型的训练过程进行监督,以及确定所述文本匹配模型、所述语义交互模块和所述解码模块之间的第二关联关系,包括:通过所述解码模块对所述第三文本向量和所述第四文本向量进行解码处理,得到所述搜索文本样本集合对应的第五文本向量,以及所述视频标题样本集合对应的第六文本向量;通过所述语义交互模块确定所述第一文本向量和所述第二文本向量之间的特征匹配向量,以及确定所述第三文本向量和所述第四文本向量之间的特征交互向量;确定所述第三文本向量、所述第四文本向量、预训练的搜索文本向量、预训练的视频标题向量、所述第五文本向量和所述第六文本向量、所述特征匹配向量和所述特征交互向量之间的第二关联关系;所述采用所述语义交互模块对所述文本匹配模型的训练过程进行监督,以及确定所述文本匹配模型和所述语义交互模块之间的第一关联关系,包括:通过所述语义交互模块确定所述第一文本向量和所述第二文本向量之间的特征匹配
向量,以及确定所述第三文本向量和所述第四文本向量之间的特征交互向量;确定所述第三文本向量、所述第四文本向量、所述特征匹配向量和所述特征交互向量之间的第一关联关系。5.根据权利要求4所述的方法,其特征在于,所述确定所述第三文本向量、所述第四文本向量、预训练的搜索文本向量、预训练的视频标题向量、所述第五文本向量和所述第六文本向量、所述特征匹配向量和所述特征交互向量之间的第二关联关系,包括:基于所述第三文本向量和所述第四文本向量确定所述搜索文本样本集合和所述视频标题样本集合之间匹配度的第一损失函数;基于所述预训练的搜索文本向量和所述第五文本向量之间的均方误差确定对应的第二损失函数;基于所述预训练的视频标题向量和所述第六文本向量之间的均方误差确定对应的第三损失函数;基于所述特征匹配向量和所述特征交互向量之间的交叉熵确定对应的第四损失函数;基于所述第一损失函数、所述第二损失函数、所述第三损失函数和所述第四损失函数确定所述文本匹配模型对应的第五损失函数,所述第五损失函数用于表征所述第二关联关系;所述确定所述第三文本向量、所述第四文本向量、所述特征匹配向量和所述特征交互向量之间的第一关联关系,包括:基于所述第三文本向量和所述第四文本向量确定所述搜索文本样本集合和所述视频标题样本集合之间匹配度的第一损失函数;基于所述特征匹配向量和所述特征交互向量之间的交叉熵确定对应的第四损失函数;基于所述第一损失函数和所述第四损失函数确定所述文本匹配模型对应的第六损失函数,所述第五损失函数用于表征所述第一关联关系。6.根据权利要求5所述的方法,其特征在于,所述基于所述第二关联关系辅助所述文本匹配模型进行训练...

【专利技术属性】
技术研发人员:赵海林刘庆宇魏强
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1