目标词语的确定方法、模型的训练方法、装置及电子设备制造方法及图纸

技术编号：33247688 阅读：34 留言：0更新日期：2022-04-27 18:03

本发明专利技术实施例公开了一种目标词语的确定方法、模型的训练方法、装置及电子设备，该目标词语的确定方法通过全连接特征映射的方式构建注意力机制，来提取各种内容信息对应的注意力特征，利用其余内容信息对应的注意力特征来强化当前内容信息的语义特征提取，将得到的各种内容信息的强化特征进行融合得到融合特征，再根据融合特征来确定目标词语，使得在确定目标词语时结合了不同模态的内容信息，相比于仅通过目标文本来确定目标词语，能够降低与多媒体内容匹配度较低的候选词语所带来的影响，提高确定目标词语的准确性，可以广泛应用于人工智能、云计算、自然语言处理等技术领域。自然语言处理等技术领域。自然语言处理等技术领域。

全部详细技术资料下载

【技术实现步骤摘要】
目标词语的确定方法、模型的训练方法、装置及电子设备

[0001]本专利技术涉及数据处理
，特别是涉及一种目标词语的确定方法、模型的训练方法、装置及电子设备。

技术介绍

[0002]随着互联网技术的快速发展，互联网中多媒体内容的数量呈急剧增长的趋势，利用多媒体内容中包含的文本信息来进行多媒体内容的搜索，成为了当下的研究热点之一。
[0003]相关技术中，一般是从多媒体内容包含的文本中确定目标词语来作为搜索标签，通常来说，会采用多媒体内容的标题来确定对应的目标词语。然而，多媒体内容的标题往往会包含与多媒体内容匹配度较低的词语，使得在根据多媒体内容的标题确定目标词语时容易产生混淆，降低了确定目标词语的准确性。

技术实现思路

[0004]以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
[0005]本专利技术实施例提供了一种目标词语的确定方法、模型的训练方法、装置及电子设备，能够提高确定目标词语的准确性。
[0006]一方面，本专利技术实施例提供了一种目标词语的

【技术保护点】

【技术特征摘要】
1.一种目标词语的确定方法，其特征在于，包括：获取目标多媒体内容在多种不同模态下的内容信息，其中，多种所述内容信息包括所述目标多媒体内容的目标文本，所述目标文本包括多个候选词语；对各种所述内容信息进行特征提取，得到各种所述内容信息对应的语义特征；对各个所述语义特征进行全连接特征映射，得到各种所述内容信息对应的注意力特征；遍历各种所述内容信息，将当前遍历的所述内容信息对应的语义特征与目标注意力特征进行融合，得到各种所述内容信息对应的强化特征，将各种所述内容信息对应的所述强化特征进行融合，得到融合特征，其中，所述目标注意力特征为除了当前遍历的内容信息以外其余的内容信息对应的注意力特征；根据所述融合特征确定各个所述候选词语的分类结果；根据所述分类结果从多个所述候选词语中确定目标词语。2.根据权利要求1所述的目标词语的确定方法，其特征在于，所述对各个所述语义特征进行全连接特征映射，得到各种所述内容信息对应的注意力特征，包括：通过全连接层对各个所述语义特征进行特征映射，得到映射特征；通过归一化层对所述映射特征进行归一化处理，得到各种所述内容信息对应的注意力特征。3.根据权利要求2所述的目标词语的确定方法，其特征在于，所述全连接层设置有映射参数矩阵和偏置向量，所述映射参数矩阵和所述偏置向量基于目标语义特征的特征维度得到，所述目标语义特征为除了待映射的语义特征以外其余的语义特征，所述通过全连接层对各个所述语义特征进行特征映射，得到映射特征，包括：将所述映射参数矩阵与对应的所述内容信息的所述语义特征进行求积，得到第一特征；将所述第一特征与所述偏置向量进行求和，得到第二特征；通过激活函数层对所述第二特征进行激活处理，得到映射特征。4.根据权利要求1至3任意一项所述的目标词语的确定方法，其特征在于，所述将当前遍历的语义特征与目标注意力特征进行融合，得到各个所述语义特征对应的强化特征，包括：当所述目标注意力特征的数量为一个，将当前遍历的语义特征与所述目标注意力特征进行求积或者拼接，得到语义特征对应的强化特征；或者，当所述目标注意力特征的数量为至少两个，根据至少两个所述目标注意力特征得到融合注意力特征，将当前遍历的语义特征与所述融合注意力特征进行求积，得到各个所述语义特征对应的强化特征；或者，当所述目标注意力特征的数量为至少两个，将各个所述目标注意力特征与当前遍历的语义特征求积后进行拼接，得到各个所述语义特征对应的强化特征。5.根据权利要求1所述的目标词语的确定方法，其特征在于，多种所述内容信息还包括所述目标多媒体内容的目标图像，所述获取目标多媒体内容在多种不同模态下的内容信息，包括：获取所述目标多媒体内容的标题、简介或者字幕中的至少一种，将所述标题、所述简介
或者所述字幕中的至少一种作为所述目标多媒体内容的所述目标文本；对所述目标多媒体内容进行分帧处理，得到多个候选图像，从多个所述候选图像中确定所述目标多媒体内容的所述目标图像。6.根据权利要求5所述的目标词语的确定方法，其特征在于，所述从多个所述候选图像中确定所述目标多媒体内容的所述目标图像，包括：将多个所述候选图像输入至目标图像确定模型，对多个所述候选图像进行特征提取，得到各个所述候选图像对应的候选图像特征，根据所述候选图像特征计算各个所述候选图像对应的目标得分；根据所述目标得分从多个所述候选图像中确定所述目标多媒体内容的所述目标图像。7.根据权利要求6所述的目标词语的确定方法，其特征在于，所述目标图像确定模型通过以下步骤训练得到：获取样本图像；将所述样本图像输入至所述目标图像确定模型，对所述样本图像进行特征提取，得到所述样本图像对应的样本图像特征，根据所述样本图像特征计算所述样本图像对应的样本得分；将所述样本图像特征与所述样本得分进行加权，得到所述样本图像特征对应的加权图像特征；对所述加权图像特征进行编码，得到编码图像特征；对所述编码图像特征进行解码，得到解码图像特征；将所述解码图像特征与所述样本图像特征进行比对，根据比对结果确定第一损失值，根据所述第一损失值修正所述目标图像确定模型的第一模型参数。8.根据权利要求5至7任意一项所述的目标词语的确定方法，其特征在于，所述对各种所述内容信息进行特征提取，...

【专利技术属性】
技术研发人员：黄剑辉，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人