System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 媒体信息的标签识别方法、装置和存储介质及电子设备制造方法及图纸_技高网

媒体信息的标签识别方法、装置和存储介质及电子设备制造方法及图纸

技术编号:40457132 阅读:9 留言:0更新日期:2024-02-22 23:13
本申请公开了一种媒体信息的标签识别方法、装置和存储介质及电子设备。其中,该方法包括:获取属于第一媒体标签的至少两个第一样本信息,和属于第二媒体标签的至少两个第二样本信息;利用至少两个第一样本信息获取第一媒体标签的第一标签表示,利用至少两个第二样本信息获取第二媒体标签的第二标签表示;获取待识别媒体信息与第一标签表示之间的第一信息相似度,获取待识别媒体信息与第二标签表示之间的第二信息相似度;将第一媒体标签确定为待识别媒体信息属于的媒体标签;将第二媒体标签确定为待识别媒体信息属于的媒体标签,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。本申请解决了媒体信息的标签识别效率较低的技术问题。

【技术实现步骤摘要】

本申请涉及计算机领域,具体而言,涉及一种媒体信息的标签识别方法、装置和存储介质及电子设备


技术介绍

1、在媒体信息的标签识别场景中,通常会标注大量样本数据,并训练模型,再用模型给新的媒体信息打标签,如需要人工收集大量的媒体信息,再对收集到的媒体信息采取人工标注,为媒体信息打上对应的标签。

2、但上述方式需要收集充足的样本数据,对于人力成本和时间成本都有较大消耗,进而导致媒体信息的标签识别效率较低的问题出现。因此,存在媒体信息的标签识别效率较低的问题。

3、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请实施例提供了一种媒体信息的标签识别方法、装置和存储介质及电子设备,以至少解决媒体信息的标签识别效率较低的技术问题。

2、根据本申请实施例的一个方面,提供了一种媒体信息的标签识别方法,包括:获取属于第一媒体标签的至少两个第一样本信息,和属于第二媒体标签的至少两个第二样本信息;利用上述至少两个第一样本信息获取上述第一媒体标签的第一标签表示,和利用上述至少两个第二样本信息获取上述第二媒体标签的第二标签表示,其中,上述第一标签表示用于表征属于上述第一媒体标签的信息内容,上述第二标签表示用于表征属于上述第二媒体标签的信息内容;响应于对待识别媒体信息触发的标签识别请求,获取上述待识别媒体信息与上述第一标签表示之间的第一信息相似度,和获取上述待识别媒体信息与上述第二标签表示之间的第二信息相似度,其中,上述标签识别请求用于请求确定上述待识别媒体信息属于的媒体标签;在上述第一信息相似度大于上述第二信息相似度的情况下,将上述第一媒体标签确定为上述待识别媒体信息属于的媒体标签;在上述第一信息相似度小于上述第二信息相似度的情况下,将上述第二媒体标签确定为上述待识别媒体信息属于的媒体标签。

3、根据本申请实施例的另一方面,还提供了一种媒体信息的标签识别装置,包括:第一获取单元,用于获取属于第一媒体标签的至少两个第一样本信息,和属于第二媒体标签的至少两个第二样本信息;第二获取单元,用于利用上述至少两个第一样本信息获取上述第一媒体标签的第一标签表示,和利用上述至少两个第二样本信息获取上述第二媒体标签的第二标签表示,其中,上述第一标签表示用于表征属于上述第一媒体标签的信息内容,上述第二标签表示用于表征属于上述第二媒体标签的信息内容;第三获取单元,用于响应于对待识别媒体信息触发的标签识别请求,获取上述待识别媒体信息与上述第一标签表示之间的第一信息相似度,和获取上述待识别媒体信息与上述第二标签表示之间的第二信息相似度,其中,上述标签识别请求用于请求确定上述待识别媒体信息属于的媒体标签;第一确定单元,用于在上述第一信息相似度大于上述第二信息相似度的情况下,将上述第一媒体标签确定为上述待识别媒体信息属于的媒体标签;第二确定单元,用于在上述第一信息相似度小于上述第二信息相似度的情况下,将上述第二媒体标签确定为上述待识别媒体信息属于的媒体标签。

4、作为一种可选的方案,上述第二获取单元,包括:第一提取模块,用于对上述至少两个第一样本信息进行特征提取,得到第一信息特征,其中,上述第一标签表示包括上述第一信息特征;和,第二提取模块,用于对上述至少两个第二样本信息进行特征提取,得到第二信息特征,其中,上述第二标签表示包括上述第二信息特征;上述第三获取单元,包括:第一获取模块,用于获取上述待识别媒体信息对应的媒体信息特征和上述第一信息特征之间的第一特征相似度,其中,上述媒体信息特征用于表征上述待识别媒体信息的信息内容,上述第一信息相似度包括上述第一特征相似度;和,第二获取模块,用于获取上述媒体信息特征和上述第二信息特征之间的第二特征相似度,其中,上述第二信息相似度包括上述第二特征相似度。

5、作为一种可选的方案,上述第一提取模块,包括:第一提起子模块,用于对上述至少两个第一样本信息进行多模态的特征提取,得到属于第一模态的第一子特征,和属于第二模态的第二子特征,其中,上述第一样本信息包含属于上述第一模态的第一子信息,和属于上述第二模态的第二子信息,上述第一子特征用于表征上述第一子信息的信息内容,上述第二子特征用于表征上述第二子信息的信息内容;第一融合子模块,用于对上述第一子特征和上述第二子特征进行特征融合,得到上述第一信息特征;上述第二提取模块,包括:第二提起子模块,用于对上述至少两个第二样本信息进行多模态的特征提取,得到属于上述第一模态的第三子特征,和属于上述第二模态的第四子特征,其中,上述第二样本信息包含属于上述第一模态的第三子信息,和属于上述第二模态的第四子信息,上述第三子特征用于表征上述第三子信息的信息内容,上述第四子特征用于表征上述第四子信息的信息内容;第二融合子模块,用于对上述第三子特征和上述第四子特征进行特征融合,得到上述第二信息特征。

6、作为一种可选的方案,上述第一提起子模块,包括:第一变量子单元,用于将上述第一子信息表示为特征维度的第一变量,和将上述第二子信息表示为上述特征维度的第二变量,其中,上述第一子特征包括上述第一变量,上述第二子特征包括上述第二变量;上述第一融合子模块,包括:第一平均子单元,用于将相同上述特征维度的上述第一变量和上述第二变量进行第一平均处理,并将上述第一平均处理得到的结果,作为上述第一信息特征;上述第二提起子模块,包括:第二变量子单元,用于将上述第三子信息表示为上述特征维度的第三变量,和将上述第四子信息表示为上述特征维度的第四变量,其中,上述第三子特征包括上述第三变量,上述第四子特征包括上述第四变量;上述第二融合子模块,包括:第二平均子单元,用于将相同上述特征维度的上述第三变量和上述第四变量进行第二平均处理,并将上述第二平均处理得到的结果,作为上述第二信息特征。

7、作为一种可选的方案,上述第一获取模块,包括:第一映射子模块,用于将上述媒体信息特征映射至多维空间内,得到第一特征向量;第二映射子模块,用于将上述第一信息特征映射至上述多维空间内,得到第二特征向量;第一计算子模块,用于计算上述第一特征向量和上述第二特征向量之间的第一余弦距离,其中,上述第一特征相似度与上述第一余弦距离呈正相关关系;

8、上述第二获取模块,包括:第三映射子模块,用于将上述第二信息特征映射至上述多维空间内,得到第三特征向量;第二计算子模块,用于计算上述第三特征向量和上述第二特征向量之间的第二余弦距离,其中,上述第二特征相似度与上述第二余弦距离呈正相关关系。

9、作为一种可选的方案,上述第二获取单元,包括:第一输入模块,用于将上述至少两个第一样本信息输入标签表示模型,得到上述第一标签表示,其中,上述标签表示模型为利用多个样本信息训练得到的、用于提取标签表示的神经网络模型;和,第二输入模块,用于将上述至少两个第二样本信息输入上述标签表示模型,得到上述第二标签表示。

10、作为一种可选的方案,上述装置还包括:第三获取模块,用于在上述将上述至少两个第一样本信息输入标签表示模型,得到上述第一标签表示之前,本文档来自技高网...

【技术保护点】

1.一种媒体信息的标签识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求2所述的方法,其特征在于,

4.根据权利要求3所述的方法,其特征在于,

5.根据权利要求2所述的方法,其特征在于,

6.根据权利要求1所述的方法,其特征在于,所述利用所述至少两个第一样本信息获取所述第一媒体标签的第一标签表示,和利用所述至少两个第二样本信息获取所述第二媒体标签的第二标签表示,包括:

7.根据权利要求6所述的方法,其特征在于,在所述将所述至少两个第一样本信息输入标签表示模型,得到所述第一标签表示之前,所述方法还包括:

8.根据权利要求1至7中任一项所述的方法,其特征在于,

9.根据权利要求1至7中任一项所述的方法,其特征在于,在所述将所述第一媒体标签确定为所述待识别媒体信息属于的媒体标签,或所述将所述第二媒体标签确定为所述待识别媒体信息属于的媒体标签之后,所述方法还包括:

10.一种媒体信息的标签识别装置,其特征在于,包括:

11.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序被电子设备运行时执行所述权利要求1至9任一项中所述的方法。

12.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至9任一项中所述方法的步骤。

13.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至9任一项中所述的方法。

...

【技术特征摘要】

1.一种媒体信息的标签识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求2所述的方法,其特征在于,

4.根据权利要求3所述的方法,其特征在于,

5.根据权利要求2所述的方法,其特征在于,

6.根据权利要求1所述的方法,其特征在于,所述利用所述至少两个第一样本信息获取所述第一媒体标签的第一标签表示,和利用所述至少两个第二样本信息获取所述第二媒体标签的第二标签表示,包括:

7.根据权利要求6所述的方法,其特征在于,在所述将所述至少两个第一样本信息输入标签表示模型,得到所述第一标签表示之前,所述方法还包括:

8.根据权利要求1至7中任一项所述的方法,其特征在于,

9.根据权利要求1至7中任一项...

【专利技术属性】
技术研发人员:刘霄陈世哲杨煜霖
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1