【技术实现步骤摘要】
一种多媒体资源的识别方法、装置、设备及存储介质
[0001]本公开涉及网络
,尤其涉及一种多媒体资源的识别方法、装置、设备及存储介质。
技术介绍
[0002]随着网络技术的发展,利用深度学习识别多媒体资源(如文本识别、视频图像、语音识别)得到了广泛应用。例如,对于文本数据,采用自然语音处理进行内容识别;对于视频图像而言,采用图像识别算法进行内容识别;对于语音数据,采用语音识别算法进行内容识别。
[0003]而在实际应用中,单独采用一种算法对多媒体资源进行识别,往往无法准确的识别多媒体资源。例如,在多媒体资源平台(如短视频平台)中,每天均会有大量用户上传各种各样的视频和视频的标题。若仅对视频进行识别或者仅对视频的标题进行识别,得到视频的名称的准确度较低。因此,如何提高识别多媒体资源的准确率,成为一个亟待解决的问题。
技术实现思路
[0004]本公开提供一种多媒体资源的识别方法、装置、设备及存储介质,能够提高识别多媒体资源的准确率。本公开的技术方案如下:
[0005]根据本公开的第一方面,提 ...
【技术保护点】
【技术特征摘要】
1.一种多媒体资源的识别方法,其特征在于,所述方法包括:获取待识别多媒体资源的多个候选对象和所述待识别多媒体资源的实体信息;基于所述多个候选对象、预设知识图谱和所述待识别多媒体资源的实体信息,从所述多个候选对象中确定目标对象,所述预设知识图谱包括至少一个第一资源的实体知识,所述实体知识包括所述第一资源内的实体信息,所述候选对象属于第二资源对应的对象,所述第二资源为所述至少一个第一资源中的任一资源;将所述目标对象确定为所述待识别多媒体资源所对应的对象。2.根据权利要求1所述的方法,其特征在于,所述基于所述多个候选对象、预设知识图谱和所述待识别多媒体资源的实体信息,从所述多个候选对象中确定目标对象,包括:基于所述多个候选对象、预设知识图谱和所述待识别多媒体资源的实体信息,对所述多个候选对象中每个候选对象进行基于注意力的信息预测,得到预测信息;根据所述每个候选对象的预测信息,确定所述目标对象。3.根据权利要求2所述的方法,其特征在于,所述基于所述多个候选对象、预设知识图谱和所述待识别多媒体资源的实体信息,对所述多个候选对象中每个候选对象进行基于注意力的信息预测,得到所述预测信息,包括:基于所述多个候选对象和所述待识别多媒体资源的实体信息,对所述每个候选对象的进行基于局部注意力的信息提取,得到第一注意力值,所述局部注意力是在全局注意力基础上融合所述预设知识图谱得到的;根据所述每个候选对象的第一注意力值,得到所述每个候选对象的预测信息。4.根据权利要求3所述的方法,其特征在于,所述基于所述多个候选对象、预设知识图谱和所述待识别多媒体资源的实体信息,对所述多个候选对象中每个候选对象进行基于注意力的信息预测,得到所述预测信息,还包括;基于所述多个候选对象和所述待识别多媒体资源的实体信息,对每个候选对象进行基于所述全局注意力的信息提取,得到所述每个候选对象的第二注意力值;所述根据所述每个候选对象的第一注意力值,得到所述每个候选对象的预测信息,包括:基于所述每个候选对象的第一注意力值和所述每个候选对象的第二注意力值进行融合计算,得到所述每个候选对象的预测信息。5.根据权利要求1
‑
4中任一项所述的方法...
【专利技术属性】
技术研发人员:徐也,张琳,徐海峰,陶浒,庄楠,肖阳,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。