【技术实现步骤摘要】
多媒体资源的处理方法、装置、电子设备及存储介质
本公开涉及计算机
,尤其涉及一种多媒体资源的处理方法、装置、电子设备及存储介质。
技术介绍
随着机器学习领域的发展,深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。卷积神经网络(ConvolutionalNeuralNetworks,CNN)作为深度学习的一个重要分支,由于其超强的拟合能力以及端到端的全局优化能力,在应用卷积神经网络之后图像分类模型对视频文件的预测精度得到大幅提升。相关技术中,通过图像分类模型、自然语言处理算法、语音识别算法等对视频文件进行感知,可以得到视频文件在这些信息域上的文本数据。利用这些信息域上的文本数据可以生成视频文件的视频标签。然而,在实际业务场景中,比如在视频搜索时,通过传统技术中的视频标签搜索得到的视频文件与用户期望之间的匹配度并不高。
技术实现思路
本公开提供一种多媒体资源的处理方法、装置、电子设备及存储介质,以至少解决相关技术中通过视频标签搜索得到的视频文件与用户期望之间的 ...
【技术保护点】
1.一种多媒体资源的处理方法,其特征在于,包括:/n获取多媒体资源对应的词组合,所述词组合包括若干个词语;/n获取各所述词语的预测概率和各所述词语的信息域特征;其中,所述预测概率为对所述多媒体资源进行识别得到各所述词语的概率,所述信息域特征用于表征词语的来源途径;/n针对每个所述词语,将对应的所述预测概率和对应的所述信息域特征进行合并,得到各所述词语的融合特征;/n根据所述各所述词语的融合特征,对各所述词语的词权重进行预估,并按照预估的词权重大小对各所述词语进行排序,得到排序后的词组合。/n
【技术特征摘要】
1.一种多媒体资源的处理方法,其特征在于,包括:
获取多媒体资源对应的词组合,所述词组合包括若干个词语;
获取各所述词语的预测概率和各所述词语的信息域特征;其中,所述预测概率为对所述多媒体资源进行识别得到各所述词语的概率,所述信息域特征用于表征词语的来源途径;
针对每个所述词语,将对应的所述预测概率和对应的所述信息域特征进行合并,得到各所述词语的融合特征;
根据所述各所述词语的融合特征,对各所述词语的词权重进行预估,并按照预估的词权重大小对各所述词语进行排序,得到排序后的词组合。
2.根据权利要求1所述的多媒体资源的处理方法,其特征在于,所述多媒体资源对应的词组合的生成方式,包括:
获取所述多媒体资源对应的文本信息,所述文本信息的格式包括文档格式和标签格式;
对文档格式的文本信息进行分词处理,得到所述文档格式的文本信息对应的词语;
根据所述文档格式的文本信息对应的词语和标签格式的文本信息,生成所述多媒体资源对应的词组合。
3.根据权利要求2所述的多媒体资源的处理方法,其特征在于,所述根据所述文档格式的文本信息对应的词组合和标签格式的文本信息,生成所述多媒体资源对应的词组合,包括:
对所述文档格式的文本信息对应的词语和所述标签格式的文本信息进行融合和去重处理,得到所述多媒体资源对应的词组合。
4.根据权利要求1所述的多媒体资源的处理方法,其特征在于,所述获取各所述词语的预测概率和各所述词语的信息域特征,包括:
对各所述多媒体资源进行词语识别,得到从所述多媒体资源中识别出各所述词语的预测概率;
对各所述词语的来源途径对应的信息域进行数值表示,得到各所述词语的信息域特征。
5.根据权利要求1至4任一项所述的多媒体资源的处理方法,其特征在于,所述根据所述各所述词语的融合特征,对各所述词语的词权重进行预估,并按照预估的词权重大小对各所述词语进行排序,得到排序后的词组合,包括:
将各所述词语的融合特征输入至排序学习模型,通过所述排序学习模型对各所述词语的融合特征进行分数预估,并按照预估的分数对各所述词语进行排序,得到所述排序后的词组合,其中,所述预估的分数用于表征所述词权重大小。
6.根据权利要求5所述的多媒体资源的处理方法,其特征在于...
【专利技术属性】
技术研发人员:张志伟,杨帆,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。