【技术实现步骤摘要】
多媒体资源分类方法、装置、电子设备和存储介质
[0001]本专利技术涉及数据处理
,尤其涉及一种多媒体资源分类方法、装置、电子设备和存储介质。
技术介绍
[0002]随着计算机技术的发展,可以通过计算机设备对多媒体资源进行分类,确定多媒体资源的类型,并根据该多媒体资源的类型为用户提供多媒体服务,例如:通过分类,用户可以快速查找到感兴趣的类型的多媒体资源,或者为用户推荐某种类型的多媒体资源,或者筛除不符合规定的多媒体资源。
[0003]目前,多通过将多媒体资源输入至图像识别模型,由图像识别模型对多媒体资源中的图像进行识别,得到多媒体资源的类别。然而,该方法仅适用于由单一图像格式数据构成的多媒体资源,对于由多个不同格式数据构成的多媒体资源的分类精度较低。
技术实现思路
[0004]本专利技术提供一种多媒体资源分类方法、装置、电子设备和存储介质,用以解决现有技术中多媒体资源分类精度较低的缺陷。
[0005]本专利技术提供一种多媒体资源分类方法,包括:
[0006]确定待分类的多媒体资源 ...
【技术保护点】
【技术特征摘要】
1.一种多媒体资源分类方法,其特征在于,包括:确定待分类的多媒体资源中的图像,以及所述多媒体资源中的展示文本和/或语音文本;所述语音文本是对所述多媒体资源中的音频进行语音识别后得到的;基于所述图像,以及所述展示文本和/或所述语音文本,得到所述多媒体资源的分类结果。2.根据权利要求1所述的多媒体资源分类方法,其特征在于,所述基于所述图像,以及所述展示文本和/或所述语音文本,得到所述多媒体资源的分类结果,包括:对所述图像进行图像特征提取,得到图像特征;对所述展示文本和/或所述语音文本进行文本特征提取,得到展示文本特征和/或语音文本特征;对所述图像特征,以及所述展示文本特征和/或所述语音文本特征进行融合,得到融合特征,并基于所述融合特征确定所述多媒体资源的分类结果。3.根据权利要求2所述的多媒体资源分类方法,其特征在于,所述对所述图像进行图像特征提取,得到图像特征,包括:对字节流格式的图像进行解码,得到解码图像;对所述解码图像进行图像特征提取,得到所述图像特征。4.根据权利要求1至3任一项所述的多媒体资源分类方法,其特征在于,所述基于所述图像,以及所述展示文本和/或所述语音文本,得到所述多媒体资源的分类结果,包括:将所述图像,以及所述展示文本和/或所述语音文本输入至多媒体资源分类模型,得到所述多媒体资源分类模型输出的所述多媒体资源的分类结果;其中,所述多媒体资源分类模型是基于样本多媒体资源及其对应的样本多媒体资源分类标签训练得到的;所述样本多媒体资源包括样本图像,以及样本展示文本和/或样本语音文本。5.根据权利要求4所述的多媒体资源分类方法,其特征在于,所述基于所述图像,以及所述展示文本和/或所述语音文本,得到所述多媒体资源的分类结果,之后还包括:确定所述多媒体资源的分类结果中属于各类别的概率;获取最高概率与次高概率之间的差值,并...
【专利技术属性】
技术研发人员:储昭斌,张龙,仉乾隆,吕昕,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。