多媒体文件的识别方法、装置、终端及存储介质制造方法及图纸

技术编号:17779975 阅读:20 留言:0更新日期:2018-04-22 08:37
本申请公开了一种多媒体文件的识别方法、装置、终端及存储介质,属于终端技术领域。所述方法包括:获取目标对象的运动数据和多媒体文件的节拍数据,根据运动数据和节拍数据,采用分数预测模型得到多媒体文件的评定分数,当评定分数大于预定阈值时,将多媒体文件识别为目标文件。本申请通过目标对象的运动数据和节拍数据的相似程度得到评定分数,使得终端能够基于该评定分数,自动识别出该多媒体文件是否为符合用户兴趣偏好的目标文件,避免了繁琐的手动操作,提高了对多媒体文件的识别效率。

【技术实现步骤摘要】
多媒体文件的识别方法、装置、终端及存储介质
本申请实施例涉及终端
,特别涉及一种多媒体文件的识别方法、装置、终端及存储介质。
技术介绍
多媒体文件包括视频文件和/或音频文件。随着终端技术的不断发展,用户通常会通过终端来播放多媒体文件。相关技术中,终端对多媒体文件的识别方法包括:当用户对播放的多媒体文件比较感兴趣时,终端会接收与该多媒体文件对应的设置操作,根据该设置操作将该多媒体文件识别为该用户所喜爱的文件。其中,设置操作包括对该多媒体文件的评分进行喜爱标记的操作。
技术实现思路
本申请实施例提供了一种多媒体文件的识别方法、装置、终端及存储介质,可以用于解决多媒体文件的识别效率较低的问题。所述技术方案如下:根据本申请实施例的第一方面,提供了一种多媒体文件的识别方法,所述方法包括:获取目标对象的运动数据和多媒体文件的节拍数据,所述运动数据是在播放所述多媒体文件的过程中采集到的运动数据;根据所述运动数据和所述节拍数据,采用分数预测模型得到所述多媒体文件的评定分数,所述分数预测模型用于表示基于历史运动数据和历史节拍数据训练得到的相似程度;当所述评定分数大于预定阈值时,将所述多媒体文件识别为目标文件,所述目标文件为符合所述目标对象的兴趣偏好的文件。根据本申请实施例的第二方面,提供了一种多媒体文件的识别装置,所述装置包括:获取模块,用于获取目标对象的运动数据和多媒体文件的节拍数据,所述运动数据是在播放所述多媒体文件的过程中采集到的运动数据;评分模块,用于根据所述运动数据和所述节拍数据,采用分数预测模型得到所述多媒体文件的评定分数,所述分数预测模型用于表示基于历史运动数据和历史节拍数据训练得到的相似程度;识别模块,用于当所述评定分数大于预定阈值时,将所述多媒体文件识别为目标文件,所述目标文件为符合所述目标对象的兴趣偏好的文件。根据本申请实施例的第三方面,提供了一种终端,所述终端包括处理器、与所述处理器相连的存储器,以及存储在所述存储器上的程序指令,所述处理器执行所述程序指令时实现如本申请第一方面及其可选实施例任一所述的多媒体文件的识别方法。根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其上存储有程序指令,所述程序指令被处理器执行时实现如本申请第一方面及其可选实施例任一所述的多媒体文件的识别方法。本申请实施例提供的技术方案带来的有益效果是:通过获取目标对象的运动数据和多媒体文件的节拍数据,根据运动数据和节拍数据,采用分数预测模型得到多媒体文件的评定分数,当评定分数大于预定阈值时,将多媒体文件识别为目标文件;使得能够通过目标对象的运动数据和节拍数据的相似程度得到评定分数,进而使得终端能够基于该评定分数,自动识别出该多媒体文件是否为符合用户兴趣偏好的目标文件,避免了繁琐的手动操作,提高了对多媒体文件的识别效率。附图说明图1是本申请一个示例性实施例提供的终端的结构示意图;图2是本申请一个实施例提供的文件识别系统的结构示意图;图3是本申请一个实施例提供的多媒体文件的识别方法的流程图;图4是本申请一个实施例提供的多媒体文件的识别方法涉及的模型训练方法的流程图;图5是本申请一个实施例提供的多媒体文件的识别方法涉及的原理示意图;图6是本申请另一个实施例提供的多媒体文件的识别方法的流程图;图7是本申请另一个实施例提供的多媒体文件的识别方法的流程图;图8是本申请另一个实施例提供的多媒体文件的识别方法涉及的原理示意图;图9是本申请一个实施例提供的多媒体文件的识别装置的结构示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。首先,对本申请涉及到的名词进行介绍。分数预测模型:是一种用于根据输入的数据确定多媒体文件的评定分数的数学模型。可选地,第一分数预测模型包括但不限于:深度神经网络(DeepNeuralNetwork,DNN)模型、循环神经网络(RecurrentNeuralNetworks,RNN)模型、嵌入(embedding)模型、梯度提升决策树(GradientBoostingDecisionTree,GBDT)模型、逻辑回归(LogisticRegression,LR)模型中的至少一种。DNN模型是一种深度学习框架。DNN模型包括输入层、至少一层隐层(或称,中间层)和输出层。可选地,输入层、至少一层隐层(或称,中间层)和输出层均包括至少一个神经元,神经元用于对接收到的数据进行处理。可选地,不同层之间的神经元的数量可以相同;或者,也可以不同。RNN模型是一种具有反馈结构的神经网络。在RNN模型中,神经元的输出可以在下一个时间戳直接作用到自身,即,第i层神经元在m时刻的输入,除了(i-1)层神经元在该时刻的输出外,还包括其自身在(m-1)时刻的输出。embedding模型是基于实体和关系分布式向量表示,将每个三元组实例中的关系看作从实体头到实体尾的翻译。其中,三元组实例包括主体、关系、客体,三元组实例可以表示成(主体,关系,客体);主体为实体头,客体为实体尾。比如:小张的爸爸是大张,则通过三元组实例表示为(小张,爸爸,大张)。GBDT模型是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结果累加起来作为最终结果。决策树的每个节点都会得到一个预测值,以年龄为例,预测值为属于年龄对应的节点的所有人年龄的平均值。LR模型是指在线性回归的基础上,套用一个逻辑函数建立的模型。相关技术中,在多媒体文件的播放过程中,当用户对播放的多媒体文件比较感兴趣时,会手动对该多媒体文件设置较高的评分或者将该多媒体文件进行标记,对应的,终端会接收与该多媒体文件对应的设置操作,根据该设置操作将该多媒体文件识别为该用户所喜爱的文件。但是,在上述方法中,终端识别该多媒体文件是否为用户所喜爱的文件依赖于用户手动的设置操作,操作复杂,也降低了对多媒体文件的识别效率。为此,本申请提供了一种多媒体文件的识别方法、装置、终端及存储介质,以解决上述相关技术中存在的问题。本申请提供的技术方案中,通过基于目标对象的运动数据和节拍数据的相似程度,得到多媒体文件的评定分数,当评定分数大于预定阈值时将多媒体文件识别为符合用户兴趣偏好的目标文件,避免了繁琐的手动操作,提高了对多媒体文件的识别效率。下面采用示意性的实施例进行说明。在对本申请实施例进行解释说明之前,先对本申请实施例的应用场景进行说明。图1示出了本申请一个示例性实施例所提供的终端100的结构示意图。终端100也称为便携式终端100,该终端100可以是手机、MP3播放器(MovingPictureExpertsGroupAudioLayerIII,动态影像专家压缩标准音频层面3)、MP4(MovingPictureExpertsGroupAudioLayerIV,动态影像专家压缩标准音频层面4)播放器等设备。可选的,终端100中内置有运动传感器,该运动传感器用于采集目标对象的运动数据。运动数据包括目标对象的速度、加速度、角速度、运动方向、运动频率中的至少一种。终端100中存储有第一分数预测模型,该第一分数预测模型用于表示基于历史运动数据和历史节拍数据训练得到的相似程度。可选的,该终端100是安装有多媒体应用程序的终端。该多媒体应用程序是具本文档来自技高网...
多媒体文件的识别方法、装置、终端及存储介质

【技术保护点】
一种多媒体文件的识别方法,其特征在于,所述方法包括:获取目标对象的运动数据和多媒体文件的节拍数据,所述运动数据是在播放所述多媒体文件的过程中采集到的运动数据;根据所述运动数据和所述节拍数据,采用分数预测模型得到所述多媒体文件的评定分数,所述分数预测模型用于表示基于历史运动数据和历史节拍数据训练得到的相似程度;当所述评定分数大于预定阈值时,将所述多媒体文件识别为目标文件,所述目标文件为符合所述目标对象的兴趣偏好的文件。

【技术特征摘要】
1.一种多媒体文件的识别方法,其特征在于,所述方法包括:获取目标对象的运动数据和多媒体文件的节拍数据,所述运动数据是在播放所述多媒体文件的过程中采集到的运动数据;根据所述运动数据和所述节拍数据,采用分数预测模型得到所述多媒体文件的评定分数,所述分数预测模型用于表示基于历史运动数据和历史节拍数据训练得到的相似程度;当所述评定分数大于预定阈值时,将所述多媒体文件识别为目标文件,所述目标文件为符合所述目标对象的兴趣偏好的文件。2.根据权利要求1所述的方法,其特征在于,所述根据所述运动数据和所述节拍数据,采用分数预测模型得到所述多媒体文件的评定分数,包括:从所述运动数据中提取运动特征,并从所述节拍数据中提取节拍特征;获取第一分数预测模型;将所述运动特征和所述节拍特征输入至所述第一分数预测模型,得到所述多媒体文件的评定分数;其中,所述第一分数预测模型是根据至少一组历史数据组训练得到的,每组所述历史数据组包括:历史运动数据、历史节拍数据和历史相似度分数,所述历史相似度分数为预先计算的用于表示所述历史运动数据和所述历史节拍数据之间的相似程度的分数。3.根据权利要求1所述的方法,其特征在于,所述获取第一分数预测模型,包括:获取训练样本集,所述训练样本集包括至少一组历史数据组,每组所述历史数据组包括:历史运动数据、历史节拍数据和历史相似度分数,所述历史相似度分数为预先计算的用于表示所述历史运动数据和所述历史节拍数据之间的相似程度的分数;根据所述至少一组历史数据组,采用误差反向传播算法对原始参数模型进行训练,得到所述第一分数预测模型。4.根据权利要求3所述的方法,其特征在于,所述根据所述至少一组历史数据组,采用误差反向传播算法对原始参数模型进行训练,得到所述第一分数预测模型,包括:对于所述至少一组历史数据组中的每组历史数据组,从所述历史运动数据中提取所述历史运动特征,并从所述历史节拍数据中提取所述历史节拍特征;将所述历史运动特征和所述历史节拍特征输入所述原始参数模型,得到训练结果;将所述训练结果与所述历史相似度分数进行比较,得到计算损失,所述计算损失用于指示所述训练结果与所述历史相似度分数之间的误差;根据所述至少一组历史数据组各自对应的计算损失,采用所述误差反向传播算法训练得到所述第一分数预测模型。5.根据权利要求1所述的方法,其特征在于,所述方法,还包括:将所述运动数据、所述节拍数据和所述评定分数添加至所述训练样本集,得到更新后的训练样本集;根据所述更新后的训练样本集对所述第一分数预测模型进行训练,得到更新后的第一分数预测模型。6.根据权利要求1所述的方...

【专利技术属性】
技术研发人员:陈岩刘耀勇
申请(专利权)人:广东欧珀移动通信有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1