一种多媒体数据审核方法、装置、设备及存储介质制造方法及图纸

技术编号:20944418 阅读:25 留言:0更新日期:2019-04-24 02:22
本发明专利技术公开了一种多媒体数据审核方法、装置、设备及存储介质。该方法包括:获取待审核的多媒体数据;根据多媒体数据的数据类型从多媒体数据中提取内容特征信息;将内容特征信息输入至与内容特征信息对应的内容分类模型中,得到多媒体数据归属内容类别的类别概率;根据类别概率确定多媒体数据归属的内容类别。本发明专利技术实施例提高了多媒体数据的审核效率和准确率。

A Multimedia Data Auditing Method, Device, Equipment and Storage Media

The invention discloses a multimedia data auditing method, device, equipment and storage medium. The method includes: acquiring multimedia data to be audited; extracting content feature information from multimedia data according to the data type of multimedia data; inputting content feature information into content classification model corresponding to content feature information, obtaining the classification probability of multimedia data belonging to content category; and determining the content category of multimedia data belonging to content category according to category probability. The embodiment of the present invention improves the auditing efficiency and accuracy of multimedia data.

【技术实现步骤摘要】
一种多媒体数据审核方法、装置、设备及存储介质
本专利技术实施例涉及多媒体技术,尤其涉及一种多媒体数据审核方法、装置、设备及存储介质。
技术介绍
随着网络技术的不断发展,网络的功能越来越强大。人们可以通过网络将自己拍摄的视频或图片,以及录制的音频等多媒体数据上传至网络平台,供网络平台的其他用户观看。由于用户上传的视频、图片或音频等多媒体数据的质量参差不齐,有的多媒体数据不但会影响其他用户的身心健康,还可能违反法律。因此,就需要对用户上传的视频、图片或音频等多媒体数据进行审核。现有技术中,一般都是通过后台工作人员(一般是专职的审核人员)对用户上传的多媒体数据进行审核。专利技术人在实现本专利技术的过程中,发现现有技术存在如下缺陷:通过专职审核人员对用户上传的多媒体数据进行审核不但审核速度慢、效率低,而且审核准确率也不高。
技术实现思路
本专利技术实施例提供一种多媒体数据审核方法、装置、设备及存储介质,以提高多媒体数据的审核效率和准确率。第一方面,本专利技术实施例提供了一种多媒体数据审核方法,该方法包括:获取待审核的多媒体数据;根据所述多媒体数据的数据类别从所述多媒体数据中提取内容特征信息;将所述内容特征信息输入至与所述内容特征信息对应的内容分类模型中,得到所述多媒体数据归属内容类别的类别概率;根据所述类别概率确定所述多媒体数据归属的内容类别。进一步的,所述根据所述类别概率确定所述多媒体数据归属的内容类别,包括:查询对所述多媒体数据设置的审核任务,所述审核任务包括根据审核参数所确定的待审核的内容类别和所述内容类别对应的分类概率阈值;针对所述内容类别,若所述类别概率大于所述分类概率阈值,则确定所述多媒体数据归属的内容类别;其中,所述审核参数包括如下至少一项:审核时段、审核地区和审核级别。进一步的,所述审核任务还包括根据所述审核参数所确定的待审核的所述内容类别对应的置信概率阈值,所述置信概率阈值大于所述分类概率阈值;所述针对所述内容类别,若所述类别概率大于所述分类概率阈值,则确定所述多媒体数据归属的内容类别之后,还包括:针对所述内容类别,若所述类别概率小于等于所述置信概率阈值,则对所述多媒体数据归属的内容类别进行复核处理,获得所述多媒体收据归属的内容类别;将所述复核处理对应的内容类别替换前一内容类别,作为所述多媒体数据归属的内容类别。进一步的,所述针对所述内容类别,若所述内容类别的概率大于所述分类概率阈值,则确定所述多媒体数据归属的内容类别之后,还包括:针对所述内容类别,若所述类别概率大于所述置信概率阈值,则将前一内容类别作为所述多媒体数据归属的内容类别。进一步的,该方法还包括:根据所述内容特征信息和所述复核处理对应的内容类别对所述内容分类模型进行修正。进一步的,通过如下方式训练所述内容分类模型:获取多媒体数据样本和所述多媒体数据样本归属的内容类别;根据所述多媒体数据样本的数据类型从所述多媒体数据样本中提取内容特征信息样本;将所述内容特征信息样本作为输入变量,所述多媒体数据样本归属的内容类别作为输出变量,训练神经网络模型,得到所述内容分类模型。进一步的,所述根据所述多媒体数据的数据类型从所述多媒体数据中提取内容特征信息,包括:若所述多媒体数据的数据类型为视频数据,则从所述多媒体数据中提取人脸特征信息、色彩信息、音频信息和文本信息,作为所述多媒体数据的内容特征信息;若所述多媒体数据的数据类型为图像数据,则从所述多媒体数据中提取人脸特征信息、色彩信息和文本信息,作为所述多媒体数据的内容特征信息;若所述多媒体数据的数据类型为音频数据,则从所述多媒体数据中提取音频信息,作为所述多媒体数据的内容特征信息;若所述多媒体数据的数据类型为文本数据,则从所述多媒体数据中提取文本信息,作为所述多媒体数据的内容特征信息。第二方面,本专利技术实施例还提供了一种多媒体数据审核装置,该装置包括:多媒体数据获取模块,用于获取待审核的多媒体数据;内容特征信息获取模块,用于根据所述多媒体数据的数据类型从所述多媒体数据中提取内容特征信息;类别概率获取模块,用于将所述内容特征信息输入至与所述内容特征信息对应的内容分类模型中,得到所述多媒体数据归属内容类别的类别概率;内容类别确定模块,用于根据所述类别概率确定所述多媒体数据归属的内容类别。进一步的,所述内容类别确定模块,包括:审核任务查询子模块,用于查询对所述多媒体数据设置的审核任务,所述审核任务包括根据审核参数所确定的待审核的内容类别和所述内容类别对应的分类概率阈值;第一内容类别确定子模块,用于针对所述内容类别,若所述类别概率大于所述分类概率阈值,则确定所述多媒体数据归属的内容类别;其中,所述审核参数包括如下至少一项:审核时段、审核地区和审核级别。进一步的,所述审核任务还包括根据所述审核参数所确定的待审核的所述内容类别对应的置信概率阈值,所述置信概率阈值大于所述分类概率阈值;所述内容类别确定模块,还包括:第二内容类别确定子模块,用于针对所述内容类别,若所述类别概率小于等于所述置信概率阈值,则对所述多媒体数据归属的内容类别进行复核处理,获得所述多媒体数据归属的内容类别;第三内容类别确定子模块,用于将所述复核处理对应的内容类别替换前一内容类别,作为所述多媒体数据归属的内容类别。进一步的,所述内容类别确定模块,还包括:第四内容类别确定子模块,用于针对所述内容类别,若所述类别概率大于所述置信概率阈值,则将前一内容类别作为所述多媒体数据归属的内容类别。进一步的,该装置还包括:修正模块,用于根据所述内容特征信息和所述复核处理对应的内容类别对所述内容分类模型进行修正。进一步的,通过如下方式训练所述内容分类模型:获取多媒体数据样本和所述多媒体数据样本归属的内容类别;根据所述多媒体数据样本的数据类型从所述多媒体数据样本中提取内容特征信息样本;将所述内容特征信息样本作为输入变量,所述多媒体数据样本归属的内容类别作为输出变量,训练神经网络模型,得到所述内容分类模型。进一步的,所述内容特征信息获取模块,具体用于:若所述多媒体数据的数据类型为视频数据,则从所述多媒体数据中提取人脸特征信息、色彩信息、音频信息和文本信息,作为所述多媒体数据的内容特征信息;若所述多媒体数据的数据类型为图像数据,则从所述多媒体数据中提取人脸特征信息、色彩信息和文本信息,作为所述多媒体数据的内容特征信息;若所述多媒体数据的数据类型为音频数据,则从所述多媒体数据中提取音频信息,作为所述多媒体数据的内容特征信息;若所述多媒体数据的数据类型为文本数据,则从所述多媒体数据中提取文本信息,作为所述多媒体数据的内容特征信息。第三方面,本专利技术实施例还提供了一种设备,该设备包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术实施例第一方面所述的方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例第一方面所述的方法。本专利技术实施例通过获取待审核的多媒体数据,根据多媒体数据的数据类型从多媒体数据中提取内容特征信息,将内容特征信息输入至与内容特征信息对应的内容分类模型中,得到多媒体数据归属内容类别的类别概率,根据类别概率确定多媒体数据归本文档来自技高网...

【技术保护点】
1.一种多媒体数据审核方法,其特征在于,包括:获取待审核的多媒体数据;根据所述多媒体数据的数据类型从所述多媒体数据中提取内容特征信息;将所述内容特征信息输入至与所述内容特征信息对应的内容分类模型中,得到所述多媒体数据归属内容类别的类别概率;根据所述类别概率确定所述多媒体数据归属的内容类别。

【技术特征摘要】
1.一种多媒体数据审核方法,其特征在于,包括:获取待审核的多媒体数据;根据所述多媒体数据的数据类型从所述多媒体数据中提取内容特征信息;将所述内容特征信息输入至与所述内容特征信息对应的内容分类模型中,得到所述多媒体数据归属内容类别的类别概率;根据所述类别概率确定所述多媒体数据归属的内容类别。2.根据权利要求1所述的方法,其特征在于,所述根据所述类别概率确定所述多媒体数据归属的内容类别,包括:查询对所述多媒体数据设置的审核任务,所述审核任务包括根据审核参数所确定的待审核的内容类别和所述内容类别对应的分类概率阈值;针对所述内容类别,若所述类别概率大于所述分类概率阈值,则确定所述多媒体数据归属的内容类别;其中,所述审核参数包括如下至少一项:审核时段、审核地区和审核级别。3.根据权利要求2所述的方法,其特征在于,所述审核任务还包括根据所述审核参数所确定的待审核的所述内容类别对应的置信概率阈值,所述置信概率阈值大于所述分类概率阈值;所述针对所述内容类别,若所述内容类别的概率大于所述分类概率阈值,则确定所述多媒体数据归属的内容类别之后,还包括:针对所述内容类别,若所述类别概率小于等于所述置信概率阈值,则对所述多媒体数据归属的内容类别进行复核处理,获得所述多媒体数据归属的内容类别;将所述复核处理对应的内容类别替换前一内容类别,作为所述多媒体数据归属的内容类别。4.根据权利要求3所述的方法,其特征在于,所述针对所述内容类别,若所述内容类别的概率大于所述分类概率阈值,则确定所述多媒体数据归属的内容类别之后,还包括:针对所述内容类别,若所述类别概率大于所述置信概率阈值,则将前一内容类别作为所述多媒体数据归属的内容类别。5.根据权利要求3所述的方法,其特征在于,还包括:根据所述内容特征信息和所述复核处理对应的内容类别对所述内容分类模型进行修正。6.根据权利要求1所述的方法,其特征在于...

【专利技术属性】
技术研发人员:潘跃刘振强梁柱锦
申请(专利权)人:广州市百果园信息技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1