多媒体数据的处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:24251603 阅读:21 留言:0更新日期:2020-05-22 23:36
本发明专利技术实施例公开了一种多媒体数据的处理方法、装置、计算机设备和存储介质,该方法包括:确定在至少两个地区中发布的多媒体数据;查询所述多媒体数据的多媒体属性;以发布于同一个地区的多媒体数据作为整体进行对比、以确定每个地区中每项多媒体属性的属性权重;根据所述多媒体属性与所述属性权重计算对所述多媒体数据计算表征质量的质量分数;按照所述质量分数从每个地区中的多媒体数据确定目标多媒体数据。实现质量评价方式的个性化定义,从而自动化筛选优质的多媒体数据,大大减少了运营人员参与多媒体数据筛选的工作量,从而大大降低了筛选优质多媒体数据的成本,提高了筛选优质多媒体数据的效率,适配互联网中海量多媒体数据的筛选工作。

Multimedia data processing methods, devices, computer equipment and storage media

【技术实现步骤摘要】
多媒体数据的处理方法、装置、计算机设备和存储介质
本专利技术实施例涉及多媒体的技术,尤其涉及一种多媒体数据的处理方法、装置、计算机设备和存储介质。
技术介绍
随着互联网的快速发展,互联网上成立了大量的多媒体平台,这些多媒体平台为用户分享多媒体数据提供了便捷的途径。这些多媒体平台再运营期间保存了大量的多媒体数据,并且,用户每天都会上传多媒体数据,使得多媒体数据可能多达百万数据量级别。多媒体平台中的多媒体数据质量不一、且数据量巨大,用户自行根据关键词搜索、订阅等方式筛选,难度较高,为了为用户提供服务,多媒体平台中一般会选择质量较高的一些多媒体数据推送给用户。由于各个地区的民风不一、喜好不一,对于质量的评价方式多种多样,尤其是对于直播视频数据等在不同地区使用不同语言的情况,应用机器学习、深度学习等方式筛选质量较高的多媒体数据难以达到要求。因此,目前多媒体平台多是引入运营人员人工针对不同地区筛选质量较高的多媒体数据,在筛选的过程中,运营人员需要人工干预筛选的导向,但是,运营人员人工筛选的成本较高,效率较低,愈加难以适配互联网中海量多媒体数据的筛选工作。
技术实现思路
本专利技术实施例提供一种多媒体数据的处理方法、装置、计算机设备和存储介质,以解决人工针对不同地区筛选质量较高的多媒体数据要求较高、成本较高、效率较低的问题。第一方面,本专利技术实施例提供了一种多媒体数据的处理方法,包括:确定在至少两个地区中发布的多媒体数据;查询所述多媒体数据的多媒体属性;以发布于同一个地区的多媒体数据作为整体进行对比、以确定每个地区中每项多媒体属性的属性权重;根据所述多媒体属性与所述属性权重计算对所述多媒体数据计算表征质量的质量分数;按照所述质量分数从每个地区中的多媒体数据确定目标多媒体数据。第二方面,本专利技术实施例还提供了一种多媒体数据的处理装置,包括:多媒体数据确定模块,用于确定在至少两个地区中发布的多媒体数据;多媒体属性查询模块,用于查询所述多媒体数据的多媒体属性;属性权重确定模块,用于以发布于同一个地区的多媒体数据作为整体进行对比、以确定每个地区中每项多媒体属性的属性权重;质量分数计算模块,用于根据所述多媒体属性与所述属性权重计算对所述多媒体数据计算表征质量的质量分数;目标多媒体数据确定模块,用于按照所述质量分数从每个地区中的多媒体数据确定目标多媒体数据。第三方面,本专利技术实施例还提供了一种计算机设备,所述计算机设备包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的多媒体数据的处理方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所述的多媒体数据的处理方法。在本实施例中,确定在至少两个地区中发布的多媒体数据,查询多媒体数据的多媒体属性,以发布于同一个地区的多媒体数据作为整体进行对比、以确定每个地区中每项多媒体属性的属性权重,根据多媒体属性与属性权重计算对多媒体数据计算表征质量的质量分数,按照质量分数从每个地区中的多媒体数据确定目标多媒体数据,通过统一的方式对不同的地区设置与该地区适配的属性权重,实现质量评价方式的个性化定义,从而自动化筛选优质的多媒体数据,大大减少了运营人员参与多媒体数据筛选的工作量,从而大大降低了筛选优质多媒体数据的成本,提高了筛选优质多媒体数据的效率,适配互联网中海量多媒体数据的筛选工作。附图说明图1为本专利技术实施例一提供的一种多媒体数据的处理方法的流程图;图2是本专利技术实施例二提供的一种多媒体数据的处理方法的流程图;图3为本专利技术实施例三提供的一种多媒体数据的处理装置的结构示意图;图4为本专利技术实施例四提供的一种计算机设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种多媒体数据的处理方法的流程图,本实施例可适用于确定不同地区多媒体数据中多媒体属性的属性权重,从而计算不同地区中多媒体数据的质量分数,以进行筛选的情况,该方法可以由多媒体数据的处理装置来执行,该多媒体数据的处理装置可以由软件和/或硬件实现,可配置在计算机设备中,例如,服务器、工作站、个人电脑,等等,该方法具体包括如下步骤:S101、确定在至少两个地区中发布的多媒体数据。在本实施例中,多媒体平台跨地区进行运行,接收用户在不同地区上传的多媒体数据。其中,在同一个地区中,用户接受相同或相似的文化,用户之间的兴趣、行为较为相似,对质量的评价较为统一,因此,可按照发布的地区区分不同的多媒体数据。例如,地区可以指国家,例如,中国、泰国、越南、加拿大,等等,当然,为了提高筛选多媒体数据的精确度,地区也可以指细颗粒度的省份、地级市,等等,本实施例对此不加以限制。此外,多媒体数据的类型包括视频数据、音频数据、演示文稿等,形式包括直播节目、短视频、电视剧、电影、电子书、歌曲,等等。以直播节目为例,直播节目的格式多为流式数据,如MP4(MovingPictureExpertsGroup4,动态图像专家组第四版)、FLV(FlashVideo,流媒体格式)等等。用户在客户端登录,采集视频数据、音频数据,编码之后通过RTSP(RealTimeStreamingProtocol,实时流传送协议)、RTMP(RealTimeMessagingProtocol,实时消息传送协议)、HLS(HTTPLiveStreaming,基于HTTP(HyperTextTransportProtocol,超文本传输协议)的流媒体传输协议)等协议传输至计算机设备,计算机设备在直播节目完成时,存储该直播节目。S102、查询所述多媒体数据的多媒体属性。多媒体数据在生成、存储时,会记录其属性,作为多媒体属性。在具体实现中,该多媒体属性可以为多媒体数据本身具有的属性,如标题,作者(对于直播节目,作者为主播用户),长度等,该多媒体属性也可以为用户与多媒体数据之间的交互所产生的属性,如用户所表达的正向情感(如点赞、支持)、负向情感(如扔鸡蛋),评论,弹幕,播放量,观看时长(标准统计的时长/多媒体数据的长度,标准统计的时长通过用户观看多媒体数据的时间明细,在hive表通过ETL(Extract-Transform-Load,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程)统计的,通常以多个用户的观看时长的平均值表示),转发量,等等。S103、以发布于同本文档来自技高网...

【技术保护点】
1.一种多媒体数据的处理方法,其特征在于,包括:/n确定在至少两个地区中发布的多媒体数据;/n查询所述多媒体数据的多媒体属性;/n以发布于同一个地区的多媒体数据作为整体进行对比、以确定每个地区中每项多媒体属性的属性权重;/n根据所述多媒体属性与所述属性权重计算对所述多媒体数据计算表征质量的质量分数;/n按照所述质量分数从每个地区中的多媒体数据确定目标多媒体数据。/n

【技术特征摘要】
1.一种多媒体数据的处理方法,其特征在于,包括:
确定在至少两个地区中发布的多媒体数据;
查询所述多媒体数据的多媒体属性;
以发布于同一个地区的多媒体数据作为整体进行对比、以确定每个地区中每项多媒体属性的属性权重;
根据所述多媒体属性与所述属性权重计算对所述多媒体数据计算表征质量的质量分数;
按照所述质量分数从每个地区中的多媒体数据确定目标多媒体数据。


2.根据权利要求1所述的方法,其特征在于,所述以发布于同一个地区的多媒体数据作为整体进行对比、以确定每个地区中每项多媒体属性的属性权重,包括:
生成第一矩阵,所述第一矩阵包括每个地区表征每项多媒体属性的属性向量;
生成第二矩阵,所述第二矩阵包括每两个地区之间在所有多媒体属性上的相似度;
将所述第二矩阵乘以所述第一矩阵,获得每个地区中每项多媒体属性的属性权重。


3.根据权利要求2所述的方法,其特征在于,所述生成第一矩阵,包括:
针对每个地区,确定所述地区中每项多媒体属性的属性占比;
针对每个地区,将所述属性占比乘以所述多媒体属性对应的个体权重,获得属性向量;
将至少两个所述地区的属性向量组成第一矩阵。


4.根据权利要求2或3所述的方法,其特征在于,所述生成第二矩阵,包括:
针对每两个地区,计算所述属性向量之间的相似度;
将至少两个所述地区的相似度组成第二矩阵。


5.根据权利要求1或2或3所述的方法,其特征在于,所述根据所述多媒体属性与所述属性权重计算对所述多媒体数据计算表征质量的质量分数,包括:
对所述多媒体属性转换为属性系数;
使用所述属性系数与所述属性权重对所述多媒体数据计算原始分数,所述原始分数与所述属性系数、所述属性权重均正相关;
对所述原始分数进行衰减,获得候选分数;
在所述候选分数的基础上加上预设的基础分数,作为所述多媒体数据表征质量的质量分数。


6.根据权利要求5所述的方法,其特征在于,所述多媒体属性包括如下的至少一种:
标题、正向情感、作者、播放量、观看时长、长度;
所述对所述多媒体属性转换为属性系数,包括:
对所述标题赋予第一系数、对所述正向情感赋予第二系数、对所述作者赋予第三系数、对所述长度赋予第四系数,作为属性系数;
对所述播放量进行离差标准化,获得第一标准值,作为属性系数;
对所述观看时长进行离差标准化,获得第二标准值,作为属性系数;
所述使用所述属性系数与所述属性权重对所述多媒体数据计算原始分数,...

【专利技术属性】
技术研发人员:赵明露黄郁财
申请(专利权)人:广州虎牙科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1