当前位置: 首页 > 专利查询>汪浩专利>正文

一种视频热度预测方法、装置、设备及存储介质制造方法及图纸

技术编号:20681073 阅读:44 留言:0更新日期:2019-03-27 18:55
本发明专利技术公开了一种视频热度预测方法、装置、设备及计算机可读存储介质,其方法包括:根据待预测视频的类型,从待预测视频的视频数据中提取对应的特征指标的特征数据,以构造第一特征矩阵;对所述第一特征矩阵进行预处理,以生成第二特征矩阵;根据所述待预测视频的类型,选择预先建立的对应的视频热度预测模型;根据所述第二特征矩阵以及选择的视频热度预测模型,获取所述待预测视频的播放量预测指数。本发明专利技术基于待预测视频的类型选择对应的视频热度预测模型,有利于提供更为精确的预测结果,满足用户需求。

【技术实现步骤摘要】
一种视频热度预测方法、装置、设备及存储介质
本专利技术涉及互联网
,尤其涉及一种视频热度预测方法、装置、设备及计算机可读存储介质。
技术介绍
视频播放量预测在互联网数据挖掘领域中有着重要的作用,对于广告主而言,点播量高的视频(尤其是电影和电视剧)能够提高广告的播放量,从而带来一系列的经济效应,因此提前预测出视频的播放量,对于广告主决定广告投放份量有着直接的联系。目前,对视频类资源播放量的预测一般都采用基于历史播放数据预测方法,大规模的统计数据显示,在早期拥有较高热度的视频,在未来较长的一段时间内往往也会拥有相对较高的热度。这种现象被现有研究称为热度的“滚雪球”效应,其产生原因是在在线视频服务发展的早期,用户在观看一个在线视频之前,很难获知该视频内容的相关信息及视频质量的评价。因此,视频的历史播放量往往是用户决定是否观看该视频最重要的依据。然而,在实现本专利技术的过程中,专利技术人发现:随着在线视频服务和社交网络相关技术的发展,用户之间的信息交流也随之不断扩大。用户在观看一个视频前,可以从多样化的渠道了解该视频内容的相关信息以及对于视频质量的评价和反馈。这一变化使得视频未来的热度不再仅由其历史收视行为数量所支配,更多的因素介入并驱动着视频热度的变化,基于历史播放数据预测方法已经不能带来精确可靠的预测结果,使得广告主对于广告投放份量的错误预估,造成广告主的严重损失。
技术实现思路
针对上述问题,本专利技术的目的在于提供一种视频热度预测方法、装置、设备及计算机可读存储介质,提供更为精确的预测结果,满足用户需求。第一方面,本专利技术实施例提供了一种视频热度预测方法,包括以下步骤:根据待预测视频的类型,从待预测视频的视频数据中提取对应的特征指标的特征数据,以构造第一特征矩阵;对所述第一特征矩阵进行预处理,以生成第二特征矩阵;根据所述待预测视频的类型,选择预先建立的对应的视频热度预测模型;根据所述第二特征矩阵以及选择的视频热度预测模型,获取所述待预测视频的播放量预测指数。在第一方面的第一种实现方式中,所述待预测视频的类型包括版权剧、网剧、综艺以及网综;所述视频热度预测模型包括版权剧视频热度预测模型、网剧视频热度预测模型、综艺视频热度预测模型以及网综视频热度预测模型;所述特征指标包括电视播放平台、网络播放平台、题材、网络热议指数、导演关注度、明星活跃指数以及明星话题热度。在第一方面的第二种实现方式中,还包括:根据所述待预测视频,通过爬虫技术从预设网络平台爬取所述待预测视频的视频数据。根据第一方面的第二种实现方式,在第一方面的第三种实现方式中,所述根据待预测视频的类型,从待预测视频的视频数据中提取对应的特征指标的特征数据,以构造第一特征矩阵,具体为:根据待预测视频的类型,从待预测视频的视频数据中,提取所述待预测视频的类型所对应的特征指标的特征数据;其中,所述待预测视频的类型包括版权剧、网剧、综艺以及网综;对提取的各个特征指标所对应的特征数据分别进行归一化处理,以生成各个预设特征指标所对应的第三特征矩阵;根据所述各个第三特征矩阵构造第一特征矩阵。根据第一方面的第三种实现方式,在第一方面的第四种实现方式中,所述对所述第一特征矩阵进行预处理,以生成第二特征矩阵,具体为:删除所述第一特征矩阵中空值数量超过预设阈值的数据行,以及属于离群数据的数据行;对于所述第一特征矩阵中空值数量小于所述预设阈值的数据行,通过多重插补法对所述数据行中的空值进行补全,以生成第二特征矩阵。根据第一方面的第四种实现方式,在第一方面的第五种实现方式中,所述根据所述第二特征矩阵以及选择的视频热度预测模型,获取所述待预测视频的播放量预测指数,具体为:将所述第二特征矩阵作为选择的所述视频热度预测模型的输入参量,从所述预先建立的视频热度预测模型中获取所述待预测视频的播放量预测结果;对所述播放量预测结果进行分布调整,以生成播放量预测指数。根据第一方面的以上任一种实现方式,在第一方面的第六种实现方式中,所述视频热度预测模型的构建过程包括:根据待预测视频的类型,通过爬虫技术从预设网络平台爬取在预设时间段内对应所述待预测视频的类型的若干已上映视频的视频数据;其中,所述待预测视频的类型包括版权剧、网剧、综艺以及网综;从所述已上映视频的视频数据中获取对应于所述待预测视频的类型的特征指标的特征数据,以构造第一训练特征矩阵;对所述第一训练特征矩阵进行预处理,以生成第二训练特征矩阵;将所述第二训练特征矩阵以及对应播放量,作为训练集数据,通过随机森林算法进行训练,以生成对应的视频热度预测模型;其中,所述视频热度预测模型包括版权剧视频热度预测模型、网剧视频热度预测模型、综艺视频热度预测模型以及网综视频热度预测模型。第二方面,本专利技术实施例提供了一种视频热度预测装置,包括:第一特征矩形构造单元,用于根据待预测视频的类型,从待预测视频的视频数据中提取对应的特征指标的特征数据,以构造第一特征矩阵;第二特征矩形生成单元,用于对所述第一特征矩阵进行预处理,以生成第二特征矩阵;预测模型选择单元,用于根据所述待预测视频的类型,选择预先建立的对应的视频热度预测模型;预测指数获取单元,用于根据所述第二特征矩阵以及选择的视频热度预测模型,获取所述待预测视频的播放量预测指数。第三方面,本专利技术实施例提供了一种视频热度预测设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面中任意一项所述的视频热度预测方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如第一方面中任意一项所述的视频热度预测方法。以上实施例具有如下有益效果:首先根据待预测视频的类型,从待预测视频的视频数据中提取对应的特征指标的特征数据,以构造第一特征矩阵,其次对所述第一特征矩阵进行预处理,以生成第二特征矩阵,再根据所述待预测视频的类型,选择预先建立的对应的视频热度预测模型,最后根据所述第二特征矩阵以及选择的视频热度预测模型,获取所述待预测视频的播放量预测指数,本专利技术根据待预测视频的类型确定对应的视频热度预测模型以及对应的输入特征指标,同一类型的视频数据在一个预测模型中进行热度预测,避免了同一预测模型预测不同类型的视频容易造成的误差和预测错误的情况,使得待预测视频的预测结果更为精确可靠,进而能为视频在上映前的投资和播放提供有价值的参考。附图说明为了更清楚地说明本专利技术的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术第一实施例提供的视频热度预测方法的流程示意图。图2是本专利技术第四实施例提供的视频热度预测装置的结构示意图。图3是本专利技术第五实施例提供的视频热度预测设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性本文档来自技高网...

【技术保护点】
1.一种视频热度预测方法,其特征在于,包括以下步骤:根据待预测视频的类型,从待预测视频的视频数据中提取对应的特征指标的特征数据,以构造第一特征矩阵;对所述第一特征矩阵进行预处理,以生成第二特征矩阵;根据所述待预测视频的类型,选择预先建立的对应的视频热度预测模型;根据所述第二特征矩阵以及选择的视频热度预测模型,获取所述待预测视频的播放量预测指数。

【技术特征摘要】
1.一种视频热度预测方法,其特征在于,包括以下步骤:根据待预测视频的类型,从待预测视频的视频数据中提取对应的特征指标的特征数据,以构造第一特征矩阵;对所述第一特征矩阵进行预处理,以生成第二特征矩阵;根据所述待预测视频的类型,选择预先建立的对应的视频热度预测模型;根据所述第二特征矩阵以及选择的视频热度预测模型,获取所述待预测视频的播放量预测指数。2.根据权利要求1所述的视频热度预测方法,其特征在于,所述待预测视频的类型包括版权剧、网剧、综艺以及网综;所述视频热度预测模型包括版权剧视频热度预测模型、网剧视频热度预测模型、综艺视频热度预测模型以及网综视频热度预测模型;所述特征指标包括电视播放平台、网络播放平台、题材、网络热议指数、导演关注度、明星活跃指数以及明星话题热度。3.根据权利要求1所述的视频热度预测方法,其特征在于,还包括:根据所述待预测视频,通过爬虫技术从预设网络平台爬取所述待预测视频的视频数据。4.根据权利要求3所述的视频热度预测方法,其特征在于,所述根据待预测视频的类型,从待预测视频的视频数据中提取对应的特征指标的特征数据,以构造第一特征矩阵,具体为:根据待预测视频的类型,从待预测视频的视频数据中,提取所述待预测视频的类型所对应的特征指标的特征数据;其中,所述待预测视频的类型包括版权剧、网剧、综艺以及网综;对提取的各个特征指标所对应的特征数据分别进行归一化处理,以生成各个预设特征指标所对应的第三特征矩阵;根据所述各个第三特征矩阵构造第一特征矩阵。5.根据权利要求4所述的视频热度预测方法,其特征在于,所述对所述第一特征矩阵进行预处理,以生成第二特征矩阵,具体为:删除所述第一特征矩阵中空值数量超过预设阈值的数据行,以及属于离群数据的数据行;对于所述第一特征矩阵中空值数量小于所述预设阈值的数据行,通过多重插补法对所述数据行中的空值进行补全,以生成第二特征矩阵。6.根据权利要求5所述的视频热度预测方法,其特征在于,所述根据所述第二特征矩阵以及选择的视频热度预测模型,获取所述待预测视...

【专利技术属性】
技术研发人员:汪浩刘德洪喻永淼贺华玲丁博陆宁冰李晋文
申请(专利权)人:汪浩
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1