一种直播视频评估的方法、模型建立的方法、装置及设备制造方法及图纸

技术编号:19704263 阅读:15 留言:0更新日期:2018-12-08 14:48
本发明专利技术公开了一种直播视频评估的方法,包括:获取目标直播视频的弹幕数据;从弹幕数据中确定出表征各敏感维度的特征;将各敏感维度的特征输入到直播评估模型中,确定目标直播视频的敏感指数,敏感指数反映目标直播视频所包含敏感内容的比重;当敏感指数大于敏感阈值时,确定目标直播视频为敏感视频。本申请实施例提供的直播视频评估的方法,可以有效的分析网络直播的视频内容是否敏感,从而有效的对网络直播进行管理。

【技术实现步骤摘要】
一种直播视频评估的方法、模型建立的方法、装置及设备
本专利技术涉及互联网
,具体涉及一种直播视频评估的方法、直播评估模型建立的方法、装置及设备。
技术介绍
随着网络直播和网络视频播放的兴起,为了吸引更多的用户,赚取更多的流量,网络直播中所直播的色情内容也随之大量增加。如何有效的识别用户在网络中点播或者直播的内容是否是色情内容,并对包含色情内容的直播进行管理是各大互联网平台提供商面临的问题。当前都是通过对视频内容进行截图来识别所截取的图片是否包含色情内容。这种识别方式,如果长时间的视频里面只有一小段的色情内容的时候就比较难识别,并且该方法由于复杂性不能用于监控直播内容,从而导致无法有效管理网络直播的视频内容。
技术实现思路
为了解决现有技术中无法有效管理网络直播的视频内容的问题,本专利技术实施例提供一种直播视频评估的方法,可以有效的分析网络直播的视频内容是否敏感,从而有效的对网络直播进行管理。本申请实施例还提供了直播评估模型建立的方法,以及与直播视频评估的方法、直播评估模型建立的方法相应的装置及设备。本申请第一方面提供一种直播视频评估的方法,包括:获取目标直播视频的弹幕数据;从所述弹幕数据中确定出表征各敏感维度的特征;将所述各敏感维度的特征输入到直播评估模型中,确定所述目标直播视频的敏感指数,所述敏感指数反映所述目标直播视频所包含敏感内容的比重;当所述敏感指数大于敏感阈值时,确定所述目标直播视频为敏感视频。本申请第二方面提供一种直播评估模型建立的方法,包括:获取被选为样本的第一类直播的弹幕数据和第二类直播的弹幕数据,所述第一类直播为敏感直播,所述第二类直播为非敏感直播;根据所述第一类直播视频的弹幕数据和第二类直播视频的弹幕数据,训练初始评估模型,以得到所述直播评估模型。本申请第三方面提供一种直播视频评估的装置,包括:获取程序模块,用于获取目标直播视频的弹幕数据;第一确定程序模块,用于从所述获取程序模块获取的所述弹幕数据中确定出表征各敏感维度的特征;第二确定程序模块,用于将所述第一确定程序模块确定的所述各敏感维度的特征输入到直播评估模型中,确定所述目标直播视频的敏感指数,所述敏感指数反映所述目标直播视频所包含敏感内容的比重;第三确定程序模块,用于当所述第二确定程序模块确定的所述敏感指数大于敏感阈值时,确定所述目标直播视频为敏感视频。本申请第四方面提供一种直播评估模型建立的装置,包括:获取程序模块,用于获取被选为样本的第一类直播的弹幕数据和第二类直播的弹幕数据,所述第一类直播为敏感直播,所述第二类直播为非敏感直播;模型训练程序模块,用于根据所述获取程序模块获取的所述第一类直播视频的弹幕数据和第二类直播视频的弹幕数据,训练初始评估模型,以得到所述直播评估模型。本申请第五方面提供一种计算机设备,包括:输入/输出(I/O)接口、处理器和存储器,所述存储器中存储有第一方面所述的直播视频评估的指令;所述处理器用于执行存储器中存储的直播视频评估的指令,执行如第一方面所述的直播视频评估的方法的步骤。本申请第六方面提供一种计算机设备,包括:输入/输出(I/O)接口、处理器和存储器,所述存储器中存储有第二方面所述的直播评估模型建立的指令;所述处理器用于执行存储器中存储的直播评估模型建立的指令,执行如第二方面所述的直播评估模型建立的方法的步骤。本申请的又一方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。本申请的又一方面提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。与现有技术中无法较好的管理直播视频内容相比,本申请实施例提供的直播视频评估的方法,可以有效的分析网络直播的视频内容是否敏感,从而有效的对网络直播进行管理。附图说明图1是本申请实施例中分布式系统一网络架构示意图;图2是本申请实施例中拟化场景下分布式系统的结构示意图;图3是本申请实施例中直播评估模型建立的方法的一实施例示意图;图4是本申请实施例提供的直播评估模型建立的方法的另一实施例示意图;图5是本申请实施例中直播视频评估的方法的一实施例示意图;图6是本申请实施例中直播视频评估的方法的一场景示例示意图;图7是本申请实施例中直播视频评估的方法的另一实施例示意图;图8是本申请实施例中直播视频评估的装置的一实施例示意图;图9是本申请实施例中直播视频评估的装置的另一实施例示意图;图10是本申请实施例中直播评估模型建立的装置的一实施例示意图;图11是本申请实施例中计算机设备的一实施例示意图。具体实施方式下面结合附图,对本专利技术的实施例进行描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。本领域普通技术人员可知,随着技术的发展,本专利技术实施例提供的技术方案对于类似的技术问题,同样适用。本专利技术实施例提供一种直播视频评估的方法,可以有效的分析网络直播的视频内容是否敏感,从而有效的对网络直播进行管理。本申请实施例还提供了相应的装置。以下分别进行详细说明。网络直播是指通过互联网平台进行在线直播,现在有很多网络直播平台,用户安装相应的直播平台软件后,就可以选择直播平台上的直播房间,进入观看该房间的直播内容。因为目前对在网络平台上进行直播的主播没有什么要求,所以主播所直播出来的内容也五花八门,有直播吃饭的,有直播化妆的,有直播打游戏的,还有直播一些敏感内容的,网络平台上直播的敏感内容通常指色情内容,当然,也可以指其他方面的敏感内容,如赌博等。平台提供商要对这些敏感内容进行管理,就需要对平台上每个直播间的视频内容进行截图,然后分析截图中是否包含敏感内容,但这种管理方式,不仅处理量大,而且对截图的分析可能也不够准确,导致平台提供商还是无法有效的管理网络直播的视频内容。直播是通过弹幕与观众进行互动的。而直播的不健康内容必然是为了吸引观众,人流量。因此,在互动期间不健康的弹幕已经出现,同时不健康的弹幕还会贯穿直播整个过程。因此,本申请实施例中针对弹幕进行文本分析,根据分析结果,进行不同程度的监控,如果出现大量不健康词汇,同时直播间流量激增,则该类需要重点监控,可以有效的对直播的视频内容进行管理。根据直播视频中的弹幕对视频进行管理,需要先建立直播评估模型。本申请实施例中涉及到对直播评估模型的建立和使用,直播评估模型是指能计算出直播视频的敏感指数,该敏感指数能反映所述目标直播视频所包含敏感内容的比重。无论是对直播评估模型的建立还是使用,都需要基于后台计算设备来实现,后台计算设备通常以集群的形式存在,当然,也可以是独立的计算设备。下面以集群的形式为例进行介绍。如图1所示,图1为本申请实施例中分布式系统一网络架构示意图;本申请实施例所提供的分布式系统包括主控节点(Master)10、网络20和多个工作节点(Worker)30,主控节点10和多个工作节点30可以通过网络20通信,该分布式系统中的多个工作节点负责存储各种直播视频,该主控节点在本申请实施例中可以为直播视频评估的装置或者直播评估模型建立的装置,负责根据各工作节点所存储的直播视频建立直播评估模型或者确定正在直播的视频的敏感指数,该敏感指数反映所述目标直播视频所包含敏感内容的比重。当确定出是敏感视频时,本文档来自技高网...

【技术保护点】
1.一种直播视频评估的方法,其特征在于,包括:获取目标直播视频的弹幕数据;从所述弹幕数据中确定出表征各敏感维度的特征;将所述各敏感维度的特征输入到直播评估模型中,确定所述目标直播视频的敏感指数,所述敏感指数反映所述目标直播视频所包含敏感内容的比重;当所述敏感指数大于敏感阈值时,确定所述目标直播视频为敏感视频。

【技术特征摘要】
1.一种直播视频评估的方法,其特征在于,包括:获取目标直播视频的弹幕数据;从所述弹幕数据中确定出表征各敏感维度的特征;将所述各敏感维度的特征输入到直播评估模型中,确定所述目标直播视频的敏感指数,所述敏感指数反映所述目标直播视频所包含敏感内容的比重;当所述敏感指数大于敏感阈值时,确定所述目标直播视频为敏感视频。2.根据权利要求1所述的方法,其特征在于,所述从所述弹幕数据中确定出表征各敏感维度的特征,包括:从所述弹幕数据中提取出弹幕文本和弹幕流量数据;确定所述弹幕文本中所包含敏感词的词频特征,从所述弹幕流量数据中确定弹幕数量、所述目标直播视频被点击的增长量和点击所述目标直播视频的对象中点击过敏感视频的比例中的至少一个。3.根据权利要求2所述的方法,其特征在于,所述将所述各敏感维度的特征输入到直播评估模型中,确定所述目标直播视频的敏感指数,包括:根据如下直播评估模型确定所述目标直播视频的敏感指数;其中,hθ(x)和g(θTx)为敏感指数;x为矩阵,所述x的包括所述词频特征以及、所述目标直播视频被点击的增长量和点击所述目标直播视频的对象中点击过敏感视频的比例中的至少一个;θ为权值矩阵,在所述直播评估模型训练过程中得到的所述权值矩阵中的各权值的取值,所述θ的个数与所述x的个数对应,所述θT表示θ的转置矩阵。4.根据权利要求1-3任一所述的方法,其特征在于,所述方法还包括:获取被选为样本的第一类直播视频的弹幕数据和第二类直播视频的弹幕数据,所述第一类直播为敏感直播,所述第二类直播为非敏感直播;根据所述第一类直播视频的弹幕数据和第二类直播视频的弹幕数据,训练初始评估模型,以得到所述直播评估模型。5.根据权利要求4所述的方法,其特征在于,所述根据所述第一类直播视频的弹幕数据和第二类直播视频的弹幕数据,训练初始评估模型,以得到所述直播评估模型,包括:从所述第一类直播视频的弹幕数据和第二类直播视频的弹幕数据中确定出每个直播视频中表征各敏感维度的特征;使用所述每个直播视频中表征各敏感维度的特征对如下初始评估模型进行训练;所述初始评估模型为:其中,hθ(x)和g(θTx)为敏感指数;x为矩阵,所述x的包括所述每个直播视频中表征各敏感维度的特征;θ为权值矩阵;所述θ的个数与所述x的个数对应,所述θT表示θ的转置矩阵;通过所述每个直播视频中表征各敏感维度的特征训练得到所述θ的取值,以得到所述直播评估模型。6.根据权利要求5所述的方法,其特征在于,所述从所述第一类直播视频的弹幕数据和第二类直播视频的弹幕数据中确定出每个直播视频中表征各敏感维度的特征,包括:从所述第一类直播的弹幕数据和所述第二类直播的弹幕数据中,分别提取所述每个直播视频中的训练弹幕文本和训练弹幕流量数据;确定所述训练弹幕文本中所包含敏感词的词频特征,从所述训练弹幕流量数据中确定用于训练模型的弹幕数量、所述每个直播视频被点击的增长量和点击所述每个直播视频的对象中点击过敏感视频的比例中的至少一个。7.一种直播评估模型建立的方法,其特征在于,包括:获取被选为样本的第一类直播的弹幕数据和第二类直播的弹幕数据,所述第一类直播为敏感直播,所述第二类直播为非敏感直播;根据所述第一类直播视频的弹幕数据和第二类直播视频的弹幕数据,训练初始评估模型,以得到所述直播评估模型。8.根据权利要求7所述的方法,其特征在于,所述根据所述第一类直播视频的弹幕数据和第二类直播视频的弹幕数据,训练初始评估模型,以得到所述直播评估模型,包括:从所述第一类直播视频的弹幕数据和第二类直播视频的弹幕数据中确定出每个直播视...

【专利技术属性】
技术研发人员:杨磊
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1