一种直播视频评估的方法、模型建立的方法、装置及设备制造方法及图纸

技术编号：19704263 阅读：15 留言：0更新日期：2018-12-08 14:48

本发明专利技术公开了一种直播视频评估的方法，包括：获取目标直播视频的弹幕数据；从弹幕数据中确定出表征各敏感维度的特征；将各敏感维度的特征输入到直播评估模型中，确定目标直播视频的敏感指数，敏感指数反映目标直播视频所包含敏感内容的比重；当敏感指数大于敏感阈值时，确定目标直播视频为敏感视频。本申请实施例提供的直播视频评估的方法，可以有效的分析网络直播的视频内容是否敏感，从而有效的对网络直播进行管理。

全部详细技术资料下载

【技术实现步骤摘要】
一种直播视频评估的方法、模型建立的方法、装置及设备
本专利技术涉及互联网
，具体涉及一种直播视频评估的方法、直播评估模型建立的方法、装置及设备。
技术介绍
随着网络直播和网络视频播放的兴起，为了吸引更多的用户，赚取更多的流量，网络直播中所直播的色情内容也随之大量增加。如何有效的识别用户在网络中点播或者直播的内容是否是色情内容，并对包含色情内容的直播进行管理是各大互联网平台提供商面临的问题。当前都是通过对视频内容进行截图来识别所截取的图片是否包含色情内容。这种识别方式，如果长时间的视频里面只有一小段的色情内容的时候就比较难识别，并且该方法由于复杂性不能用于监控直播内容，从而导致无法有效管理网络直播的视频内容。
技术实现思路
为了解决现有技术中无法有效管理网络直播的视频内容的问题，本专利技术实施例提供一种直播视频评估的方法，可以有效的分析网络直播的视频内容是否敏感，从而有效的对网络直播进行管理。本申请实施例还提供了直播评估模型建立的方法，以及与直播视频评估的方法、直播评估模型建立的方法相应的装置及设备。本申请第一方面提供一种直播视频评估的方法，包括：获取目标直播视频的弹幕数据；从所述弹幕数据中确定出表征各敏感维度的特征；将所述各敏感维度的特征输入到直播评估模型中，确定所述目标直播视频的敏感指数，所述敏感指数反映所述目标直播视频所包含敏感内容的比重；当所述敏感指数大于敏感阈值时，确定所述目标直播视频为敏感视频。本申请第二方面提供一种直播评估模型建立的方法，包括：获取被选为样本的第一类直播的弹幕数据和第二类直播的弹幕数据，所述第一类直播为敏感直播，所述第二类直播...

【技术保护点】
1.一种直播视频评估的方法，其特征在于，包括：获取目标直播视频的弹幕数据；从所述弹幕数据中确定出表征各敏感维度的特征；将所述各敏感维度的特征输入到直播评估模型中，确定所述目标直播视频的敏感指数，所述敏感指数反映所述目标直播视频所包含敏感内容的比重；当所述敏感指数大于敏感阈值时，确定所述目标直播视频为敏感视频。

【技术特征摘要】
1.一种直播视频评估的方法，其特征在于，包括：获取目标直播视频的弹幕数据；从所述弹幕数据中确定出表征各敏感维度的特征；将所述各敏感维度的特征输入到直播评估模型中，确定所述目标直播视频的敏感指数，所述敏感指数反映所述目标直播视频所包含敏感内容的比重；当所述敏感指数大于敏感阈值时，确定所述目标直播视频为敏感视频。2.根据权利要求1所述的方法，其特征在于，所述从所述弹幕数据中确定出表征各敏感维度的特征，包括：从所述弹幕数据中提取出弹幕文本和弹幕流量数据；确定所述弹幕文本中所包含敏感词的词频特征，从所述弹幕流量数据中确定弹幕数量、所述目标直播视频被点击的增长量和点击所述目标直播视频的对象中点击过敏感视频的比例中的至少一个。3.根据权利要求2所述的方法，其特征在于，所述将所述各敏感维度的特征输入到直播评估模型中，确定所述目标直播视频的敏感指数，包括：根据如下直播评估模型确定所述目标直播视频的敏感指数；其中，hθ(x)和g(θTx)为敏感指数；x为矩阵，所述x的包括所述词频特征以及、所述目标直播视频被点击的增长量和点击所述目标直播视频的对象中点击过敏感视频的比例中的至少一个；θ为权值矩阵，在所述直播评估模型训练过程中得到的所述权值矩阵中的各权值的取值，所述θ的个数与所述x的个数对应，所述θT表示θ的转置矩阵。4.根据权利要求1-3任一所述的方法，其特征在于，所述方法还包括：获取被选为样本的第一类直播视频的弹幕数据和第二类直播视频的弹幕数据，所述第一类直播为敏感直播，所述第二类直播为非敏感直播；根据所述第一类直播视频的弹幕数据和第二类直播视频的弹幕数据，训练初始评估模型，以得到所述直播评估模型。5.根据权利要求4所述的方法，其特征在于，所述根据所述第一类直播视频的弹幕数据和第二类直播视频的弹幕数据，训练初始评估模型，以得到所述直播评估模型，包括：从所述第一类直播视频的弹幕数据和第二类直播视频的弹幕数据中确定出每个直播视频中表征各敏感维度的特征；使用所述每个直播视频中表征各敏感维度的特征对如下初始评估模型进行训练；所述初始评估模型为：其中，hθ(x)和g(θTx)为敏感指数；x为矩阵，所述x的包括所述每个直播视频中表征各敏感维度的特征；θ为权值矩阵；所述θ的个数与所述x的个数对应，所述θT表示θ的转置矩阵；通过所述每个直播视频中表征各敏感维度的特征训练得到所述θ的取值，以得到所述直播评估模型。6.根据权利要求5所述的方法，其特征在于，所述从所述第一类直播视频的弹幕数据和第二类直播视频的弹幕数据中确定出每个直播视频中表征各敏感维度的特征，包括：从所述第一类直播的弹幕数据和所述第二类直播的弹幕数据中，分别提取所述每个直播视频中的训练弹幕文本和训练弹幕流量数据；确定所述训练弹幕文本中所包含敏感词的词频特征，从所述训练弹幕流量数据中确定用于训练模型的弹幕数量、所述每个直播视频被点击的增长量和点击所述每个直播视频的对象中点击过敏感视频的比例中的至少一个。7.一种直播评估模型建立的方法，其特征在于，包括：获取被选为样本的第一类直播的弹幕数据和第二类直播的弹幕数据，所述第一类直播为敏感直播，所述第二类直播为非敏感直播；根据所述第一类直播视频的弹幕数据和第二类直播视频的弹幕数据，训练初始评估模型，以得到所述直播评估模型。8.根据权利要求7所述的方法，其特征在于，所述根据所述第一类直播视频的弹幕数据和第二类直播视频的弹幕数据，训练初始评估模型，以得到所述直播评估模型，包括：从所述第一类直播视频的弹幕数据和第二类直播视频的弹幕数据中确定出每个直播视...

【专利技术属性】
技术研发人员：杨磊，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人