一种广告弹幕检测方法、装置、服务器及存储介质制造方法及图纸

技术编号：24806306 阅读：69 留言：0更新日期：2020-07-07 22:20

本发明专利技术公开了一种广告弹幕检测方法、装置、服务器及存储介质，属于弹幕技术领域。本发明专利技术提供的方法包括：采集历史弹幕数据，其中所述历史弹幕数据包括广告弹幕和正常弹幕；利用随机森林训练所述历史弹幕数据，获得广告弹幕预测模型；实时采集弹幕数据，根据实时弹幕数据中的维度特征，通过所述广告弹幕预测模型以检测实时弹幕数据是否为广告弹幕。通过本发明专利技术可以快速识别未曾出现过的广告弹幕，并保障对广告弹幕的准确检测和拦截。

全部详细技术资料下载

【技术实现步骤摘要】
一种广告弹幕检测方法、装置、服务器及存储介质
本专利技术涉及弹幕
，尤其涉及一种广告弹幕检测方法、装置、服务器及存储介质。
技术介绍
用户在观看直播过程中，经常会出现广告弹幕，广告弹幕不仅会影响到用户的观看体验，而且还可能涉及违法一些宣传内容。针对这些恶意广告，需要根据弹幕内容区分是否为广告弹幕并进行相应的拦截。现有的广告拦截模型主要是通过事先标注好的广告弹幕，对神经网络等模型迭代训练，这种方式对于从未出现过的弹幕，或简单打乱词序、形近字、音近字等形式的弹幕，将难以进行识别判断出来，使得弹幕拦截效果不理想。
技术实现思路
有鉴于此，本专利技术实施例提供了一种广告弹幕检测方法、装置及存储介质，用于检测识别未出现过的广告弹幕，并进行拦截。结合本专利技术实施例的第一方面，提供了一种广告弹幕检测方法，包括：采集历史弹幕数据，其中所述历史弹幕数据包括广告弹幕和正常弹幕；利用随机森林训练所述历史弹幕数据，获得广告弹幕预测模型；实时采集弹幕数据，根据实时弹幕数据中的维度特征，通过所述广告弹幕预测模型检测所述实时弹幕数据是否为广告弹幕。结合本专利技术实施例的第二方面，提供了一种广告弹幕检测装置，包括：采集单元：用于采集历史弹幕数据，其中所述历史弹幕数据包括广告弹幕和正常弹幕；训练单元：用于利用随机森林训练所述历史弹幕数据，获得广告弹幕预测模型；检测单元：用于实时采集弹幕数据，根据实时弹幕数据中的维度特征，通过所述广告弹幕预测模型检测所述...

【技术保护点】
1.一种广告弹幕检测方法，其特征在于，包括：/n采集历史弹幕数据，其中所述历史弹幕数据包括广告弹幕和正常弹幕；/n利用随机森林训练所述历史弹幕数据，获得广告弹幕预测模型；/n实时采集弹幕数据，根据实时弹幕数据中的维度特征，通过所述广告弹幕预测模型检测所述实时弹幕数据是否为广告弹幕。/n

【技术特征摘要】
1.一种广告弹幕检测方法，其特征在于，包括：
采集历史弹幕数据，其中所述历史弹幕数据包括广告弹幕和正常弹幕；
利用随机森林训练所述历史弹幕数据，获得广告弹幕预测模型；
实时采集弹幕数据，根据实时弹幕数据中的维度特征，通过所述广告弹幕预测模型检测所述实时弹幕数据是否为广告弹幕。

2.根据权利要求1所述的方法，其特征在于，所述利用随机森林训练所述历史弹幕数据具体为：
将所述历史弹幕数据作为样本，通过计算每个决策树中节点的最小基尼不纯度，选取决策树的分类节点。

3.根据权利要求1所述的方法，其特征在于，所述维度特征为基于实时弹幕基本信息和历史弹幕信息的弹幕发送行为不同维度信息统计特征。

4.根据权利要求1所述的方法，其特征在于，所述通过所述广告弹幕预测模型检测所述实时弹幕数据是否为广告弹幕具体为：
根据所述维度特征，通过所述广告弹幕预测模型计算所述维度特征对应的实时弹幕数据是广告弹幕的概率。

5.根据权利要求4所述的方法，其特征在于，所述根据所述维度特征，通过所述广告弹幕预测模型计算所述预定特征对应的实时弹幕是广告弹幕的概率还包括：
根据所述实时弹幕数据是广告弹幕的概率，查找所述概率对应的拦截等级，并执行所述拦截等级对应的拦截策略。

【专利技术属性】
技术研发人员：刘兵，
申请(专利权)人：武汉斗鱼网络科技有限公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人