一种弹幕识别模型建立方法、装置、服务器及介质制造方法及图纸

技术编号：20075055 阅读：40 留言：0更新日期：2019-01-15 00:38

本发明专利技术公开了一种弹幕识别模型建立方法、装置、服务器及介质。该方法包括：使用弹幕训练样本对对预先构建的卷积神经网络进行训练；将训练完成的卷积神经网络作为弹幕识别模型；其中，弹幕训练样本对包括弹幕样本词向量以及与弹幕样本词向量对应的弹幕类型值，弹幕类型值包括正常弹幕输出值和异常弹幕输出值。采用上述技术方案训练获得的弹幕识别模型，可以有效过滤异常弹幕，提高异常弹幕的识别正确率和识别效率，同时能够实现弹幕识别模型的自主增量学习。

A Method, Device, Server and Medium for Establishment of Barrage Recognition Model

The invention discloses a method, a device, a server and a medium for establishing a bullet screen recognition model. The method includes: using the training samples to train the pre-constructed convolution neural network; using the completed training convolution neural network as the recognition model of the barrage; among them, the training samples are used for the barrage type values including the barrage sample word vector and the corresponding barrage type values with the barrage sample word vector, and the barrage type values include the normal barrage output value and the abnormal barrage output value. The recognition model obtained by the training of the above technical scheme can effectively filter the abnormal barrage, improve the recognition accuracy and efficiency of the abnormal barrage, and realize the autonomous incremental learning of the barrage recognition model.

全部详细技术资料下载

【技术实现步骤摘要】
一种弹幕识别模型建立方法、装置、服务器及介质
本专利技术实施例涉及计算机
，尤其涉及一种弹幕识别模型建立方法、装置、服务器及介质。
技术介绍
弹幕是网络直播的重要组成部分，是直播间热度的客观反应。用户之间可以通过弹幕进行互动，主播也可以通过弹幕直接了解用户的想法，提升用户的观看体验。随着直播平台的发展，超大型主播观看人数爆炸，这导致直播过程中短时间的弹幕量可能达到几千甚至几万量级。如果短时间在直播界面上显示如此海量的弹幕，一方面会由于弹幕过于密集遮挡主播的直播内容；另一方面会导致用户软件服务高负载，耗费大量流量和内存。由于短时间内海量弹幕中包含大量的低质量弹幕，因此，可以通过对低质量弹幕识别的方式实现直播界面所显示的弹幕的数量的有效控制。现有技术中，通常采用人工筛查或关键词正则匹配等方式进行低质量弹幕(也即异常弹幕)的过滤。然而，上述方法对低质量弹幕的识别效果较差，识别效率也较低。同时，由于建立的弹幕识别模型在训练过程中无法进行训练样本的增量调整，因此也无法实现模型训练中的自主增量学习。
技术实现思路
本专利技术实施例提供了一种弹幕识别模型建立方法、装置、服务器及介质，以实现对低质量弹幕的过滤。第一方面，本专利技术实施例提供了一种弹幕识别模型建立方法，包括：使用弹幕训练样本对对预先构建的卷积神经网络进行训练；其中，所述弹幕训练样本对包括：弹幕样本词向量以及与弹幕样本词向量对应的弹幕类型值；所述弹幕类型值包括正常弹幕输出值和异常弹幕输出值；将训练完成的卷积神经网络作为所述弹幕识别模型。第二方面，本专利技术实施例还提供了一种弹幕识别模型建立装置，包括：训练模...

【技术保护点】
1.一种弹幕识别模型建立方法，其特征在于，包括：使用弹幕训练样本对对预先构建的卷积神经网络进行训练；其中，所述弹幕训练样本对包括：弹幕样本词向量以及与弹幕样本词向量对应的弹幕类型值；所述弹幕类型值包括正常弹幕输出值和异常弹幕输出值；将训练完成的卷积神经网络作为所述弹幕识别模型。

【技术特征摘要】
1.一种弹幕识别模型建立方法，其特征在于，包括：使用弹幕训练样本对对预先构建的卷积神经网络进行训练；其中，所述弹幕训练样本对包括：弹幕样本词向量以及与弹幕样本词向量对应的弹幕类型值；所述弹幕类型值包括正常弹幕输出值和异常弹幕输出值；将训练完成的卷积神经网络作为所述弹幕识别模型。2.根据权利要求1所述的方法，其特征在于，所述卷积神经网络，包括：输入层、隐藏层、全连接层和输出层首尾相连；所述隐藏层包括至少两个计算网络分支；所述计算网络分支包括卷积层、与所述卷积层连接的激活层、与所述激活层连接的池化层和与所述池化层连接的折叠层。3.根据权利要求1所述的方法，其特征在于，在所述使用弹幕训练样本对预先构建的卷积神经网络进行训练之前，还包括：获取原始弹幕样本；根据预设标准词表，对各所述原始弹幕样本进行独热编码，生成初始弹幕样本词向量；对所述初始弹幕样本词向量进行降维处理，生成所述弹幕样本词向量。4.根据权利要求3所述的方法，其特征在于，在根据预设标准词表，对各所述原始弹幕样本进行独热编码，生成初始弹幕样本词向量之前，还包括：去除各原始弹幕样本中的异常字符，并更新所述原始弹幕样本；和/或去除各所述原始弹幕样本中内容相同的弹幕样本，并更新所述原始弹幕样本。5.根据权利要求1所述的方法，其特征在于，使用弹幕训练样本对对预先构建的神经网络进行训练，包括：选取设定数量的弹幕训练样本对；依次获取一个弹幕训练样本对输入至预先构建的卷积神经网络中，得到所述卷积神经网络基于弹幕样本词向量的输出结果，并基于所述输出结果对预先构建的卷积神经网...

【专利技术属性】
技术研发人员：王非池，
申请(专利权)人：武汉斗鱼网络科技有限公司，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人