The embodiment of the invention discloses a barrage of live content based on the screening methods, apparatus, equipment and storage medium, wherein, the method comprises: determining the content of the live scene classification, the selection of scene classification based on obtaining the word thesaurus; live content barrage, using the word segmentation lexicon selection evaluation of words from the barrage; the statistical evaluation of word frequency, word frequency and word feature vector generation evaluation according to the evaluation of word and corresponding; the evaluation of word feature vector input statistical classifier or neural network classifier, according to the output of the statistical classifier or neural network classifier selection results. Statistical classifier or neural network classifier can be used to automatically get high accuracy screening results, which can unify the evaluation standard of live broadcast content, and it has faster evaluation speed and higher efficiency.
【技术实现步骤摘要】
基于弹幕的直播内容的筛选方法、装置、设备及存储介质
本专利技术涉及计算机
,尤其涉及一种基于弹幕的直播内容的筛选方法、装置、设备及存储介质。
技术介绍
随着互联网技术的发展,用户终端可以通过互联网进行多媒体直播,使观众观看该多媒体直播的多媒体直播流。当需要观看直播时,用户按照自己的需求,点击进入一直播间,进而直播服务器基于用户的选择,将用户选择的直播间的直播视频流发送到用户设备(UserEquipment,UE)上,使用户在UE上观看该直播间对应的直播视频。为了方便用户找到属于自己偏好的直播间或直播内容,服务器会按照直播间推荐策略向用户推荐一些直播间。目前,选取优秀的直播内容向用户进行推荐通常采用人工推荐的方式,即由工作人员通过观看直播内容后给出相应的评价,并根据评价向用户进行推荐。但上述方法存在如下问题:由于直播的内容繁多,采用人工评价的方法工作量大、成本高且效率低;并且由于每个工作人员的喜好不同,无法实现评价标准的统一。
技术实现思路
本专利技术实施例提供了一种基于弹幕的直播内容的筛选方法、装置、设备及存储介质,以解决现有技术中对直播内容筛选成本高、效率低及标准不统一的技术问题。第一方面,本专利技术实施例提供了一种基于弹幕的直播内容的筛选方法,包括:确定直播内容所属的场景分类,基于所述场景分类选择分词词库;获取所述直播内容的弹幕,利用所述分词词库选取从弹幕中选取评价词;统计所述评价词的词频,并根据所述评价词和对应的词频生成评价词特征向量;将所述评价词特征向量输入统计分类器或神经网络分类器,根据所述统计分类器或神经网络分类器的输出筛选结果。根据所述输出 ...
【技术保护点】
一种基于弹幕的直播内容的筛选方法,其特征在于,包括:确定直播内容所属的场景分类,基于所述场景分类选择分词词库;获取所述直播内容的弹幕,利用所述分词词库选取从弹幕中选取评价词;统计所述评价词的词频,并根据所述评价词和对应的词频生成评价词特征向量;将所述评价词特征向量输入统计分类器或神经网络分类器,根据所述统计分类器或神经网络分类器的输出筛选结果。
【技术特征摘要】
1.一种基于弹幕的直播内容的筛选方法,其特征在于,包括:确定直播内容所属的场景分类,基于所述场景分类选择分词词库;获取所述直播内容的弹幕,利用所述分词词库选取从弹幕中选取评价词;统计所述评价词的词频,并根据所述评价词和对应的词频生成评价词特征向量;将所述评价词特征向量输入统计分类器或神经网络分类器,根据所述统计分类器或神经网络分类器的输出筛选结果。2.根据权利要求1所述的方法,其特征在于,所述确定直播内容所属的场景分类包括:通过分类卷积神经网络分类器确定直播内容所属的场景分类。3.根据权利要求1所述的方法,其特征在于,所述分词词库包括:评价词词库和无意义词词库;相应的,所述利用所述分词词库从弹幕中选取评价词,包括:利用评价词词库从弹幕中选取初始评价词;利用无意义词词库从所述初始评价词中筛选出评价词。4.根据权利要求1所述的方法,其特征在于,所述根据所述评价词和对应的词频生成评价词特征向量,包括:选取词频超过预设词频阈值的评价词;根据所述超过预设词频阈值的评价词和对应的词频生成评价词特征向量。5.一种基于弹幕的直播内容的筛选装置,其特征在于,包括:确认模块,用于确定直播内容所属的场景分类,基于所述场景分类选择分词词库;获取模块,获取所述直播内容的弹幕,利用所述分词词库选取从弹幕中选取评价词;特征选取模块,用于统计所...
【专利技术属性】
技术研发人员:王兵,
申请(专利权)人:上海六界信息技术有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。