处理弹幕信息的方法、装置及系统制造方法及图纸

技术编号:14881831 阅读:44 留言:0更新日期:2017-03-24 04:20
本发明专利技术提供一种处理弹幕信息的方法、装置及系统,涉及互联网技术领域,能够解决现有技术中手动屏蔽污秽弹幕操作繁琐的问题。本发明专利技术的方法主要包括:获取待显示的弹幕信息;利用预设污秽词识别模型对所述弹幕信息进行污秽识别;若识别结果为所述弹幕信息中包括污秽词,则将所述弹幕信息进行屏蔽。本发明专利技术主要适用于基于网络直播屏蔽污秽弹幕的场景中。

【技术实现步骤摘要】

本专利技术涉及互联网
,尤其涉及一种处理弹幕信息的方法、装置及系统
技术介绍
网络直播是一种将主播的视频直播数据流广播至多个观众进行观看的一种视频直播方式。通过网络直播用户不仅可以作为观众观看各个主播的直播视频,还可以作为主播将自身的直播视频传输给其他用户观看,且操作十分方便。为了丰富主播与观众之间的互动性,现有技术中提供了一种名为“弹幕”的互动方式。观众在观众客户端开启弹幕功能后,可以向外发送弹幕;主播在主播客户端开启弹幕功能后,可以接收并显示各个观众客户端发送的弹幕信息。在实际应用中,常常存在谩骂、诅咒等污秽内容的弹幕信息,从而给主播带来一定的心理影响。为了避免主播看到这些污秽弹幕,现有技术中设置有屏蔽弹幕的按钮,当主播不想看某条弹幕时,可以手动选择屏蔽按钮进行屏蔽。然而,专利技术人在实现上述专利技术的过程中发现,当污秽弹幕较多时,主播需要手动对这些污秽弹幕依次进行屏蔽,操作十分繁琐。
技术实现思路
本专利技术实施例提供一种处理弹幕信息的方法、装置及系统,其目的在于通过实现污秽弹幕的自动识别与屏蔽,简化用户操作,提高处理效率。第一方面,本专利技术实施例提供了一种处理弹幕信息的方法,所述方法包括:获取待显示的弹幕信息;利用预设污秽词识别模型对所述弹幕信息进行污秽识别;若识别结果为所述弹幕信息中包括污秽词,则将所述弹幕信息进行屏蔽。第二方面,本专利技术实施例提供了一种处理弹幕信息的方法,所述方法包括:获取训练样本;对所述训练样本中的语句进行分词处理;利用深度学习技术对处理后的训练样本进行模型训练,获得预设污秽词识别模型;将所述预设污秽词识别模型发送给客户端,以便所述客户端利用所述预设污秽词识别模型对弹幕信息进行污秽识别操作。第三方面,本专利技术实施例提供了一种处理弹幕信息的装置,所述装置包括:获取单元,用于获取待显示的弹幕信息;识别单元,用于利用预设污秽词识别模型对所述获取单元获得的所述弹幕信息进行污秽识别;屏蔽单元,用于当所述识别单元的识别结果为所述弹幕信息中包括污秽词时,将所述弹幕信息进行屏蔽。第四方面,本专利技术实施例提供了一种处理弹幕信息的装置,所述装置包括:获取单元,用于获取训练样本;处理单元,用于对所述获取单元获得的所述训练样本中的语句进行分词处理;训练单元,用于利用深度学习技术对所述处理单元处理后的训练样本进行模型训练,获得预设污秽词识别模型;发送单元,用于将所述训练单元获得的所述预设污秽词识别模型发送给客户端,以便所述客户端利用所述预设污秽词识别模型对弹幕信息进行污秽识别操作。第五方面,本专利技术实施例提供了一种处理弹幕信息的系统,所述系统包括客户端和服务器;其中,所述服务器用于获取训练样本,对所述训练样本中的语句进行分词处理,利用深度学习技术对处理后的训练样本进行模型训练,获得预设污秽词识别模型,将所述预设污秽词识别模型发送给所述客户端;所述客户端用于接收所述服务器发送的预设污秽词识别模型,并在获取待显示的弹幕信息后;利用所述预设污秽词识别模型对所述弹幕信息进行污秽识别,若识别结果为所述弹幕信息中包括污秽词,则将所述弹幕信息进行屏蔽。本专利技术实施例提供的处理弹幕信息的方法、装置及系统,能够在客户端获取待显示的弹幕信息后,并不是直接将该弹幕信息显示在客户端界面上,而是先利用预设污秽词识别模型对该弹幕信息进行污秽识别操作,当确定该弹幕信息中没有污秽词时,才进行显示,而当确定该弹幕信息中包括污秽词时,直接对其进行屏蔽。由此可知,本专利技术实施例能够对污秽弹幕进行自动识别与屏蔽,而无需用户进行手动屏蔽,从而简化了用户操作,提高了屏蔽污秽弹幕的效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种处理弹幕信息的方法的流程图;图2为本专利技术实施例提供的另一种处理弹幕信息的方法的流程图;图3为本专利技术实施例提供的一种处理弹幕信息的装置的组成框图;图4为本专利技术实施例提供的另一种处理弹幕信息的装置的组成框图;图5为本专利技术实施例提供的另一种处理弹幕信息的装置的组成框图;图6为本专利技术实施例提供的一种处理弹幕信息的系统的组成框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为了解决现有技术中手动屏蔽污秽弹幕操作繁琐、效率低的问题,本专利技术实施例提供了一种处理弹幕信息的方法,该方法主要应用于主播客户端侧,如图1所示,该方法主要包括:101、获取待显示的弹幕信息。当观众基于观众客户端发送弹幕信息后,服务器能够接收到各个观众客户端发送的弹幕信息,并将这些弹幕信息反馈给主播客户端,以便主播客户端在获得这些弹幕信息后,执行下述步骤102-103。需要补充的是,主播客户端侧可以设置一个污秽识别按钮,用户可以通过点击该按钮开启或关闭污秽识别功能。102、利用预设污秽词识别模型对所述弹幕信息进行污秽识别。其中,预设污秽词识别模型为利用深度学习技术训练而得的网络结构模型;或者,预设污秽词识别模型为预先设置的污秽词词典,即由人工收集的大量污秽词构成的污秽词词典。当预设污秽词识别模型为利用深度学习技术训练而得的模型时,在获取到待显示的弹幕信息后,主播客户端可以先利用分词工具(例如条件随机场模型)对该弹幕信息进行分词处理,然后将各个词语输入至预设污秽词识别模型中进行污秽词识别,最后获得识别结果;当预设污秽词识别模型为污秽词词典,主播客户端也需要先利用分词工具对该弹幕信息进行分词处理,然后将获得的每个词语分别与污秽词词典进行匹配,若发现某个词语存在于污秽词词典中,则确定该弹幕信息为污秽弹幕,若各个词语均没有在污秽词词典中,则确定该弹幕信息为正常弹幕。此外,预设污秽词识别模型可以为基于当前终端训练或者设置的模型,也可以为基于服务器训练或设置的模型,还可以为基于任何一个具有模型训练功能的其他设备训练或设置的模型。因此,主播客户端获取预设污秽词识别模型具体实现方式可以为:获取基于当前终端训练或设置的预设污秽词识别模型;或者,接收服务器或者其他设备发送的预设污秽词识别模型。103、若识别结果为所述弹幕信息中包括污秽词,则将所述弹幕信息进行屏蔽。当识别结果为该弹幕信息中包括污秽词时,主播客户端会直接对其进行屏蔽,当识别结果为该弹幕信息中没有污秽词时,主播客户端才对该弹幕信息进行输出显示。本专利技术实施例提供的处理弹幕信息的方法,能够在客户端获取待显示的弹幕信息后,并不是直接将该弹幕信息显示在客户端界面上,而是先利用预设污秽词识别模型对该弹幕信息进行污秽识别操作,当确定该弹幕信息中没有污秽词时,才进行显示,而当确定该弹幕信息中包括污秽词时,直接对其进行屏蔽。由此可知,本专利技术实施例能够对污秽弹幕进行自动识别与屏蔽,而无需用户进行手动屏蔽,从而简化了用户操作,提高了屏蔽污秽弹本文档来自技高网...
处理弹幕信息的方法、装置及系统

【技术保护点】
一种处理弹幕信息的方法,其特征在于,所述方法包括:获取待显示的弹幕信息;利用预设污秽词识别模型对所述弹幕信息进行污秽识别;若识别结果为所述弹幕信息中包括污秽词,则将所述弹幕信息进行屏蔽。

【技术特征摘要】
1.一种处理弹幕信息的方法,其特征在于,所述方法包括:获取待显示的弹幕信息;利用预设污秽词识别模型对所述弹幕信息进行污秽识别;若识别结果为所述弹幕信息中包括污秽词,则将所述弹幕信息进行屏蔽。2.根据权利要求1所述的方法,其特征在于,所述预设污秽词识别模型为利用深度学习技术训练而得的网络结构模型;或者,所述预设污秽词识别模型为预先设置的污秽词词典。3.根据权利要求2所述的方法,其特征在于,在利用预设污秽词识别模型对所述弹幕信息进行污秽识别之前,所述方法还包括:接收服务器发送的预设污秽词识别模型;或者,获取基于当前终端训练或设置的预设污秽词识别模型。4.根据权利要求3所述的方法,其特征在于,若所述预设污秽词识别模型为利用深度学习技术训练而得的网络结构模型,则在获取基于当前终端训练的预设污秽词识别模型之前,所述方法还包括:获取训练样本;对所述训练样本中的语句进行分词处理;利用所述深度学习技术对处理后的训练样本进行模型训练,获得所述预设污秽词识别模型。5.一种处理弹幕信息的方法,其特征在于,所述方法包括:获取训练样本;对所述训练样本中的语句进行分词处理;利用深度学习技术对处理后的训练样本进行模型训练,获得预设污秽词识别模型;将所述预设污秽词识别模型发送给客户端,以便所述客户端利用所述预设污秽词识别模型对弹幕信息进行污秽识别操作。6.一种处理弹幕信息的装置,其特征在于,所述装置包括:获取单元,用于获取待显示的弹幕信息;识别单元,用于利用预设污秽词识别模型对所述获取单元获得的所述弹幕信息进行污秽识别;屏蔽单元,用于当所述识别单元的识别结果为所述弹幕信息中包括污秽词时,将所述弹幕信息进行屏蔽。7.根据权利要求6所述的装置,其特征在于,所述预设污秽词识别模型为利用深度学习技术训练而得的网络结构模型...

【专利技术属性】
技术研发人员:崔建勇
申请(专利权)人:乐视控股北京有限公司乐视致新电子科技天津有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1