视频弹幕过滤方法及装置制造方法及图纸

技术编号:12897432 阅读:50 留言:0更新日期:2016-02-24 08:51
本发明专利技术实施例提供了一种视频弹幕过滤方法及装置。所述方法的一具体实施方式包括:获取待推送的当前视频弹幕文本和目标用户;判断每个目标用户是否设置有过滤条件;当目标用户设置有过滤条件时,采用所述预设语义分析方法对所述待推送的当前视频弹幕的文本进行语义分析,确定当前视频弹幕文本的语义框架;根据当前视频弹幕文本的语义框架和至少一个用于过滤的语义框架,计算所述当前视频弹幕文本的语义框架和每个所述用于过滤的语义框架的语义相似度;基于所述语义相似度,确定是否对该目标用户过滤所述当前视频弹幕。本实施例能够简化用户操作,提高视频弹幕过滤的效率。

【技术实现步骤摘要】

本专利技术涉及视频
,特别是涉及一种视频弹幕过滤方法及装置
技术介绍
弹幕是指当用户观看视频的时候,其它用户的各种评论会从屏幕上方缓缓滚动过去。一些热门视频很多时候整个视频窗口都会被评论字幕所覆盖,而且随着同一时间内评论数量的增加,弹幕滚动的速度会越来越快,这将影响用户正常观看视频。另一方面,弹幕文本内容中可能一部分是用户喜欢的,还有一部分评论内容可能与用户的观点不同,是用户不喜欢的。这种情况下,用户就想要过滤掉他不喜欢的弹幕内容。现有的过滤视频弹幕的方法,用户可以在客户端设置关键词,然后采用正则匹配的方式来达到过滤的目的。使用这种方法,首先需要用户在客户端进行配置,然后基于用户配置根据正则表达式查找,根据弹幕文本和用户设置的关键词的匹配度进行视频弹幕的过滤。现有的过滤视频弹幕的方法只能将与关键词匹配的视频弹幕过滤掉,不能将与关键词语义相近的视频弹幕过滤掉。如果用户希望将与关键词语义相近的视频弹幕过滤掉,还需要再次设置与关键词语义相近的关键词。可见,现有技术的过滤视频弹幕的方法,用户操作比较繁琐,视频弹幕过滤的效率不够高。
技术实现思路
本专利技术实施例的目的在于提供一种视频弹幕过滤方法及装置,以简化用户操作,提高视频弹幕过滤的效率。具体技术方案如下:第一方面,本专利技术提供了一种视频弹幕过滤方法,应用于服务器,所述方法包括:获取待推送的当前视频弹幕文本和目标用户;判断每个目标用户是否设置有过滤条件;所述过滤条件为:服务器预先响应于用户对至少一个已推送视频弹幕执行的点击操作,采用预设语义分析方法对所述每个被用户执行点击操作的已推送视频弹幕文本进行语义分析,确定的至少一个用于过滤的语义框架;当目标用户设置有过滤条件时,采用所述预设语义分析方法对所述待推送的当前视频弹幕的文本进行语义分析,确定当前视频弹幕文本的语义框架;根据当前视频弹幕文本的语义框架和至少一个用于过滤的语义框架,计算所述当前视频弹幕文本的语义框架和每个所述用于过滤的语义框架的语义相似度;基于所述语义相似度,确定是否对该目标用户过滤所述当前视频弹幕。进一步地,所述采用所述预设语义分析方法对所述待推送的当前视频弹幕的文本进行语义分析,确定当前视频弹幕文本的语义框架包括:对所述当前视频弹幕文本进行分词和词性标注处理;根据所述处理结果,确定所述当前视频弹幕文本的句法结构和句子类型;基于所述当前视频弹幕文本的句法结构和句子类型,提取所述当前视频弹幕文本的属性信息,生成所述当前视频弹幕文本的语义框架。进一步地,所述属性信息包括以下至少一项:领域信息、情景信息和背景信息;所述基于所述当前视频弹幕文本的句法结构和句子类型,提取所述当前视频弹幕文本的属性信息,生成所述当前视频弹幕文本的语义框架,包括:计算所述当前视频弹幕文本与预设的各领域信息的特征的匹配度,将该匹配度大于第一阈值且最高时对应的领域信息确定为所述当前视频弹幕文本的领域信息;基于所述当前视频弹幕文本的句法结构和句子类型,获得与该句法结构和句子类型相匹配的句子主干内容,作为所述当前视频弹幕文本的情景信息;计算所述当前视频弹幕文本与预设的各背景信息的特征的匹配度,将该匹配度大于第二阈值且最高时对应的背景信息确定为所述当前视频弹幕文本的背景信息。进一步地,所述基于所述当前视频弹幕文本的句法结构和句子类型,提取所述当前视频弹幕文本的属性信息还包括:判断所述当前视频弹幕文本是否有语义块分离情况;若是,则对分离的语义块进行重排处理,并基于重排后的当前视频弹幕文本提取其属性信息。进一步地,所述对所述当前视频弹幕文本进行分词和词性标注处理之后还包括:根据预设的易引起歧义的数据字典,对所述分词结果进行消除歧义处理。进一步地,所述根据当前视频弹幕文本的语义框架和至少一个用于过滤的语义框架,计算所述当前视频弹幕文本的语义框架和每个所述用于过滤的语义框架的语义相似度包括:计算所述当前视频弹幕文本的语义框架和每个所述用于过滤的语义框架中各对应属性信息的属性相似度;将各属性相似度乘以预设调节因子后线性叠加,得到所述当前视频弹幕文本的语义框架和每个所述用于过滤的语义框架的语义相似度。进一步地,在计算所述当前视频弹幕文本的语义框架和每个所述用于过滤的语义框架的语义相似度之前,根据所述属性信息的数量确定各属性相似度的调节因子的取值。进一步地,所述基于所述语义相似度,确定是否对该目标用户过滤所述当前视频弹蒂包括:判断所述各语义相似度中是否有至少一个大于预设阈值;若是,则对该目标用户过滤所述当前视频弹幕;否则,向该目标用户推送所述当前视频弹幕。第二方面,本专利技术提供了一种视频弹幕过滤装置,应用于服务器,所述装置包括:获取模块,用于获取待推送的当前视频弹幕文本和目标用户;判断模块,用于判断每个目标用户是否设置有过滤条件;所述过滤条件为:服务器预先响应于用户对至少一个已推送视频弹幕执行的点击操作,采用预设语义分析装置对所述每个被用户执行点击操作的已推送视频弹幕文本进行语义分析,确定的至少一个用于过滤的语义框架;分析模块,用于当目标用户设置有过滤条件时,采用所述预设语义分析装置对所述待推送的当前视频弹幕的文本进行语义分析,确定当前视频弹幕文本的语义框架;计算模块,用于根据当前视频弹幕文本的语义框架和至少一个用于过滤的语义框架,计算所述当前视频弹幕文本的语义框架和每个所述用于过滤的语义框架的语义相似度;确定模块,用于基于所述语义相似度,确定是否对该目标用户过滤所述当前视频弹幕。进一步地,所述分析模块包括:执行子模块,用于对所述当前视频弹幕文本进行分词和词性标注处理;确定子模块,用于根据所述处理结果,确定所述当前视频弹幕文本的句法结构和句子类型;提取子模块,用于基于所述当前视频弹幕文本的句法结构和句子类型,提取所述第一视频弹幕文本的属性信息,生成所述当前弹幕文本的语义框架。进一步地,所述属性信息包括以下至少一项:领域信息、情景信息和背景信息;所述提取子模块,包括:领域信息提取子模块、情景信息提取子模块和背景信息提取子模块;所述领域信息提取子模块,用于计算所述当前视频弹幕文本与预设的各领域信息的特征的匹配度,将该匹配度大于第一阈值且最高时对应的领域信息确定为所述当前视频弹幕文本的领域信息;所述情景信息提取子模块,用于基于所述当前视频弹幕文本的句法结构和句子类型,获得与该句法结构和句子类型相匹配的句子主干内容,作为所述当前视频弹幕文本的情景?目息;所述背景信息提取子模块,用于计算所述当前视频弹幕文本与预设的各背景信息的特征的匹配度,将该匹配度大于第二阈值且最高时对应的背景信息确定为所述当前视频弹幕文本的背景信息。进一步地,所述提取子模块还用于:判断所述当前视频弹幕文本是否有语义块分离情况;若是,则对分离的语义块进行重排处理,并基于重排后的当前视频弹幕文本提取其属性信息。进一步地,所述分析模块还包括:[0当前第1页1 2 3 4 5 本文档来自技高网...

【技术保护点】
一种视频弹幕过滤方法,其特征在于,应用于服务器,所述方法包括:获取待推送的当前视频弹幕文本和目标用户;判断每个目标用户是否设置有过滤条件;所述过滤条件为:服务器预先响应于用户对至少一个已推送视频弹幕执行的点击操作,采用预设语义分析方法对所述每个被用户执行点击操作的已推送视频弹幕文本进行语义分析,确定的至少一个用于过滤的语义框架;当目标用户设置有过滤条件时,采用所述预设语义分析方法对所述待推送的当前视频弹幕的文本进行语义分析,确定当前视频弹幕文本的语义框架;根据当前视频弹幕文本的语义框架和至少一个用于过滤的语义框架,计算所述当前视频弹幕文本的语义框架和每个所述用于过滤的语义框架的语义相似度;基于所述语义相似度,确定是否对该目标用户过滤所述当前视频弹幕。

【技术特征摘要】

【专利技术属性】
技术研发人员:朱柏涛
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1