一种确定流媒体中热点内容的时间点的方法及装置制造方法及图纸

技术编号:13905068 阅读:99 留言:0更新日期:2016-10-26 05:56
本发明专利技术实施例公开了一种确定流媒体中热点内容的时间点的方法和装置,包括:按照预设的规则将流媒体划分多个时间段;针对每个时间段,对该时间段内的弹幕进行分词;统计每个分词的词频,确定该时间段对应的弹幕主题词;并确定该时间段对应的弹幕主题词的出现频率;根据每个时间段对应的弹幕主题词的出现频率,及保存的频率均值,识别出现频率大于所述频率均值的时间段;在识别出的时间段中,根据对应的弹幕主题词在该时间段内每个时间点出现的频率,将出现频率最大值对应的时间点确定为热点内容的时间点。使用本发明专利技术实施例,能够提高确定流媒体中热点内容的时间点的效率和准确性。

【技术实现步骤摘要】

本专利技术涉及流媒体
,尤其涉及一种确定流媒体中内容爆点的方法及装置。
技术介绍
现有的流媒体中内容爆点的确定如视频看点等主要依赖人工来编辑打点确定,由于编辑者对内容的敏感度不同,设置的看点与大多数用户的关注点可能存在误差,不能正确反映出用户真实感兴趣的话题;且单个流媒体的爆点一经设定一般不会再持续进行更新,当某些时效性的热点话题发生变化时相应的爆点内容不能有效的展示出来。可见,在现有技术中,这种依赖人工来编辑打点确定流媒体中内容爆点的方法,效率低,误差大且更新不及时。
技术实现思路
本专利技术实施例公开了一种确定流媒体中内容爆点的方法及装置,以提高确定流媒体中内容爆点的效率,提高确定流媒体中内容爆点的准确性。为达到上述目的,本专利技术实施例公开了一种确定流媒体中内容爆点的方法,应用于服务器,所述方法包括:按照预设的规则将流媒体划分多个时间段;针对每个时间段,对该时间段内的弹幕进行分词;统计该时间段内每个分词的词频,确定该时间段对应的弹幕主题词;并确定该时间段对应的弹幕主题词的出现次数;根据每个时间段对应的弹幕主题词的出现次数,及保存的频率均值,识别弹幕主题词出现次数大于所述频率均值的时间段;在识别出的时间段中,根据对应的弹幕主题词在该时间段内每个时间点出现的次数,将出现次数最大值对应的时间点确定为内容爆点。较佳地,所述按照预设的规则将流媒体划分多个时间段之前,所述方法还包括:判断用户针对流媒体发送的弹幕数量是否大于预设的数量额定值,当所述弹幕数量大于预设的数量额定值时,进行所述按照预设的规则将流媒体划分多个时间段的步骤。较佳地,所述对该时间段内的弹幕进行分词之前,所述方法还包括:对该时间段内的弹幕进行过滤。较佳地,所述对该时间段内的弹幕进行过滤包括:判断该时间段内的每个弹幕与保存的无意义语句词表中的内容是否相同;如果相同,则过滤该弹幕。较佳地,所述对该时间段内的弹幕进行分词之前,所述方法还包括:针对每个时间段,判断该时间段内的弹幕数量是否大于设定的数量阈值,如果是,则进行所述对该时间段内的弹幕进行分词的步骤。较佳地,所述将出现次数最大值对应的时间点确定为内容爆点之后,所述方法还包括:将确定的每个内容爆点保存在所述流媒体中,并针对每个内容爆点保存该内容爆点对应的弹幕。较佳地,所述方法还包括:将识别出的时间段对应的弹幕主题词确定为该内容爆点的爆点主题词。为达到上述目的,本专利技术实施例还公开了一种确定流媒体中内容爆点的装置,应用于服务器,所述装置包括:划分模块,用于按照预设的规则将流媒体划分多个时间段;处理模块,用于针对每个时间段,对该时间段内的弹幕进行分词;统计每个时间段内每个分词的词频,确定该时间段对应的弹幕主题词;并确定该时间段对应的弹幕主题词的出现次数;识别模块,用于根据每个时间段对应的弹幕主题词的出现次数,及保存的
频率均值,识别弹幕主题词出现次数大于所述频率均值的时间段;第一确定模块,用于根据对应的弹幕主题词在该时间段内每个时间点出现的次数,将出现次数最大值对应的时间点确定为内容爆点。较佳地,所述装置还包括:第一判断模块,用于判断用户针对流媒体发送的弹幕数量是否大于预设的数量额定值,当所述弹幕数量大于预设的数量额定值时,进行所述按照预设的规则将流媒体划分多个时间段的步骤。过滤模块,用于在对每个时间段内的弹幕进行分词之前对该时间段内的弹幕进行过滤。较佳地,所述过滤模块具体用于:判断该时间段内的每个弹幕与保存的无意义语句词表中的内容是否相同;如果相同,则过滤该弹幕。较佳地,所述装置还包括:第二判断模块,用于针对每个时间段,判断该时间段内的弹幕数量是否大于设定的数量阈值,如果是,则进行所述对该时间段内的弹幕进行分词的步骤。保存模块,用于将出现次数最大值对应的时间点确定为内容爆点之后,将确定的每个内容爆点保存在所述流媒体中,并针对每个内容爆点保存该内容爆点对应的弹幕。第二确定模块,用于将识别出的时间段对应的弹幕主题词确定为该内容爆点的爆点主题词。本专利技术实施例提供了一种确定流媒体中内容爆点的方法和装置,该方法中按照预设的规则将流媒体划分多个时间段;针对每个时间段,对该时间段内的弹幕进行分词;统计每个时间段内每个分词的词频,确定该时间段对应的弹幕主题词;并确定该时间段对应的弹幕主题词的出现次数;根据每个时间段对应的弹幕主题词的出现次数,及保存的频率均值,识别弹幕主题词出现次数大于所述频率均值的时间段;在识别出的时间段中,根据对应的弹幕主题词在该时间段内每个时间点出现的次数,将出现次数最大值对应的时间点确定为内容爆
点。本专利技术实施例是基于用户弹幕内容确定内容爆点,这是因为用户对感兴趣的内容输入的弹幕也会比较多,因此根据流媒体中每个时间段内弹幕主题词的出现次数,可以准确的确定出用户感兴趣的内容爆点,从而使确定出的内容爆点更加准确,另外,由于本专利技术实施例中该内容爆点可以按照上述方式灵活确定,如果弹幕内容发生了变化,也能够及时、准确的确定出变化后的内容爆点。当然,实施本专利技术的任一产品或方法必不一定需要同时达到以上所述的所有优点。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种确定流媒体中内容爆点的方法流程示意图;图2为本专利技术实施例提供的另一种确定流媒体中内容爆点的方法流程示意图;图3为本专利技术实施例提供的一种确定流媒体中内容爆点的装置结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例公开了一种确定流媒体中内容爆点的方法及装置,下面进行详细说明。图1为本专利技术实施例的确定流媒体中内容爆点的方法流程示意图,应用于服务器,包括以下步骤:步骤S101:按照预设的规则将流媒体划分多个时间段。划分规则可以预先自行设定,可以是将流媒体均匀的划分为多个时间段,或是将流媒体不均匀的划分为多个时间段,具体预设划分规则如何设定,本专利技术实施例不作限定。步骤S102:针对每个时间段,对该时间段内的弹幕进行分词;统计该时间段内每个分词的词频,确定该时间段对应的弹幕主题词;并确定该时间段对应的弹幕主题词的出现次数。弹幕为用户在观看流媒体内容时针对流媒体发送的评论内容,其能够正确反映出用户真实感兴趣的话题。不同的弹幕发送的时间可能会有所区别,但是每个弹幕都只会在流媒体上特定的一个时间点出现,因此在流媒体上相同时间点会出现一定数量的弹幕且出现的弹幕基本上具有相同的主题。由于用户发送的弹幕与流媒体是同步实时更新的,因此弹幕与流媒体有着时间上的对应关系,即在流媒体上每个时间段内会对应积累有一定数量的用户针对流媒体发送的弹幕。对流媒体上每个时间段内的弹幕进行分词,分词技术属于现有技术,本专利技术实施例不赘述。对弹幕进行分词之后,统计每个时间段内每个分词的词本文档来自技高网
...

【技术保护点】
一种确定流媒体中内容爆点的方法,其特征在于,应用于服务器,所述方法包括:按照预设的规则将流媒体划分多个时间段;针对每个时间段,对该时间段内的弹幕进行分词;统计该时间段内每个分词的词频,确定该时间段对应的弹幕主题词;并确定该时间段对应的弹幕主题词的出现次数;根据每个时间段对应的弹幕主题词的出现次数,及保存的频率均值,识别弹幕主题词出现次数大于所述频率均值的时间段;在识别出的时间段中,根据对应的弹幕主题词在该时间段内每个时间点出现的次数,将出现次数最大值对应的时间点确定为内容爆点。

【技术特征摘要】
1.一种确定流媒体中内容爆点的方法,其特征在于,应用于服务器,所述方法包括:按照预设的规则将流媒体划分多个时间段;针对每个时间段,对该时间段内的弹幕进行分词;统计该时间段内每个分词的词频,确定该时间段对应的弹幕主题词;并确定该时间段对应的弹幕主题词的出现次数;根据每个时间段对应的弹幕主题词的出现次数,及保存的频率均值,识别弹幕主题词出现次数大于所述频率均值的时间段;在识别出的时间段中,根据对应的弹幕主题词在该时间段内每个时间点出现的次数,将出现次数最大值对应的时间点确定为内容爆点。2.根据权利要求1所述的方法,其特征在于,所述按照预设的规则将流媒体划分多个时间段之前,所述方法还包括:判断用户针对流媒体发送的弹幕数量是否大于预设的数量额定值,当所述弹幕数量大于预设的数量额定值时,进行所述按照预设的规则将流媒体划分多个时间段的步骤。3.根据权利要求1所述的方法,其特征在于,所述对该时间段内的弹幕进行分词之前,所述方法还包括:对该时间段内的弹幕进行过滤。4.根据权利要求3所述的方法,其特征在于,所述对该时间段内的弹幕进行过滤包括:判断该时间段内的每个弹幕与保存的无意义语句词表中的内容是否相同;如果相同,则过滤该弹幕。5.根据权利要求1所述的方法,其特征在于,所述对该时间段内的弹幕进行分词之前,所述方法还包括:针对每个时间段,判断该时间段内的弹幕数量是否大于设定的数量阈值,
\t如果是,则进行所述对该时间段内的弹幕进行分词的步骤。6.根据权利要求1所述的方法,其特征在于,所述将出现次数最大值对应的时间点确定为内容爆点之后,所述方法还包括:将确定的每个内容爆点保存在所述流媒体中,并针对每个内容爆点保存该内容爆点对应的弹幕。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:将识别出的时间段对应的弹幕主题词确定为该内容爆点的爆点主题词。8.一种确...

【专利技术属性】
技术研发人员:王晨曦汪强杨琛
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1