弹幕处理方法及系统技术方案

技术编号:36706457 阅读:9 留言:0更新日期:2023-03-01 09:29
本申请公开了一种弹幕处理方法,该方法包括:将从弹幕数据库中获取的弹幕信息通过模型进行评估后,保存至弹幕召回池;根据客户端用户观看的视频标识和时间段,从所述弹幕召回池中获取相应弹幕信息,根据特征算法进行筛选后,展示至客户端。本申请还公开了一种弹幕处理系统、电子装置和计算机可读存储介质。由此,能够提供一种工程系统和算法系统深度结合的方案,在百亿数据量级、高并发、低延迟场景下,进行弹幕个性化推荐,并优化上屏弹幕的质量,提升用户互动体验。提升用户互动体验。提升用户互动体验。

【技术实现步骤摘要】
弹幕处理方法及系统


[0001]本申请涉及数据处理
,尤其涉及一种弹幕处理方法、系统、电子装置及计算机可读存储介质。

技术介绍

[0002]随着计算机技术的普及与发展,视频网站的用户越来越多。而在观看视频时发送弹幕进行互动,也逐渐成为视频网站用户的习惯。弹幕,指的是在网络上观看视频时弹出的评论性字幕,可以给观众一种“实时互动”的错觉。弹幕工程建设发展到现在,需要在高并发、热点场景下,保证弹幕服务的稳定和高可用,并且以优化视频消费体验为目标,筛选优质弹幕内容上屏展示,建设千人千面的弹幕推荐能力。

技术实现思路

[0003]本申请的主要目的在于提出一种弹幕处理方法、系统、电子装置及计算机可读存储介质,旨在解决如何在高并发、低延迟、高可用性、高稳定性保障的场景下,进行弹幕内容个性化推荐的问题。
[0004]为实现上述目的,本申请实施例提供了一种弹幕处理方法,所述方法包括:
[0005]将从弹幕数据库中获取的弹幕信息通过模型进行评估后,保存至弹幕召回池;
[0006]根据客户端用户观看的视频标识和时间段,从所述弹幕召回池中获取相应弹幕信息,根据特征算法进行筛选后,展示至客户端。
[0007]可选地,所述弹幕召回池包括物料池和索引池,所述物料池用于保存弹幕物料,为弹幕的基础数据;所述索引池用于保存弹幕索引,为与所述物料池对应的每条弹幕的模型评估结果。
[0008]可选地,所述方法还包括:
[0009]在无需更新粗排模型的情形下,通过索引回刷仅更新所述弹幕召回池中的弹幕索引,以实现模型策略迭代。
[0010]可选地,所述方法还包括:
[0011]在需要更新所述粗排模型的情形下,通过物料回刷同时更新所述弹幕召回池中的弹幕物料和索引,以实现模型策略迭代。
[0012]可选地,所述弹幕召回池为键值数据库,将一个视频第一预设时段内经过召回的弹幕保存在一个键对应的值中。
[0013]可选地,所述物料池和所述索引池在所述弹幕召回池中以不同的键分开存储,数据一致性通过Redis分片锁保证。
[0014]可选地,所述将从弹幕数据库中获取的弹幕信息通过模型进行评估后,保存至弹幕召回池包括:
[0015]从所述弹幕数据库中获取弹幕物料,通过粗排模型对每条弹幕进行评估;
[0016]聚合第二预设时段内的所有弹幕物料,根据评估结果对所述第二预设时段的所有
弹幕进行排序和淘汰;
[0017]针对未淘汰的弹幕通过全部模型进行评估,根据评估结果得到弹幕索引;
[0018]将未淘汰的弹幕物料列表和索引列表分别存入所述物料池和所述索引池。
[0019]可选地,所述时间段依照用户当前观看的视频播放时间点和服务端根据应用场景动态下发的分片大小进行确定。
[0020]可选地,所述根据特征算法进行筛选包括:
[0021]基于预设的特征算法,包括用户特征和视频特征,建立个性化推荐的精排逻辑,对相应弹幕通过全部模型进行评估,然后根据所述评估结果进行排序和截取,返回推荐结果。
[0022]可选地,所述索引回刷包括:
[0023]获取高热视频列表和实时增量视频列表;
[0024]将所述高热视频列表和所述实时增量视频列表对应的弹幕通过全部模型进行评估;
[0025]根据评估结果得到新的索引,将所述新的索引更新至所述弹幕召回池。
[0026]可选地,所述物料回刷包括:
[0027]获取全量弹幕和实时增量弹幕;
[0028]通过粗排模型对所述全量弹幕和所述实时增量弹幕进行评估;
[0029]根据评估结果排序和淘汰弹幕后,对未淘汰弹幕通过全部模型进行评估,得到新的索引;
[0030]将所述未淘汰弹幕的物料和新的索引更新至所述弹幕召回池。
[0031]此外,为实现上述目的,本申请实施例还提供一种弹幕处理系统,所述系统包括:
[0032]召回模块,用于将从弹幕数据库中获取的弹幕信息通过模型进行评估后,保存至弹幕召回池;
[0033]展示模块,用于根据客户端用户观看的视频标识和时间段,从所述弹幕召回池中获取相应弹幕信息,根据特征算法进行筛选后,展示至客户端。
[0034]为实现上述目的,本申请实施例还提供一种电子装置,所述电子装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的弹幕处理程序,所述弹幕处理程序被所述处理器执行时实现如上述的弹幕处理方法。
[0035]为实现上述目的,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有弹幕处理程序,所述弹幕处理程序被处理器执行时实现如上述的弹幕处理方法。
[0036]本申请实施例提出的弹幕处理方法、系统、电子装置及计算机可读存储介质,能够提供一种工程系统和算法系统深度结合的方案,在百亿数据量级、高并发、低延迟场景下,进行弹幕个性化推荐,提升数据一致性、稳定性,并优化了上屏弹幕的质量,提升了用户互动体验。
附图说明
[0037]图1为实现本申请各个实施例的一种应用环境架构图;
[0038]图2为本申请实施例中维护的两套系统的示意图;
[0039]图3为本申请第一实施例提出的一种弹幕处理方法的流程图;
[0040]图4为本申请第一实施例中弹幕发送链路的示意图;
[0041]图5为本申请第一实施例中弹幕展示链路的示意图;
[0042]图6为本申请第二实施例提出的一种弹幕处理方法的流程图;
[0043]图7为本申请第二实施例中索引回刷的示意图;
[0044]图8为本申请第二实施例中物料回刷的示意图;
[0045]图9为本申请第二实施例中模型版本控制的示意图;
[0046]图10为本申请第三实施例提出的一种电子装置的硬件架构示意图;
[0047]图11为本申请第四实施例提出的一种弹幕处理系统的模块示意图;
[0048]图12为本申请第五实施例提出的一种弹幕处理系统的模块示意图。
具体实施方式
[0049]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0050]需要说明的是,在本申请实施例中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。
[0051]请参阅图1,图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种弹幕处理方法,其特征在于,所述方法包括:将从弹幕数据库中获取的弹幕信息通过模型进行评估后,保存至弹幕召回池;根据客户端用户观看的视频标识和时间段,从所述弹幕召回池中获取相应弹幕信息,根据特征算法进行筛选后,展示至客户端。2.根据权利要求1所述的弹幕处理方法,其特征在于,所述弹幕召回池包括物料池和索引池,所述物料池用于保存弹幕物料,为弹幕的基础数据;所述索引池用于保存弹幕索引,为与所述物料池对应的每条弹幕的模型评估结果。3.根据权利要求2所述的弹幕处理方法,其特征在于,所述方法还包括:在无需更新粗排模型的情形下,通过索引回刷仅更新所述弹幕召回池中的弹幕索引,以实现模型策略迭代。4.根据权利要求2或3所述的弹幕处理方法,其特征在于,所述方法还包括:在需要更新所述粗排模型的情形下,通过物料回刷同时更新所述弹幕召回池中的弹幕物料和索引,以实现模型策略迭代。5.根据权利要求1所述的弹幕处理方法,其特征在于,所述弹幕召回池为键值数据库,将一个视频第一预设时段内经过召回的弹幕保存在一个键对应的值中。6.根据权利要求2所述的弹幕处理方法,其特征在于,所述物料池和所述索引池在所述弹幕召回池中以不同的键分开存储,数据一致性通过Redis分片锁保证。7.根据权利要求2所述的弹幕处理方法,其特征在于,所述将从弹幕数据库中获取的弹幕信息通过模型进行评估后,保存至弹幕召回池包括:从所述弹幕数据库中获取弹幕物料,通过粗排模型对每条弹幕进行评估;聚合第二预设时段内的所有弹幕物料,根据评估结果对所述第二预设时段的所有弹幕进行排序和淘汰;针对未淘汰的弹幕通过全部模型进行评估,根据评估结果得到弹幕索引;将未淘汰的弹幕物料列表和索引列表分别存入所述物料池和所述索引池。8.根据权利要求1所述的弹幕处理方法,其特征...

【专利技术属性】
技术研发人员:孙嘉岐
申请(专利权)人:上海哔哩哔哩科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1