大数据弹幕处理系统及方法技术方案

技术编号:21613083 阅读:36 留言:0更新日期:2019-07-13 21:00
本发明专利技术大数据弹幕处理系统包括弹幕输入模块、粗过滤模块、用户评级模块、弹幕服务器,其能够设置第二信息发送速度的上限b,其根据第二信息发送速度的上限而将发送指定百分比a的注册用户发送的第二信息转化为第三信息;流媒体服务器,其用于将流媒体与弹幕服务器的第三信息合成并发送至用户终端。本发明专利技术通过上述方式可在弹幕的根源来控制用户能够看到的弹幕,从而使大多用户看到的弹幕只是少一部分被用户评级模块、弹幕服务器筛选出的用户而发出的弹幕,以致于限制了频繁发送违法信息的用户的被更多人看到弹幕的权利,从而避免了辱骂、造谣、发送不信息等“负面词汇”的弹幕出现的概率。

Large Data Barrage Processing System and Method

【技术实现步骤摘要】
大数据弹幕处理系统及方法本专利技术专利申请是分案申请。原案的专利号是201811229455.5,申请日是2018年10月22日,专利技术名称是大数据弹幕处理系统及方法。
本专利技术涉及大数据领域,特别是涉及一种用于处理互联网视频、直播大数据的弹幕的系统。
技术介绍
弹幕(barrage),中文流行词语,指的是在网络上观看视频时弹出的评论性字幕。类似小说中行间彰显的夹批,视频中屏间飘过的评点叫做弹幕,原意指用大量或少量火炮提供密集炮击。而弹幕,顾名思义是指子弹多而形成的幕布,大量吐槽评论从屏幕飘过时效果看上去像是飞行射击游戏里的弹幕。目前,任何视频点播网站、视频直播网站的弹幕均过多,其中,不乏能够让用户增加观看体验,提升用户喜好程度,从而提高用户忠诚度和粘度的弹幕;也有恶意弹幕、广告、辱骂、造谣、散播不良信息的弹幕。在弹幕中,很多观点和立场是相对的,例如视频中“主播或作者很好”,经常刷礼物的用户输入的或希望看到的是“正面词汇”的弹幕,而习惯性辱骂主播或作者的用户往往输入的或希望看到的是“负面词汇”的弹幕,致使直播间发生争吵、辱骂而导致直播间混乱,甚至引发暴力事件。因此,目前亟需一种合理地治理大数据弹幕的处理系统。
技术实现思路
本专利技术要解决的技术问题是提供一种合理地治理大数据弹幕的处理系统。本专利技术大数据弹幕处理系统,包括弹幕输入模块,其用于登陆注册用户,并采集注册用户输入的第一信息;粗过滤模块,其与第一大数据库连接,其根据弹幕输入模块采集的第一信息,而与第一大数据库进行对比,若第一信息与第一大数据库中的信息一致,则删除第一信息,若不一致,则将其转化为第二信息;用户评级模块,其根据注册用户输入的第一信息被所述粗过滤模块判定与所述第一大数据库中的信息一致的第一信息的数量与所述注册用户发送第一信息的总数量的百分比a;弹幕服务器,其能够设置第二信息发送速度的上限b,其根据第二信息发送速度的上限而将发送指定百分比a的注册用户发送的第二信息转化为第三信息;流媒体服务器,其用于将流媒体与弹幕服务器的第三信息合成并发送至用户终端。本专利技术大数据弹幕处理系统,其中所述弹幕服务器第二大数据库连接,所述第二大数据库中设有与第二信息对应的两个或多个同义词数据,当所述单位时间的指定百分比a的注册用户的第二信息的数量未达到上限b时,所述弹幕服务器根据第二大数据库生成与第二信息对应的同义词数据,以达到单位时间内的第二数据与同义词数据之和的数量与上限b相同,所述弹幕服务器将与所述第二信息对应的同义词数据和第二信息转化为第三信息。本专利技术大数据弹幕处理系统,其中所述弹幕服务器与第三大数据库连接,所述第三大数据库中设有与第二信息对应的至少一个第三数据,当所述弹幕服务器判定所述弹幕输入模块采集的第二信息是否与第三大数据库中的第三数据对应的第二信息一致,若一致,则弹幕服务器将所述第三数据转化为第三信息。本专利技术大数据弹幕处理系统,其中所述弹幕服务器与第四大数据库连接,当所述注册用户的百分比a低于预设阈值c时,则弹幕服务器判定所述注册用户输入的第二信息是否与所述第四大数据库中的第二信息一致,若一致,则弹幕服务器将所述第二信息转化为第三信息;其中,所述弹幕服务器根据所述注册用户的输入弹幕总数量d、10分钟内输入弹幕数量q、注册用户总在线时长f、用户此次在线时长p、用户年龄h、用户性别j,按如下公式输出阈值c:其中,所述弹幕总数量d的单位为条;所述10分钟内输入弹幕数量q的单位为条;所述注册用户总在线时长f的单位为小时;所述用户此次在线时长p的单位为分钟;所述用户年龄h的单位为周岁;所述用户性别j分别为:男性0.7,女性1.1。本专利技术大数据弹幕处理系统,其中所述当所述注册用户的百分比a低于预设阈值c时,所述注册用户每次发送次数最多的第二信息输入第一大数据库。本专利技术大数据弹幕处理系统的处理方法,包括如下步骤:S100、登录注册用户并采集所述注册用户输入的第一信息;S200、将与第一大数据库中的第一信息不一致的第一信息转化为第二信息;S300、根据所述注册用户输入的第一信息被判定与所述第一大数据库中的信息一致的第一信息的数量与所述注册用户发送第一信息的总数量的百分比aS400、设置第二信息发送速度的上限b,其根据第二信息发送速度的上限而将发送指定百分比a的注册用户发送的第二信息转化为第三信息;S500、将流媒体与弹幕服务器的第三信息合成并发送至用户终端。本专利技术大数据弹幕处理系统与现有技术不同之处在于本专利技术大数据弹幕处理系统通过上述方式可在弹幕的根源来控制用户能够看到的弹幕,从而使大多用户看到的弹幕只是少一部分被用户评级模块、弹幕服务器筛选出的用户而发出的弹幕,以致于限制了频繁发送违法信息的用户的被更多人看到弹幕的权利,从而避免了辱骂、造谣、发送不信息等“负面词汇”的弹幕出现的概率。以致于更好的对于大数据弹幕的治理,使弹幕更加和谐、增加流媒体的用户忠诚度和用户粘度。下面结合附图对本专利技术的大数据弹幕处理系统作进一步说明。附图说明图1是大数据弹幕处理系统的电路连接图。具体实施方式如图1所示,本专利技术大数据弹幕处理系统包括弹幕输入模块,其用于登陆注册用户,并采集注册用户输入的第一信息;粗过滤模块,其与第一大数据库连接,其根据弹幕输入模块采集的第一信息,而与第一大数据库进行对比,若第一信息与第一大数据库中的信息一致,则删除第一信息,若不一致,则将其转化为第二信息;用户评级模块,其根据注册用户输入的第一信息被所述粗过滤模块判定与所述第一大数据库中的信息一致的第一信息的数量与所述注册用户发送第一信息的总数量的百分比a;弹幕服务器,其能够设置第二信息发送速度的上限b,其根据第二信息发送速度的上限而将发送指定百分比a的注册用户发送的第二信息转化为第三信息;流媒体服务器,其用于将流媒体与弹幕服务器的第三信息合成并发送至用户终端。本专利技术通过上述方式可在弹幕的根源来控制用户能够看到的弹幕,从而使大多用户看到的弹幕只是少一部分被用户评级模块、弹幕服务器筛选出的用户而发出的弹幕,以致于限制了频繁发送违法信息的用户的被更多人看到弹幕的权利,从而避免了辱骂、造谣、发送不信息等“负面词汇”的弹幕出现的概率。以致于更好的对于大数据弹幕的治理,使弹幕更加和谐、增加流媒体的用户忠诚度和用户粘度。例如,第一大数据库可理解为“负面词汇”数据库,粗过滤模块将弹幕输入模块采集到的第一信息进行第一次筛选,从而将较为直接的负面词汇过滤掉,过滤后的第二信息可为较为安全的词汇或正面词汇,弹幕服务器用户需要发送的弹幕的速度的上限b在弹幕服务器上设定好,再根据上限b越低而发送越低百分比a的注册用户发送的弹幕,从而过滤掉了习惯性网络暴力的用户,而净化了弹幕的安全性和提升了观感。其中,弹幕服务器被用户或管理员设置第二信息发送速度的上限,弹幕服务器根据第二信息发送速度的上限b越少而将发送百分比a越低的注册用户发送的第二信息转化为第三信息。这样可更好地筛选注册用户。例如,模式上限b(个每秒)指定百分比a少弹幕模式1.20~5%中弹幕模式2.45.01%~10%多弹幕模式3.610.01%~20%其中百分比a保留百分位。其中,上述模式可由用户设置,其中若每个模式中的注册用户的百分比a超过了上限b,则由百分比a少至多,择优选择注册本文档来自技高网...

【技术保护点】
1.一种大数据弹幕处理系统,其特征在于:包括弹幕输入模块,其用于登陆注册用户,并采集注册用户输入的第一信息;粗过滤模块,其与第一大数据库连接,其根据弹幕输入模块采集的第一信息,而与第一大数据库进行对比,若第一信息与第一大数据库中的信息一致,则删除第一信息,若不一致,则将其转化为第二信息;用户评级模块,其根据注册用户输入的第一信息被所述粗过滤模块判定与所述第一大数据库中的信息一致的第一信息的数量与所述注册用户发送第一信息的总数量的百分比a;弹幕服务器,其能够设置第二信息发送速度的上限b,其根据第二信息发送速度的上限而将发送指定百分比a的注册用户发送的第二信息转化为第三信息;流媒体服务器,其用于将流媒体与弹幕服务器的第三信息合成并发送至用户终端;所述弹幕服务器与第四大数据库连接,当所述注册用户的百分比a低于预设阈值c时,则弹幕服务器判定所述注册用户输入的第二信息是否与所述第四大数据库中的第二信息一致,若一致,则弹幕服务器将所述第二信息转化为第三信息;其中,所述弹幕服务器根据所述注册用户的输入弹幕总数量d、10分钟内输入弹幕数量q、注册用户总在线时长f、用户此次在线时长p、用户年龄h、用户性别j,按如下公式输出阈值c:...

【技术特征摘要】
1.一种大数据弹幕处理系统,其特征在于:包括弹幕输入模块,其用于登陆注册用户,并采集注册用户输入的第一信息;粗过滤模块,其与第一大数据库连接,其根据弹幕输入模块采集的第一信息,而与第一大数据库进行对比,若第一信息与第一大数据库中的信息一致,则删除第一信息,若不一致,则将其转化为第二信息;用户评级模块,其根据注册用户输入的第一信息被所述粗过滤模块判定与所述第一大数据库中的信息一致的第一信息的数量与所述注册用户发送第一信息的总数量的百分比a;弹幕服务器,其能够设置第二信息发送速度的上限b,其根据第二信息发送速度的上限而将发送指定百分比a的注册用户发送的第二信息转化为第三信息;流媒体服务器,其用于将流媒体与弹幕服务器的第三信息合成并发送至用户终端;所述弹幕服务器与第四大数据库连接,当所述注册用户的百分比a低于预设阈值c时,则弹幕服务器判定所述注册用户输入的第二信息是否与所述第四大数据库中的第二信息一致,若一致,则弹幕服务器将所述第二信息转化为第三信息;其中,所述弹幕服务器根据所述注册用户的输入弹幕总数量d、10分钟内输入弹幕数量q、注册用户总在线时长f、用户此次在线时长p、用户年龄h、用户性别j,按如下公式输出阈值c:其中,所述弹幕总数量d的单位为条;所述10分钟内输入弹幕数量q的单位为条;所述注册用户总在线时长f的单位为小时;所述用户此次在线时长p的单位为分钟;所述用户年龄h的单位为周岁;所述用户性别j分别为:男性0.7,女性1.1。2.根据权利要求1所述的大数据弹幕处理系统,其特征在于:所述弹幕服务器第二大数据库连接,所述第二大数据库中设有与第二信息对应的两个或多个同义词数据,当所述单位时间的指定百分比a的注册用户的第二信息的数量未达到上限b时,所述弹幕服务器根据第二大数据库生成与第二信息对应的同义词数据,以达到单位时间内的第二数据与同义词数据之和的数量与上限b相同,所述弹幕服务器将与所述第二信息...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:北京洛必达科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1