当前位置: 首页 > 专利查询>王雪峰专利>正文

人工智能大数据分析处理系统及方法技术方案

技术编号:26304588 阅读:18 留言:0更新日期:2020-11-10 20:00
本发明专利技术人工智能大数据分析处理系统包括数据获取部、场景捕捉部、数据补偿部、数据处理部,其根据观众用户在所述主播用户的流媒体上发送的在时间轨道上第一预设时间内的弹幕数据的词性而生成第一数据或第二数据。本发明专利技术通过方式而将每个观众用户发送弹幕的不同喜好结合主播用户的不同背景音乐、语音和/或画面的场景而有针对性地生成用户补偿屏幕上显示的第一数据的弹幕或删除第二数据的弹幕,以使与主播用户的流媒体合成的弹幕不会过多或多少,并符合观众用户观看的喜好,增加用户粘性。

【技术实现步骤摘要】
人工智能大数据分析处理系统及方法
本专利技术涉及一种大数据系统,特别是涉及一种用于大数据的分析处理系统。
技术介绍
弹幕(danmaku),中文流行词语,指的是在网络上观看视频时弹出的评论性字幕。其通常是将其与主播发送的音乐、点播视频、直播视频、直播音频、直播ppt画面、静态照片等合成后同时发送至观众,并且,观众可随意发送弹幕进行评论。然而,弹幕的评论性往往带有感情色彩,人们对于一个事务的观点往往是多面性的,为了尽量让用户看到与观点立场相似的观点,以避免骂战、人身攻击等网络暴力,弹幕分布均匀不会影响观看体验,不会因局部弹幕较少而使用户丧失观看兴趣,以增加用户粘性。因此,目前亟需一种更加能够增加用户粘性的、增加用户好感的人工智能大数据分析处理系统。
技术实现思路
本专利技术要解决的技术问题是提供一种更加能够增加用户粘性的、增加用户好感的人工智能大数据分析处理系统。本专利技术人工智能大数据分析处理系统,包括数据获取部,其用于输入观众用户的在时间轨道上的弹幕数据;场景捕捉部,其根据主播用户的背景音乐、语音和/或画面而生成在时间轨道上的场景数据;数据补偿部,其根据当前时间轨道上的最大同时显示个数和弹幕数据的个数而在弹幕数据上增加第一数据或删除第二数据而使弹幕数据的个数与所述最大显示个数一致;数据处理部,其根据观众用户在所述主播用户的流媒体上发送的在时间轨道上第一预设时间内的弹幕数据的词性而生成第一数据或第二数据。本专利技术人工智能大数据分析处理系统,其中所述数据处理部比较观众用户在时间轨道上的弹幕数据中正向词性和反向词性的数量,当所述正向词性大于或等于反向词性时,则将所述反向词性替换为正向词性或填充词性,当所述反向词性大于正向词性时,则将所述正向词性替换为反向词性或填充词性。本专利技术人工智能大数据分析处理系统,其中所述数据处理部比较场景捕捉部捕获的时间轨道上的单位时间内的场景数据中的正向词性的数量和反向词性的数量,当正向词性的数量大于等于反向词性的数量,则判定该单位时间内场景数据是正向场景数据,当反向词性数量大于正向词性数量,则判定该单位时间内场景数据是反向场景数据;当场景数据为正向场景数据时,则将观众用户的时间轨道上的该单位时间内的弹幕数据中的反向词性替换为正向词性或填充词性,当场景数据为反向场景数据时,则将观众用户的时间轨道上的该点位时间内的弹幕数据中的正向词性替换为反向词性。本专利技术人工智能大数据分析处理系统,其中所述数据处理部比较场景捕捉部捕获的时间轨道上的单位时间内的场景数据中的正向词性的数量和反向词性的数量,当正向词性的数量大于等于反向词性的数量,则判定该单位时间内场景数据是正向场景数据,当反向词性数量大于正向词性数量,则判定该单位时间内场景数据是反向场景数据;当在上述主播用户中的多个观众用户中显示在时间轨道上的弹幕数据的观众用户输入的弹幕数据的正向词性大于或等于反向词性时,则在该观众用户显示的正向场景数据的弹幕数据的反向词汇替换为正向词汇;当在上述主播用户中的多个观众用户中显示在时间轨道上的弹幕数据的观众用户输入的弹幕数据的反向词性大于正向词性时,则在该观众用户显示的反向场景数据的弹幕数据的正向词汇替换为反向词汇。本专利技术人工智能大数据分析处理系统,其中所述场景数据捕捉部通过音频识别软件识别背景音乐的歌名、歌词,并在所述背景音乐持续时间内,将其歌名做为所述背景音乐持续时间内的场景数据;并在单句歌词出现的持续时间内,将所述单句歌词的每个单词拆分为单句歌词出现的持续时间内的场景数据;所述数据处理部根据所述背景音乐持续时间或单句歌词出现的持续时间切换所述时间轨道上的单位时间。本专利技术人工智能大数据分析处理系统,其中所述场景数据捕捉部通过音频识别软件识别主播用户的语音,并在相邻的两句或多句语音间隔低于第二预设阈值时,将上述两句或多句合并为一个句段,再将上述句段的拆分为所述句段持续时间内的场景数据;所述数据处理部将所述所述句段持续时间配置为时间轨道上的单位时间;其中,当所述音频识别软件能够同时识别主播用户的语音和背景音乐时,场景数据捕捉部对比主播用户的语音和背景音乐的响度而通过响度较大的为判定单位时间。本专利技术人工智能大数据分析处理系统,其中当所述流媒体为视频时,所述场景捕捉部通过视频识别软件识别主播用户的视频的文字数据,并在当在时间轨道上所述文字数据出现的时间超过第三阈值时,则将所述文字数据转化为拆分为所述文字数据持续时间内的场景数据;当所述视频被视频识别软件在相同时间识别出至少两个文字数据时,场景捕捉部将所述至少两个文字数据的最早开始时间和最晚结束时间判定为单位时间,其中所述单位时间应小于第四阈值。本专利技术人工智能大数据分析处理系统,其中当观众用户输入的弹幕数据的个数大于所述最大显示个数时,数据补偿部删除弹幕数据的第二数据,所述第二数据的个数等于所述弹幕数据的个数与所述最大显示个数的差,所述第二数据为在所述弹幕数据中的随机的填充词性或随机的任意数据;当观众用户输入的弹幕数据的个数小于所述最大显示个数时,数据补偿部补偿弹幕数据的第一数据,所述第一数据的个数等于所述最大显示个数与所述弹幕数据的个数的差,所述第一数据为所述弹幕数据中的任意数据的同义词或任意数据的相同的词或随机的填充词性。本专利技术人工智能大数据分析处理系统的处理方法,包括如下步骤:获取观众用户的在时间轨道上的弹幕数据;根据主播用户的背景音乐、语音和/或画面而生成在时间轨道上的场景数据;根据当前时间轨道上的最大同时显示个数和弹幕数据的个数而在弹幕数据上增加第一数据或删除第二数据而使弹幕数据的个数与所述最大显示个数一致;根据观众用户在所述主播用户的流媒体上发送的在时间轨道上第一预设时间内的弹幕数据的词性而生成第一数据或第二数据。本专利技术人工智能大数据分析处理系统与现有技术不同之处在于本专利技术人工智能大数据分析处理系统本专利技术通过方式而将每个观众用户发送弹幕的不同喜好结合主播用户的不同背景音乐、语音和/或画面的场景而有针对性地生成用户补偿屏幕上显示的第一数据的弹幕或删除第二数据的弹幕,以使与主播用户的流媒体合成的弹幕不会过多或多少,并符合观众用户观看的喜好,增加用户粘性。下面结合附图对本专利技术的人工智能大数据分析处理系统作进一步说明。附图说明图1是人工智能大数据分析处理系统的流程图。具体实施方式如图1所示,本专利技术人工智能大数据分析处理系统包括数据获取部,其用于输入观众用户的在时间轨道上的弹幕数据;场景捕捉部,其根据主播用户的背景音乐、语音和/或画面而生成在时间轨道上的场景数据;数据补偿部,其根据当前时间轨道上的最大同时显示个数和弹幕数据的个数而在弹幕数据上增加第一数据或删除第二数据而使弹幕数据的个数与所述最大显示个数一致;数据处理部,其根据观众用户在所述主播用户的流媒体上发送的在时间轨道上第一预设时间内的弹幕数据的本文档来自技高网...

【技术保护点】
1.一种人工智能大数据分析处理系统,其特征在于:包括/n数据获取部,其用于输入观众用户的在时间轨道上的弹幕数据;/n场景捕捉部,其根据主播用户的背景音乐、语音和/或画面而生成在时间轨道上的场景数据;/n数据补偿部,其根据当前时间轨道上的最大同时显示个数和弹幕数据的个数而在弹幕数据上增加第一数据或删除第二数据而使弹幕数据的个数与所述最大显示个数一致;/n数据处理部,其根据观众用户在所述主播用户的流媒体上发送的在时间轨道上第一预设时间内的弹幕数据的词性而生成第一数据或第二数据。/n

【技术特征摘要】
1.一种人工智能大数据分析处理系统,其特征在于:包括
数据获取部,其用于输入观众用户的在时间轨道上的弹幕数据;
场景捕捉部,其根据主播用户的背景音乐、语音和/或画面而生成在时间轨道上的场景数据;
数据补偿部,其根据当前时间轨道上的最大同时显示个数和弹幕数据的个数而在弹幕数据上增加第一数据或删除第二数据而使弹幕数据的个数与所述最大显示个数一致;
数据处理部,其根据观众用户在所述主播用户的流媒体上发送的在时间轨道上第一预设时间内的弹幕数据的词性而生成第一数据或第二数据。


2.根据权利要求1所述的人工智能大数据分析处理系统,其特征在于:所述数据处理部比较观众用户在时间轨道上的弹幕数据中正向词性和反向词性的数量,当所述正向词性大于或等于反向词性时,则将所述反向词性替换为正向词性或填充词性,当所述反向词性大于正向词性时,则将所述正向词性替换为反向词性或填充词性。


3.根据权利要求1所述的人工智能大数据分析处理系统,其特征在于:所述数据处理部比较场景捕捉部捕获的时间轨道上的单位时间内的场景数据中的正向词性的数量和反向词性的数量,当正向词性的数量大于等于反向词性的数量,则判定该单位时间内场景数据是正向场景数据,当反向词性数量大于正向词性数量,则判定该单位时间内场景数据是反向场景数据;
当场景数据为正向场景数据时,则将观众用户的时间轨道上的该单位时间内的弹幕数据中的反向词性替换为正向词性或填充词性,当场景数据为反向场景数据时,则将观众用户的时间轨道上的该点位时间内的弹幕数据中的正向词性替换为反向词性。


4.根据权利要求1所述的人工智能大数据分析处理系统,其特征在于:所述数据处理部比较场景捕捉部捕获的时间轨道上的单位时间内的场景数据中的正向词性的数量和反向词性的数量,当正向词性的数量大于等于反向词性的数量,则判定该单位时间内场景数据是正向场景数据,当反向词性数量大于正向词性数量,则判定该单位时间内场景数据是反向场景数据;
当在上述主播用户中的多个观众用户中显示在时间轨道上的弹幕数据的观众用户输入的弹幕数据的正向词性大于或等于反向词性时,则在该观众用户显示的正向场景数据的弹幕数据的反向词汇替换为正向词汇;
当在上述主播用户中的多个观众用户中显示在时间轨道上的弹幕数据的观众用户输入的弹幕数据的反向词性大于正向词性时,则在该观众用户显示的反向场景数据的弹幕数据的正向词汇替换为反向词汇。


5.根据权利要求3或4所述的人工智能大数据分析处理系统,其特征在于:所述场景数据捕捉部通过音频识别软件识别背景音乐的歌名、歌词,并在所述背景音乐...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:王雪峰
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1