一种基于人工智能的直播视频大数据精准推荐方法及系统技术方案

技术编号:33501174 阅读:12 留言:0更新日期:2022-05-19 01:11
本发明专利技术公开了一种基于人工智能的直播视频大数据精准推荐方法及系统,涉及数据识别分析技术领域。该方法包括:选取并对基准直播视频进行识别;挑选核心基准关键帧图像;识别得到核心基准高频词汇;对待识别直播视频进行识别;挑选并对待识别核心关键帧图像进行识别,得到目标高频词汇;若至少存在一个核心基准高频词汇与目标高频词汇相同,则进行显著性检测,基于正负样本采用谱聚类方法进行聚类,确定待识别直播视频是否为目标推荐直播视频。本发明专利技术利用关键帧检测、代表性关键帧图像选取方法对直播视频中核心帧图像进行有效选取,并将基于OCR的高频词汇匹配方法和聚类方法进行结合,有效精准判别,为用户精准推荐相关视频数据。据。据。

【技术实现步骤摘要】
一种基于人工智能的直播视频大数据精准推荐方法及系统


[0001]本专利技术涉及数据识别分析
,具体而言,涉及一种基于人工智能的直播视频大数据精准推荐方法及系统。

技术介绍

[0002]随着数字媒体产业的高速发展,直播视频已经越来越广泛地被大众所认可。民众可以从直播视频中挑选喜爱的商品、学习自己喜爱的课程、领略世界各地的人文景观等,极大地丰富和便利了民众的业余生活。同时,随着直播视频大数据数量爆炸式增长,如何在海量直播视频数据的情况下针对民众需求给民众精准推荐有价值的直播视频成为了新的问题。
[0003]传统的视频检索方法虽然能够检索及推荐部分有价值的直播视频,但传统的方法的检索推荐精准度不高,且无法根据民众的需求进行有针对性的推荐。人工智能领域作为近几年的热门研究领域,其中的多项经典技术可以有助于实现直播大数据的精准推荐。如何充分利用人工智能领域中的技术,实现直播视频大数据的精准推荐成为一个亟需解决的问题。

技术实现思路

[0004]为了克服上述问题或者至少部分地解决上述问题,本专利技术实施例提供一种基于人工智能的直播视频大数据精准推荐方法及系统,利用关键帧检测技术、代表性关键帧图像选取方法对直播视频中核心帧图像进行有效选取,并在此基础上,将基于OCR的高频词汇匹配方法和K

means聚类方法进行结合,对待识别直播视频进行有效精准判别,进而为用户精准推荐相关视频数据。
[0005]本专利技术的实施例是这样实现的:第一方面,本专利技术实施例提供一种基于人工智能的直播视频大数据精准推荐方法,包括以下步骤:获取并统计目标用户的多段历史观看视频数据,生成并根据统计结果选取一段历史观看视频数据作为基准直播视频;采用关键帧检测方法对基准直播视频进行关键帧图像识别检测,以得到基准关键帧图像;利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像;采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,得到并统计核心基准高频词汇;获取并采用关键帧检测方法对网络直播平台中的任意一段待识别直播视频进行识别检测,以得到待识别关键帧图像;利用代表性关键帧图像选取方法从待识别关键帧图像中挑选得到待识别核心关
键帧图像;采用OCR识别方法对待识别核心关键帧图像中的词汇进行识别,得到并统计目标高频词汇;分别判断各个核心基准高频词汇与各个目标高频词汇是否相同,若至少存在一个核心基准高频词汇与目标高频词汇相同,则对待识别核心关键帧图像进行显著性检测,以得到显著核心关键帧图像;反之,则将该段待识别直播视频标记为非推荐直播视频;将核心基准关键帧图像作为正样本,选取网络直播平台中目标用户未观看的直播视频作为负样本;基于正样本和负样本采用谱聚类方法对显著核心关键帧图像进行聚类处理,得到聚类结果;根据聚类结果将待识别直播视频标记为目标推荐直播视频或非推荐直播视频,将目标推荐直播视频推送给对应的目标用户。
[0006]为了解决现有技术中针对直播视频数据检索识别推荐精准度不高,无法根据民众的需求进行有针对性的推荐的技术问题,本专利技术利用关键帧检测技术、代表性关键帧图像选取方法将直播视频中核心帧图像进行有效选取,保证后续数据处理的精准高效性,避免了对直播视频中所有帧图像都进行相关计算,极大地减少了计算资源消耗;并在此基础上,利用基于OCR识别的高频词汇匹配方法,基于词汇匹配对待识别直播视频进行初步判别;大大提高了判别效率。并基于K

means聚类方法,对待识别直播视频进行最终判别。通过多重方法进行判别,有效地提升了目标视频判别的精度,大大提高了后续视频推荐的精准性,若初步判别结果不理想则不进行后续判别,直接减少了计算资源的消耗。
[0007]基于第一方面,在本专利技术的一些实施例中,上述利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像的方法包括以下步骤:对基准关键帧图像进行深度自编码;计算并根据各个基准关键帧图像自编码后的欧式距离确定核心基准关键帧图像。
[0008]基于第一方面,在本专利技术的一些实施例中,上述采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,得到并统计核心基准高频词汇的方法包括以下步骤:采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,以得到多个识别词汇;根据预置的关键词汇数据集对多个识别词汇进行筛选,以得到关键词汇;统计并根据各个关键词汇出现的次数确定核心基准高频词汇。
[0009]基于第一方面,在本专利技术的一些实施例中,上述统计并根据各个关键词汇出现的次数确定核心基准高频词汇的方法包括以下步骤:统计各个关键词汇出现的次数,当关键词汇出现的次数超过预置的次数阈值时,将对应的关键词汇确定为核心基准高频词汇。
[0010]基于第一方面,在本专利技术的一些实施例中,上述对待识别核心关键帧图像进行显著性检测的方法包括以下步骤:采用ITTI模型、GBVS模型、SF模型、ST模型和FT模型其中一种或多种模型对待识别核心关键帧图像进行显著性检测。
[0011]基于第一方面,在本专利技术的一些实施例中,上述根据聚类结果将待识别直播视频
标记为目标推荐直播视频或非推荐直播视频的方法包括以下步骤:若聚类结果为与正样本聚为一类,则将待识别直播视频标记为目标推荐直播视频;若聚类结果为与负样本聚为一类,则将待识别直播视频标记为非推荐直播视频。
[0012]第二方面,本专利技术实施例提供一种基于人工智能的直播视频大数据精准推荐系统,包括基准视频选取模块、关键帧识别模块、核心基准选取模块、第一识别模块、待识别图像模块、待识别挑选模块、第二识别模块、词汇对比模块、样本选取模块、聚类处理模块以及识别推荐模块,其中:基准视频选取模块,用于获取并统计目标用户的多段历史观看视频数据,生成并根据统计结果选取一段历史观看视频数据作为基准直播视频;关键帧识别模块,用于采用关键帧检测方法对基准直播视频进行关键帧图像识别检测,以得到基准关键帧图像;核心基准选取模块,用于利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像;第一识别模块,用于采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,得到并统计核心基准高频词汇;待识别图像模块,用于获取并采用关键帧检测方法对网络直播平台中的任意一段待识别直播视频进行识别检测,以得到待识别关键帧图像;待识别挑选模块,用于利用代表性关键帧图像选取方法从待识别关键帧图像中挑选得到待识别核心关键帧图像;第二识别模块,用于采用OCR识别方法对待识别核心关键帧图像中的词汇进行识别,得到并统计目标高频词汇;词汇对比模块,用于分别判断各个核心基准高频词汇与各个目标高频词汇是否相同,若至少存在一个核心基准高频词汇与目标高频词汇相同,则对待识别核心关键帧图像进行显著性检测,以得到显著核心关键帧图像;反之,则将该段待识别直播视频标记为非推荐直播视频;样本选取模块,用于将核心基准关键帧图像作为正样本,选取网络直播平台中目标用户未观看的直播视频作为负样本;聚类处理模块,用于基于正样本和负样本采用谱聚类方法对显著核心关键帧图像进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的直播视频大数据精准推荐方法,其特征在于,包括以下步骤:获取并统计目标用户的多段历史观看视频数据,生成并根据统计结果选取一段历史观看视频数据作为基准直播视频;采用关键帧检测方法对基准直播视频进行关键帧图像识别检测,以得到基准关键帧图像;利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像;采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,得到并统计核心基准高频词汇;获取并采用关键帧检测方法对网络直播平台中的任意一段待识别直播视频进行识别检测,以得到待识别关键帧图像;利用代表性关键帧图像选取方法从待识别关键帧图像中挑选得到待识别核心关键帧图像;采用OCR识别方法对待识别核心关键帧图像中的词汇进行识别,得到并统计目标高频词汇;分别判断各个核心基准高频词汇与各个目标高频词汇是否相同,若至少存在一个核心基准高频词汇与目标高频词汇相同,则对待识别核心关键帧图像进行显著性检测,以得到显著核心关键帧图像;反之,则将该段待识别直播视频标记为非推荐直播视频;将核心基准关键帧图像作为正样本,选取网络直播平台中目标用户未观看的直播视频作为负样本;基于正样本和负样本采用谱聚类方法对显著核心关键帧图像进行聚类处理,得到聚类结果;根据聚类结果将待识别直播视频标记为目标推荐直播视频或非推荐直播视频,将目标推荐直播视频推送给对应的目标用户。2.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法,其特征在于,所述利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像的方法包括以下步骤:对基准关键帧图像进行深度自编码;计算并根据各个基准关键帧图像自编码后的欧式距离确定核心基准关键帧图像。3.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法,其特征在于,所述采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,得到并统计核心基准高频词汇的方法包括以下步骤:采用OCR识别方法对核心基准关键帧图像中的词汇进行识别,以得到多个识别词汇;根据预置的关键词汇数据集对多个识别词汇进行筛选,以得到关键词汇;统计并根据各个关键词汇出现的次数确定核心基准高频词汇。4.根据权利要求3所述的一种基于人工智能的直播视频大数据精准推荐方法,其特征在于,所述统计并根据各个关键词汇出现的次数确定核心基准高频词汇的方法包括以下步骤:统计各个关键词汇出现的次数,当关键词汇出现的次数超过预置的次数阈值时,将对应的关键词汇确定为核心基准高频词汇。
5.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法,其特征在于,所述对待识别核心关键帧图像进行显著性检测的方法包括以下步骤:采用ITTI模型、GBVS模型、SF模型、ST模型和FT模型其中一种或多种模型对待识别核心关键帧图像进行显著性检测。6.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法,...

【专利技术属性】
技术研发人员:吴新军
申请(专利权)人:北京嘉沐安科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1