一种基于人工智能的直播视频大数据精准推荐方法及系统技术方案

技术编号：33501174 阅读：12 留言：0更新日期：2022-05-19 01:11

本发明专利技术公开了一种基于人工智能的直播视频大数据精准推荐方法及系统，涉及数据识别分析技术领域。该方法包括：选取并对基准直播视频进行识别；挑选核心基准关键帧图像；识别得到核心基准高频词汇；对待识别直播视频进行识别；挑选并对待识别核心关键帧图像进行识别，得到目标高频词汇；若至少存在一个核心基准高频词汇与目标高频词汇相同，则进行显著性检测，基于正负样本采用谱聚类方法进行聚类，确定待识别直播视频是否为目标推荐直播视频。本发明专利技术利用关键帧检测、代表性关键帧图像选取方法对直播视频中核心帧图像进行有效选取，并将基于OCR的高频词汇匹配方法和聚类方法进行结合，有效精准判别，为用户精准推荐相关视频数据。据。据。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于人工智能的直播视频大数据精准推荐方法及系统

[0001]本专利技术涉及数据识别分析
，具体而言，涉及一种基于人工智能的直播视频大数据精准推荐方法及系统。

技术介绍

[0002]随着数字媒体产业的高速发展，直播视频已经越来越广泛地被大众所认可。民众可以从直播视频中挑选喜爱的商品、学习自己喜爱的课程、领略世界各地的人文景观等，极大地丰富和便利了民众的业余生活。同时，随着直播视频大数据数量爆炸式增长，如何在海量直播视频数据的情况下针对民众需求给民众精准推荐有价值的直播视频成为了新的问题。
[0003]传统的视频检索方法虽然能够检索及推荐部分有价值的直播视频，但传统的方法的检索推荐精准度不高，且无法根据民众的需求进行有针对性的推荐。人工智能领域作为近几年的热门研究领域，其中的多项经典技术可以有助于实现直播大数据的精准推荐。如何充分利用人工智能领域中的技术，实现直播视频大数据的精准推荐成为一个亟需解决的问题。

技术实现思路

[0004]为了克服上述问题或者至少部分地解决上述问题，本专利技术实施例提供一种基于人工智能的直播视频大数据精准推荐方法及系统，利用关键帧检测技术、代表性关键帧图像选取方法对直播视频中核心帧图像进行有效选取，并在此基础上，将基于OCR的高频词汇匹配方法和K
‑
means聚类方法进行结合，对待识别直播视频进行有效精准判别，进而为用户精准推荐相关视频数据。
[0005]本专利技术的实施例是这样实现的：第一方面，本专利技术实施例提供一种基于人工智能的...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的直播视频大数据精准推荐方法，其特征在于，包括以下步骤：获取并统计目标用户的多段历史观看视频数据，生成并根据统计结果选取一段历史观看视频数据作为基准直播视频；采用关键帧检测方法对基准直播视频进行关键帧图像识别检测，以得到基准关键帧图像；利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像；采用OCR识别方法对核心基准关键帧图像中的词汇进行识别，得到并统计核心基准高频词汇；获取并采用关键帧检测方法对网络直播平台中的任意一段待识别直播视频进行识别检测，以得到待识别关键帧图像；利用代表性关键帧图像选取方法从待识别关键帧图像中挑选得到待识别核心关键帧图像；采用OCR识别方法对待识别核心关键帧图像中的词汇进行识别，得到并统计目标高频词汇；分别判断各个核心基准高频词汇与各个目标高频词汇是否相同，若至少存在一个核心基准高频词汇与目标高频词汇相同，则对待识别核心关键帧图像进行显著性检测，以得到显著核心关键帧图像；反之，则将该段待识别直播视频标记为非推荐直播视频；将核心基准关键帧图像作为正样本，选取网络直播平台中目标用户未观看的直播视频作为负样本；基于正样本和负样本采用谱聚类方法对显著核心关键帧图像进行聚类处理，得到聚类结果；根据聚类结果将待识别直播视频标记为目标推荐直播视频或非推荐直播视频，将目标推荐直播视频推送给对应的目标用户。2.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法，其特征在于，所述利用代表性关键帧图像选取方法从基准关键帧图像中挑选得到核心基准关键帧图像的方法包括以下步骤：对基准关键帧图像进行深度自编码；计算并根据各个基准关键帧图像自编码后的欧式距离确定核心基准关键帧图像。3.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法，其特征在于，所述采用OCR识别方法对核心基准关键帧图像中的词汇进行识别，得到并统计核心基准高频词汇的方法包括以下步骤：采用OCR识别方法对核心基准关键帧图像中的词汇进行识别，以得到多个识别词汇；根据预置的关键词汇数据集对多个识别词汇进行筛选，以得到关键词汇；统计并根据各个关键词汇出现的次数确定核心基准高频词汇。4.根据权利要求3所述的一种基于人工智能的直播视频大数据精准推荐方法，其特征在于，所述统计并根据各个关键词汇出现的次数确定核心基准高频词汇的方法包括以下步骤：统计各个关键词汇出现的次数，当关键词汇出现的次数超过预置的次数阈值时，将对应的关键词汇确定为核心基准高频词汇。
5.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法，其特征在于，所述对待识别核心关键帧图像进行显著性检测的方法包括以下步骤：采用ITTI模型、GBVS模型、SF模型、ST模型和FT模型其中一种或多种模型对待识别核心关键帧图像进行显著性检测。6.根据权利要求1所述的一种基于人工智能的直播视频大数据精准推荐方法，...

【专利技术属性】
技术研发人员：吴新军，
申请(专利权)人：北京嘉沐安科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人