当前位置: 首页 > 专利查询>王庆军专利>正文

一种拟探索视频特征数据的语义低维特征的获取方法技术

技术编号:18810181 阅读:77 留言:0更新日期:2018-09-01 09:29
本发明专利技术公开了一种拟探索视频特征数据的语义低维特征的获取方法,包括先进行视频模型构建;包括视频关键帧提取、加密特征提取和交流学习降维;再进行用户模型构建;包括用户行为数据提取、用户行为分析和计算用户偏好模型;最后进行推荐算法实现;包括协同过滤装置、基于内容的推荐和混合推荐算法,本发明专利技术通过对用户行为分析,计算用户偏好模型,研究视频推荐中用户建模方法;在完成海量视频的语义低维表示后,研究基于混合推荐的视频推荐算法中的加权和分级策略;从用户反馈角度出发,研究基于隐式相关反馈的视频混合推荐算法,对原有推荐结果进一步修正。

A method to acquire semantic low dimensional features from video feature data

The invention discloses a method for acquiring semantic low-dimensional features of video feature data to be explored, which includes video model construction, video key frame extraction, encryption feature extraction and exchange learning dimensionality reduction, user model construction, user behavior data extraction, user behavior analysis and user bias calculation. Good model; finally implement recommendation algorithm; including collaborative filtering device, content-based recommendation and hybrid recommendation algorithm, the invention calculates user preference model through user behavior analysis, studies user modeling method in video recommendation; after completing the semantic low-dimensional representation of massive video, studies hybrid recommendation From the point of view of user feedback, a hybrid video recommendation algorithm based on implicit relevance feedback is studied to further modify the original recommendation results.

【技术实现步骤摘要】
一种拟探索视频特征数据的语义低维特征的获取方法
本专利技术涉及信息检索、视频及图像信息处理
,具体为一种拟探索视频特征数据的语义低维特征的获取方法。
技术介绍
随着计算机的普及以及互联网的迅猛发展,知识获取的来源、数量和形式也随之发生了根本的变化。目前,在Internet的数据中蕴含了海量的知识,同时也含有大量的垃圾信息,完全人工方式获取知识已经不能满足要求,因此必须研究大规模知识获取的方法,以减少手工知识获取的代价。推荐系统与搜索引擎有着类似的功能,将用户真正需要的信息快速过滤并展现出来,不同之处在于推荐系统通过挖掘并分析用户行为记录来建立模型,主动为用户推荐其感兴趣的信息。推荐系统作为沟通用户和服务之间的桥梁,其作用和价值日益显著。在这一领域,研究人员提出各类推荐算法,主要包括协同过滤[25]和基于内容的过滤算法。协同过滤的原理是根据用户的历史行为记录,挖掘物品或用户本身的关联性,再依据这些关联性来产生推荐。所以,如何设计一种拟探索视频特征数据的语义低维特征的获取方法,成为我们当前要解决的问题。
技术实现思路
本专利技术的目的在于提供一种拟探索视频特征数据的语义低维特征的获取方法,通过对用户行为分析,计算用户偏好模型,研究视频推荐中用户建模方法;在完成海量视频的语义低维表示后,研究基于混合推荐的视频推荐算法中的加权和分级策略;从用户反馈角度出发,研究基于隐式相关反馈的视频混合推荐算法,对原有推荐结果进一步修正,可以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种拟探索视频特征数据的语义低维特征的获取方法,包括如下步骤:1)先进行视频模型构建;包括视频关键帧提取、加密特征提取和交流学习降维;2)再进行用户模型构建;包括用户行为数据提取、用户行为分析和计算用户偏好模型;3)最后进行推荐算法实现;包括协同过滤装置、基于内容的推荐和混合推荐算法。根据上述技术方案,所述步骤1)中的视频关键帧提取具体为先逐帧读取视频帧,将各视频帧图像转为灰度图,依次计算各视频帧的灰度质心组成灰度质心序列,使用灰度质心序列代表视频帧序列,下面步骤对视频帧序列的操作即为对灰度质心序列的操作;再将视频帧序列划分为多个视觉相似视频帧序列;然后依据设定的最小有效视觉相似视频帧序列长度,从视觉相似视频帧序列中筛选有效视觉相似视频帧序列;最后从有效视觉相似视频帧序列提取视频关键帧。根据上述技术方案,所述步骤1)中的加密特征提取具体为先确定需要进行数据特征提取的第一会话和第二会话,并从所述第一会话包含的报文中提取第一设定数目的报文信息,以及从所述第二会话包含的报文中提取第二设定数目的报文信息;其中,所述第一会话和第二会话是同一个应用操作在不同时间所产生的,所述报文信息中至少包括报文应用层负载字节序;采用指定的匹配算法,依次根据从第一会话中提取的每一个报文应用层负载字节序构建相应的状态机,每构建一个状态机,将当前构建的状态机与从第二会话中提取的每一个报文应用层负载字节序依次进行匹配,每执行一次匹配,对当前获得的匹配结果进行迭代合并,并根据预设规则计算当前获得的经迭代合并后的匹配结果的权值,直到确定当前获得的权值不小于设定阈值为止,确定匹配成功并停止构建状态机及停止匹配,以及将当前获得的经迭代合并后的匹配结果作为所述应用操作的数据特征。根据上述技术方案,所述步骤1)中的交流学习降维具体为用自适应密度聚类算法聚类后,用ICA对每个聚类降维形成线性模型平面;建立局部线性模型间的最小穿越树MST;遍历流行的全局MST;通过在全局超平面上运行ICA找到低维植入即可。根据上述技术方案,所述步骤2)中的用户行为数据提取具体为用信息采集模块采集用户行为数据,主要包括用户访问的网站、搜索的关键字、计算机进程、电脑硬件信息、网页收藏夹信息;采集到的数据上传给信息汇总存储模块。根据上述技术方案,所述步骤2)中的用户行为分析具体为通过信息汇总存储模块汇总并存储采集插件上传的数据,汇总后的数据输出到原始数据库中;然后利用信息挖掘统计模块定期从原始数据库中提取出数据并进行统计、挖掘和分析;包括排名统计、用户行为分类、用户分类、用户聚类;分析结果输出到统计数据库中;最后利用系统展现输出模块从统计数据库中获取数据,展示用户行为分析的结果。根据上述技术方案,所述步骤2)中的计算用户偏好模型具体为用以完成用户聚类和用户历史行为上下文计算;所述数据挖掘子系统,进一步包括用户聚类模块和用户历史行为上下文计算模块;其中,所述用户聚类模块,基于用户对移动服务的使用量,通过运用K-Means聚类算法,将所有用户划分到K个不同的聚类中,使得同一聚类中的用户相似度较高,不同聚类中的用户相似度较低,聚类分析结束后,每个用户拥有一个聚类号标记;所述用户历史行为上下文计算模块,用于对用户历史行为上下文进行计算,以求出个体用户对某一方面上下文的兴趣度;用户偏好提取子系统,用于根据所述数据挖掘子系统的计算结果,提取群组用户偏好和个体用户偏好信息,并输出到所述数据存储与管理子系统;以及用户偏好自适应子系统,用以完成用户偏好变化/冲突检测、用户偏好修正,并将检测结果或修正的结果保存在数据存储与管理子系统中。根据上述技术方案,所述步骤3)中的推荐算法实现具体为同时通过协同过滤装置和基于内容的推荐,在利用混合推荐算法进行计算,而混合推荐算法包括数据预处理;将预处理的数据分别进行基于加权相似度的协作推荐算法、基于平衡评分预测机制的协作推荐算法、基于评分填充的混合推荐算法、利用评分时间特性的协作推荐算法选择最匹配的算法结果,并将所述算法结果作为推荐内容。与现有技术相比,本专利技术的有益效果是:本专利技术通过对用户行为分析,计算用户偏好模型,研究视频推荐中用户建模方法;在完成海量视频的语义低维表示后,研究基于混合推荐的视频推荐算法中的加权和分级策略;从用户反馈角度出发,研究基于隐式相关反馈的视频混合推荐算法,对原有推荐结果进一步修正。附图说明图1是本专利技术系统框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例请参阅图1,本专利技术提供一种拟探索视频特征数据的语义低维特征的获取方法,包括如下步骤:1)先进行视频模型构建;包括视频关键帧提取、加密特征提取和交流学习降维;2)再进行用户模型构建;包括用户行为数据提取、用户行为分析和计算用户偏好模型;3)最后进行推荐算法实现;包括协同过滤装置、基于内容的推荐和混合推荐算法。根据上述技术方案,所述步骤1)中的视频关键帧提取具体为先逐帧读取视频帧,将各视频帧图像转为灰度图,依次计算各视频帧的灰度质心组成灰度质心序列,使用灰度质心序列代表视频帧序列,下面步骤对视频帧序列的操作即为对灰度质心序列的操作;再将视频帧序列划分为多个视觉相似视频帧序列;然后依据设定的最小有效视觉相似视频帧序列长度,从视觉相似视频帧序列中筛选有效视觉相似视频帧序列;最后从有效视觉相似视频帧序列提取视频关键帧。根据上述技术方案,所述步骤1)中的加密特征提取具体本文档来自技高网...

【技术保护点】
1.一种拟探索视频特征数据的语义低维特征的获取方法,其特征在于:包括如下步骤:1)先进行视频模型构建;包括视频关键帧提取、加密特征提取和交流学习降维;2)再进行用户模型构建;包括用户行为数据提取、用户行为分析和计算用户偏好模型;3)最后进行推荐算法实现;包括协同过滤装置、基于内容的推荐和混合推荐算法。

【技术特征摘要】
1.一种拟探索视频特征数据的语义低维特征的获取方法,其特征在于:包括如下步骤:1)先进行视频模型构建;包括视频关键帧提取、加密特征提取和交流学习降维;2)再进行用户模型构建;包括用户行为数据提取、用户行为分析和计算用户偏好模型;3)最后进行推荐算法实现;包括协同过滤装置、基于内容的推荐和混合推荐算法。2.根据权利要求1所述的一种拟探索视频特征数据的语义低维特征的获取方法,其特征在于:所述步骤1)中的视频关键帧提取具体为先逐帧读取视频帧,将各视频帧图像转为灰度图,依次计算各视频帧的灰度质心组成灰度质心序列,使用灰度质心序列代表视频帧序列,下面步骤对视频帧序列的操作即为对灰度质心序列的操作;再将视频帧序列划分为多个视觉相似视频帧序列;然后依据设定的最小有效视觉相似视频帧序列长度,从视觉相似视频帧序列中筛选有效视觉相似视频帧序列;最后从有效视觉相似视频帧序列提取视频关键帧。3.根据权利要求1所述的一种拟探索视频特征数据的语义低维特征的获取方法,其特征在于:所述步骤1)中的加密特征提取具体为先确定需要进行数据特征提取的第一会话和第二会话,并从所述第一会话包含的报文中提取第一设定数目的报文信息,以及从所述第二会话包含的报文中提取第二设定数目的报文信息;其中,所述第一会话和第二会话是同一个应用操作在不同时间所产生的,所述报文信息中至少包括报文应用层负载字节序;采用指定的匹配算法,依次根据从第一会话中提取的每一个报文应用层负载字节序构建相应的状态机,每构建一个状态机,将当前构建的状态机与从第二会话中提取的每一个报文应用层负载字节序依次进行匹配,每执行一次匹配,对当前获得的匹配结果进行迭代合并,并根据预设规则计算当前获得的经迭代合并后的匹配结果的权值,直到确定当前获得的权值不小于设定阈值为止,确定匹配成功并停止构建状态机及停止匹配,以及将当前获得的经迭代合并后的匹配结果作为所述应用操作的数据特征。4.根据权利要求1所述的一种拟探索视频特征数据的语义低维特征的获取方法,其特征在于:所述步骤1)中的交流学习降维具体为用自适应密度聚类算法聚类后,用ICA对每个聚类降维形成线性模型平面;建立局部线性模型间的最小穿越树MST;遍历流行的全局MST;通过在全局超平面上运行ICA找到低维植入即可。5.根据权利...

【专利技术属性】
技术研发人员:王庆军岳峻王刚刘启明
申请(专利权)人:王庆军
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1