基于社交图片SIFT特征的上下文信息预测方法技术

技术编号：14836404 阅读：69 留言：0更新日期：2017-03-17 03:58

本发明专利技术提供了一种基于社交图片SIFT特征的上下文信息预测方法，通过分析用户上传到移动互联网上的图片，预测用户的性别、发图习惯、影响力、活跃度以及使用终端等上下文信息。本发明专利技术预测准确度高，计算量少，能够在海量数据中提取有效实用的信息。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种移动互联网领域，具体的说是一种基于社交图片SIFT特征的上下文信息预测方法。
技术介绍
在飞速发展的移动互联网时代，图像简明形象的时代特性，使其成为人们表达情感的重要载体。用户的上下文信息在移动互联网应用中扮演着重要角色，它反映了用户的各种基本信息。在移动互联网时代，图像与用户上下文信息关系密切，能够在一定程度上反映发图用户的基本特征。用户上下文信息预测就是通过分析用户上传到移动互联网上的图片来预测用户的性别、发图习惯、影响力、活跃度以及使用终端等上下文信息。目前根据图像特征进行预测的技术多是从全局特征出发，通过灰度矩阵、颜色矩阵等得到数字特征来进行预测。如果是对图像的整体进行研究，而不太关注图片隐含的背景信息，使用全局特征比较合适。但是如果要预测用户的上下文信息，需要辨识图片的前景和背景，使用全局特征得到的预测准确率不高，因此提取图片的局部特征更为合适。而且之前的技术研究的图像多是人工分类过或标记过的，但是大数据背景下社交网络上的图片更多是没有被标记的。因此本专利技术主要通过对用户上传到移动互联网的未处理的社交图片的局部特征进行研究，提取图片的SIFT特征，对提取的特征进行聚类，采用的聚类算法是K-Means++算法；然后对用户的上下文信息进行分类预测，采取的分类方法是GBDT（GradientBoostingDecisionTree）算法和SVM（SupportVectorMachine）算法。
技术实现思路
本专利技术的目的在于克服上述不足，提供一种基于社交图片SIFT特征的上下文信息预测方法，通过分析用户上传到移动互联网上的图片，预...

【技术保护点】
基于社交图片SIFT特征的上下文信息预测方法，其特征在于，包括以下步骤：步骤1、获取用户上下文信息和图片特征数据集；步骤2、采用十字交叉验证法将数据集分为训练集和测试集；步骤3、将训练集训练SVM和GBDT分类模型，以供预测时使用；步骤4、用训练好的SVM模型和GBDT模型分别预测测试集的数据，对于用SVM训练出的分类模型，使用SVM预测算法测试测试集，对于用GBDT训练出的分类模型，使用GBDT预测算法测试测试集；步骤5、对测试样本的预测测试结果进行输出，并比较得出最终预测结果。

【技术特征摘要】
1.基于社交图片SIFT特征的上下文信息预测方法，其特征在于，包括以下步骤：步骤1、获取用户上下文信息和图片特征数据集；步骤2、采用十字交叉验证法将数据集分为训练集和测试集；步骤3、将训练集训练SVM和GBDT分类模型，以供预测时使用；步骤4、用训练好的SVM模型和GBDT模型分别预测测试集的数据，对于用SVM训练出的分类模型，使用SVM预测算法测试测试集，对于用GBDT训练出的分类模型，使用GBDT预测算法测试测试集；步骤5、对测试样本的预测测试结果进行输出，并比较得出最终预测结果。2.根据权利要求1所述的基于社交图片SIFT特征的上下文信息预测方法，其特征在于，所述获取用户上下文信息和图片特征数据集的方法包括以下步骤：步骤101、获取用户上传到移动互联网上的图片，获取发图用户的基本信息；步骤102、收集并记录所述图片的相关信息和图片对应的用户上下文信息；步骤103、图片预处理，提取图片的SIFT特征：将下载到的图片进行预处理操作，构建尺度空间，使用高斯核和高斯微分建立高斯金字塔，检测尺度空间的极值点，精确定位极值点，确定关键点的位置、尺度和主方向，...

【专利技术属性】
技术研发人员：王永，
申请(专利权)人：郑州埃文计算机科技有限公司，
类型：发明
国别省市：河南;41

全部详细技术资料下载我是这个专利的主人