一种预测图片流行度的方法及系统技术方案

技术编号:17008651 阅读:39 留言:0更新日期:2018-01-11 04:39
本申请公开了一种预测图片流行度的方法,方法包括:将采集到的图片数据进行预处理得到待分析数据;利用人工神经网络提取待分析数据的低层特征与高层特征,并将所述低层特征与所述高层特征拼接得到所述特征样本;利用经过参数优化的XGBoost对所述特征样本进行回归预测得到所述图片流行度;该方法能够准确预测图片的流行度,有利于新媒体的发展;本申请还公开了一种预测图片流行度的系统、一种计算机可读存储介质及服务器,具有以上有益效果。

【技术实现步骤摘要】
一种预测图片流行度的方法及系统
本专利技术涉及数据分析领域,特别涉及一种预测图片流行度的方法、系统和一种计算机可读存储介质及服务器。
技术介绍
信息技术的飞速发展推动了社交媒体的流行,社交媒体改变了人们交互的方式。用户主要通过发送图片的方式,在社交媒体平台分享自己的生活和经历。因此,社交媒体积累了海量的图片数据。然而,这些图片的流行度不尽相同。不同知名度的用户所发的图片的流行度相差甚远,同一用户发的图片的流行度也不同。许多领域的应用,例如新闻个性化推荐系统的设计,网上广告的投放等等,都得益于社交媒体图片流行度预测这一课题研究。现有技术中,基于循环神经网络的社交网络消息爆发检测是对社交网络中用户发布与转发的历史消息的分类预测,判断消息是否爆发。该现有技术只涉及到对社交媒体上面的文本信息的预测,无法实现对社交图片流行度的精准预测。因此,如何实现对社交图片流行度进行精准预测,是本领域技术人员目前需要解决的技术问题。
技术实现思路
本申请的目的是提供一种预测图片流行度的方法、系统和一种计算机可读存储介质及服务器,能够实现对社交图片流行度进行精准预测。为解决上述技术问题,本申请提供一种预测图片流行度的方法,该方法包括:将采集到的图片数据进行预处理得到待分析数据;利用人工神经网络提取待分析数据的低层特征与高层特征,并将所述低层特征与所述高层特征拼接得到所述特征样本;利用经过参数优化的XGBoost对所述特征样本进行回归预测得到所述图片流行度。可选的,所述将采集到的图片数据进行预处理得到待分析数据包括:根据社交线索特征将采集到的图片数据划分为时间特征数据和非时间特征数据;利用多时态标度的方法对所述时间特征数据进行处理得到待分析时间数据;利用特征图谱的方法对所述非时间特征数据进行处理得到待分析非时间数据;其中,所述待分析数据包括所述待分析时间数据和所述待分析非时间数据。可选的,所述利用特征图谱的方法对所述非时间特征数据进行处理得到待分析非时间数据包括:根据函数对所述非时间特征数据的取值范围进行区间划分;其中,b0、b1…bi-1为映射值;ai为第i个所述区间上的所述非时间特征数据的取值;根据所述非时间特征数据确定对应区间上的映射值,并通过get_dummies函数进行相应转化得到待分析非时间数据。可选的,根据所述非时间特征数据确定对应区间上的映射值包括:在所述区间中设置重叠区间,判断所述非时间特征数据是否落在所述重叠区间;若是,则判定所述非时间特征数据对应的所述区间为所述重叠区间相邻的区间;若否,则对所述非时间特征数据的映射值确定对应区间上的映射值。可选的,所述利用人工神经网络提取待分析数据的低层特征与高层特征,并将所述低层特征与所述高层特征拼接得到所述特征样本包括:利用一维卷积神经网络提取待分析数据的低层特征与高层特征,并将所述低层特征与所述高层特征拼接起来得到全连接层的输入数据;利用所述全连接层,对所述输入数据进行特征提取操作得到所述特征样本。本申请还提供了一种预测图片流行度的系统,该系统包括:初始化模块,用于将采集到的图片数据进行预处理得到待分析数据;特征提取模块,用于利用人工神经网络提取待分析数据的低层特征与高层特征,并将所述低层特征与所述高层特征拼接得到所述特征样本;回归模块,用于利用经过参数优化的XGBoost对所述特征样本进行参数优化得到所述图片流行度。可选的,所述初始化模块包括:划分子模块,用于根据社交线索特征将采集到的图片数据划分为时间特征数据和非时间特征数据;时间数据处理子模块,用于利用多时态标度的方法对所述时间特征数据进行处理得到待分析时间数据;非时间数据处理子模块,用于利用特征图谱的方法对所述非时间特征数据进行处理得到待分析非时间数据;其中,所述待分析数据包括所述待分析时间数据和所述待分析非时间数据。可选的,所述非时间数据处理子模块包括:分区单元,用于根据函数对所述非时间特征数据的取值范围进行区间划分;其中,b0、b1…bi-1为映射值;ai为第i个所述区间上的所述非时间特征数据的取值;转化单元,用于根据所述非时间特征数据确定对应的区间,并通过get_dummies函数进行相应转化得到待分析非时间数据。本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序执行时实现以下步骤:将采集到的图片数据进行预处理得到待分析数据;利用人工神经网络提取待分析数据的低层特征与高层特征,并将所述低层特征与所述高层特征拼接得到所述特征样本;利用经过参数优化的XGBoost对所述特征样本进行回归预测得到所述图片流行度。本申请还提供了一种服务器,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现以下步骤:将采集到的图片数据进行预处理得到待分析数据;利用人工神经网络提取待分析数据的低层特征与高层特征,并将所述低层特征与所述高层特征拼接得到所述特征样本;利用经过参数优化的XGBoost对所述特征样本进行回归预测得到所述图片流行度。本专利技术提供了一种预测图片流行度的方法,将采集到的图片数据进行预处理得到待分析数据;利用人工神经网络提取待分析数据的低层特征与高层特征,并将所述低层特征与所述高层特征拼接得到所述特征样本;利用经过参数优化的XGBoost对所述特征样本进行回归预测得到所述图片流行度。本方法中对源数据进行预处理得到可以识别的待分析数据,通过人工神经网络与经过参数优化的XGBoost的结合对待分析数据中的特征样本进行预测。该方法人工神经网络与经过参数优化的XGBoost构成的混合模型堆叠能够准确预测图片的流行度,有利于新媒体的发展;本申请同时还提供了一种预测图片流行度的系统、一种计算机可读存储介质及服务器,具有上述有益效果,在此不再赘述。附图说明为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例所提供的一种预测图片流行度的方法的流程图;图2为本申请实施例所提供的另一种预测图片流行度的方法的流程图;图3为多时态标度划分示意图;图4为本申请实施例所提供的又一种预测图片流行度的方法的流程图;图5低层特征与高层特征拼接示意图;图6为本申请实施例所提供的另外一种预测图片流行度的方法的流程图;图7为重叠区域划分示意图;图8为本申请实施例所提供的一种预测图片流行度的系统的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。下面请参见图1,图1为本申请实施例所提供的一种预测图片流行度的方法的流程图;具体步骤可以包括:S101:将采集到的图片数据进行预处理得到待分析数据;其中,本方案的目的是预测图片的流行度,因此在本步骤中采集的图片数据为图片的相关信息,图片数据的来源可以是Flickr(一个图片分享网站)、微博、本文档来自技高网...
一种预测图片流行度的方法及系统

【技术保护点】
一种预测图片流行度的方法,其特征在于,包括:将采集到的图片数据进行预处理得到待分析数据;利用人工神经网络提取待分析数据的低层特征与高层特征,并将所述低层特征与所述高层特征拼接得到所述特征样本;利用经过参数优化的XGBoost对所述特征样本进行回归预测得到所述图片流行度。

【技术特征摘要】
1.一种预测图片流行度的方法,其特征在于,包括:将采集到的图片数据进行预处理得到待分析数据;利用人工神经网络提取待分析数据的低层特征与高层特征,并将所述低层特征与所述高层特征拼接得到所述特征样本;利用经过参数优化的XGBoost对所述特征样本进行回归预测得到所述图片流行度。2.根据权利要求1所述方法,其特征在于,所述将采集到的图片数据进行预处理得到待分析数据包括:根据社交线索特征将采集到的图片数据划分为时间特征数据和非时间特征数据;利用多时态标度的方法对所述时间特征数据进行处理得到待分析时间数据;利用特征图谱的方法对所述非时间特征数据进行处理得到待分析非时间数据;其中,所述待分析数据包括所述待分析时间数据和所述待分析非时间数据。3.根据权利要求2所述方法,其特征在于,所述利用特征图谱的方法对所述非时间特征数据进行处理得到待分析非时间数据包括:根据函数对所述非时间特征数据的取值范围进行区间划分;其中,b0、b1…bi-1为映射值;ai为第i个所述区间上的所述非时间特征数据的取值;根据所述非时间特征数据确定对应区间上的映射值,并通过get_dummies函数进行相应转化得到待分析非时间数据。4.根据权利要求3所述方法,其特征在于,根据所述非时间特征数据确定对应区间上的映射值包括:在所述区间中设置重叠区间,判断所述非时间特征数据是否落在所述重叠区间;若是,则判定所述非时间特征数据对应的所述区间为所述重叠区间相邻的区间;若否,则对所述非时间特征数据的映射值确定对应区间上的映射值。5.根据权利要求1所述方法,其特征在于,所述利用人工神经网络提取待分析数据的低层特征与高层特征,并将所述低层特征与所述高层特征拼接得到所述特征样本包括:利用一维卷积神经网络提取待分析数据的低...

【专利技术属性】
技术研发人员:刘文印司徒润威李六武高俊艳杨振国
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1