当前位置: 首页 > 专利查询>青岛大学专利>正文

一种基于大数据分析的O2O优惠券分发方法及系统技术方案

技术编号:20004161 阅读:34 留言:0更新日期:2019-01-05 17:17
本发明专利技术属于智能分发技术领域,涉及一种基于大数据分析的O2O优惠券分发方法及系统,先对获取的一定时间段内的数据进行分割,分别建立对应时间段的验证集数据;再根据已经声明或定义的特征,对数据进行特征的抽象和提取;然后进行特征合并,去除完全相同的数据,对数据进行规范化处理;再给除了测试集对应的特征集之外的其他特征集加上标签,将提取的特征集连接形成一个总的特征集合,构建符合XGBoost模型要求的特征矩阵;然后使用XGBoost模型进行预测,最后预测结果设定临界值,根据设定的临界值进行分发提示,实现优惠券的分发;其数据涵盖范围更广,降低了商户的营销成本,优化了用户的消费体验,使得交易最优化。

A Method and System for the Distribution of O2 O Coupons Based on Large Data Analysis

The invention belongs to the field of intelligent distribution technology, and relates to a method and system for distributing O2 O coupons based on large data analysis. Firstly, the data acquired in a certain period of time are segmented and the corresponding verification set data are established respectively. Then, according to the declared or defined features, the data are abstracted and extracted. Then, the features are merged to remove the identical features. The data is normalized; the other feature sets besides the corresponding feature sets of the test set are labeled, and the extracted feature sets are connected to form a total feature set to construct a feature matrix that meets the requirements of the XGBoost model; then the XGBoost model is used to predict, and the prediction results are set to a critical value, and the tips are distributed according to the set critical values. To achieve the distribution of coupons; its data cover a wider range, reduce the marketing costs of merchants, optimize the user's consumption experience, and make the transaction optimization.

【技术实现步骤摘要】
一种基于大数据分析的O2O优惠券分发方法及系统
:本专利技术属于智能分发
,涉及一种优惠券的分发方法及系统,特别涉及一种基于大数据分析的O2O优惠券分发方法及系统。
技术介绍
:O2O(OnlineToOffline)是指商家兼备网上商城及线下实体店,将线下的商务机会与在线网络营销相结合,实现线上线下一体化的会员营销系统。以优惠券盘活老用户、吸引新客户是O2O系统及互联网经济的一种重要营销方式。将“对的券”分发给“对的人”,即实现基于用户个性化需求的精准分发,是提高优惠券核销率的重要技术。开发这样一个优惠券个性化分发辅助系统,可以让具有一定偏好的消费者得到真正的实惠,同时赋予商家更强的营销能力。为了实现优惠券的精准分发,专利技术人分别对国内外优惠券的分发情况、核销情况、已有优惠券的分发辅助工具进行了充分的调研。根据Statista的统计数据,2011年至2016年在美国地区每年的优惠券的投放量均超过3000亿,但是2011至2016的优惠券核销率分别是1.12%、0.92%、0.85%、0.84%、0.72%、0.72%。国内部分采用范本调查,以有调旗舰店(天猫男鞋店铺)为例,2018年5月份被领取优惠券2636张,其中被消费499张,核销率18.93%,在2018年5月31日当日被领取优惠券58张,其中被使用5张,核销率8.62%。大量调查数据显示尽管近年来国内电商蓬勃发展,交易量节节攀高,但是优惠券的分发策略并没有多大进步,平均核销率不足10%。商家优惠券的投放基本是一厢情愿,要么在店铺页面广发,要么通过短信狂轰滥炸,一方面用户收到很多不需要的投放,另一方面真正需要的优惠券又不能及时获取。目前国内典型的电商平台淘宝、京东商城、美团等,为商家提供了优惠券辅助分发程序,但这些优惠券的分发助手或称优惠券的营销平台的主要功能是给商家提供消费统计数据,供商家查看统计数据、自行分析处理这些数据后自行设计优惠券的内容和发放方法。也就是说,目前的分发工具主要帮商家实现分发操作,并没有加入精准分发的辅助决策功能,即只管“发”,不管“发得是否合理”。目前的工具只采集简单的消费数据特征,然后将庞大的数据量交给商家人力处理,显然,无法依据如此庞大的数据量给出最优的解决方案。CN201610373693.8涉及一种基于线下用户消费行为的可配置优惠券分发方法,包括步骤:S1:在服务端制定优惠券,并配置符合该优惠券发券条件的商品流水销售信息;S2:门店POS收银机在完成交易时,向服务端发送商品销售流水信息;S3:服务端在判断接收到的商品销售流水信息符合优惠券的发券条件时,向该商品销售流水信息对应的用户发送优惠券。与现有技术相比,本专利技术通过线下消费记录信息来精准地分发优惠券,可配置的发券策略,可以使优惠券的分发更有意义,同时减少不必要的优惠分发,便于提高利润,同时门店POS收银机在完成交易时,才向服务端发送商品流水销售信息,所有的分发都建立在真实消费的基础上,营销更加精准;CN201810153983.0涉及基于区块链的优惠券信息系统及处理方法,应用接口,与外部应用交互的渠道;优惠券分发模块,优惠券发行方或者分发方通过优惠券分发模块将优惠券的信息做数字签名后,保存发布于区块链网络中;优惠券消费记录模块,根据消费者所处的位置信息以及推荐算法,展示相关的优惠券给消费者,当消费者在商家实地展示使用优惠券时,信息被记录并保存到区块链网络中;优惠券佣金结算模块,优惠券的分发参与方和商家,通过优惠券佣金结算模块并结合区块链网络上的消费数据;区块链网络模块,使用可信授权接入的联盟链或公有链系统,用于保存优惠券的信息、消费记录;数据库模块,信息保存于数据库中,基于区块链技术实现优惠券信息的处理。根据统计数据,越晚年代出生的消费者,其消费观念越超前,对优惠券的依赖程度也越高。在蓬勃发展的O2O行业中,随着大数据处理技术的发展,目前可获得的线上用户消费行为数据越来越多,人们对于线上宣传的线下品牌门店的认可度也越来越高。但是目前的优惠券发放系统和辅助工具(这里指市场上被大量应用的,且在应用市场可以搜索应用的),只能提供用户的消费数据、优惠券的面额、发放数量等统计数据,仅仅起到了统计的作用,不具有智能分析、大数据处理、机器学习和预测的功能。因此,设计一种基于大数据分析的O2O优惠券分发方法及系统,将大量用户的线上历史行为数据和线下的消费习惯数据相结合,通过机器学习算法可以对用户将来的消费概率给予精准的预测,并将预测结果用于指导优惠券的精准发放。
技术实现思路
:本专利技术的目的在于克服现有技术存在的缺点,解决在线上到线下消费领域中,优惠券随机分发造成的目标不精准、商户营销成本大、对用户造成干扰的问题,利用线上线下消费数据和优惠券本身的属性数据,设计提供一种基于大数据分析的O2O优惠券分发方法及系统。为了实现上述目的,本专利技术所述的基于大数据分析的O2O优惠券分发系统包括数据收集模块、服务器后台管理模块和前端用户使用模块,其中数据收集模块用于收集并管理线上用户商家和优惠券数据、线下用户商家和优惠券数据以及待预测的数据三种数据文件,数据收集模块和服务器后台管理模块通过网络进行连接,前端用户使用模块与服务器后台管理模块的数据库连接,服务器后台管理模块保存用户上传的数据文件,并将数据提交到数据处理模块进行数据分析后返至数据库,将数据库数据进行可视化呈现;前端用户使用模块显示数据库数据的各项属性并提供数据分析的结果,对优惠券使用概率进行分类,给出分发建议,提供一键分发按钮,通过各大购物平台和商家提供的接口实现优惠券的分发。本专利技术所述线下用户商家和优惠券数据包括用户名称、商户名称、优惠券名称、优惠券优惠率、用户经常活动地点距线下门店的距离、领取优惠券日期、消费日期,线上用户商家和优惠券数据包括用户名称、商户名称、线上购买行为、优惠券名称、优惠券优惠率、领券日期、消费日期,待预测的数据包括用户名称、商户名称、优惠券名称、优惠券优惠率、用户经常活动地点距线下门店的距离、领取优惠券日期。本专利技术所述服务器后台管理模块中使用了大数据分析的机器学习算法,对于上传的线下用户商家和优惠券数据以及线上用户商家和优惠券数据进行特征的抽象和提取,并将两大数据使用线性累和模型进行融合计算,即将线上和线下的消费行为进行分析和融合,从而适应O2O环境下的消费行为分析,其中大数据分析的机器学习算法为陈天奇博士在KDD会议上提出的报告名称为XGBoost:AScalableTreeBoostingSystem的改进算法,KDD’16,August13-17,2016,SanFrancisco,CA,USA;线性累和模型是将相同的数据进行加减或比较替换(若线上线下都有同一个用户的同一项数据则采用线下数据,若线上线下中有一项没有这类数据,那么合并时添加上这一类数据)。本专利技术所述前端用户使用模块中的分发建议是根据大数据分析的机器学习算法预测的使用概率并由开发者设定的临界值确定的,能设置不同文字或者不同颜色给用户提示和辅助参考,下发按钮接入购物平台接口,实现优惠券的直接分发。本专利技术所述所述购物平台接口可以是电子商务交易平台提供的平台优惠券分发接口,也可以是个人商户购物网站提供的优惠券分发接口。本专利技术实本文档来自技高网
...

【技术保护点】
1.一种基于大数据分析的O2O优惠券分发系统,其特征在于包括数据收集模块、服务器后台管理模块和前端用户使用模块,其中数据收集模块用于收集并管理线上用户商家和优惠券数据、线下用户商家和优惠券数据以及待预测的数据三种数据文件,数据收集模块和服务器后台管理模块通过网络进行连接,前端用户使用模块与服务器后台管理模块的数据库连接,服务器后台管理模块保存用户上传的数据文件,并将数据提交到数据处理模块进行数据分析后返至数据库,将数据库数据进行可视化呈现;前端用户使用模块显示数据库数据的各项属性并提供数据分析的结果,对优惠券使用概率进行分类,给出分发建议,提供一键分发按钮,通过各大购物平台和商家提供的接口实现优惠券的分发。

【技术特征摘要】
1.一种基于大数据分析的O2O优惠券分发系统,其特征在于包括数据收集模块、服务器后台管理模块和前端用户使用模块,其中数据收集模块用于收集并管理线上用户商家和优惠券数据、线下用户商家和优惠券数据以及待预测的数据三种数据文件,数据收集模块和服务器后台管理模块通过网络进行连接,前端用户使用模块与服务器后台管理模块的数据库连接,服务器后台管理模块保存用户上传的数据文件,并将数据提交到数据处理模块进行数据分析后返至数据库,将数据库数据进行可视化呈现;前端用户使用模块显示数据库数据的各项属性并提供数据分析的结果,对优惠券使用概率进行分类,给出分发建议,提供一键分发按钮,通过各大购物平台和商家提供的接口实现优惠券的分发。2.根据权利要求1所述基于大数据分析的O2O优惠券分发系统,其特征在于所述线下用户商家和优惠券数据包括用户名称、商户名称、优惠券名称、优惠券优惠率、用户经常活动地点距线下门店的距离、领取优惠券日期、消费日期,线上用户商家和优惠券数据包括用户名称、商户名称、线上购买行为、优惠券名称、优惠券优惠率、领券日期、消费日期,待预测的数据包括用户名称、商户名称、优惠券名称、优惠券优惠率、用户经常活动地点距线下门店的距离、领取优惠券日期。3.根据权利要求2所述基于大数据分析的O2O优惠券分发系统,其特征在于所述服务器后台管理模块中使用了大数据分析的机器学习算法,对于上传的线下用户商家和优惠券数据以及线上用户商家和优惠券数据进行特征的抽象和提取,并将两大数据使用线性累和模型进行融合计算,即将线上和线下的消费行为进行分析和融合,从而适应O2O环境下的消费行为分析,其中大数据分析的机器学习算法为陈天奇博士在KDD会议上提出的报告名称为XGBoost:AScalableTreeBoostingSystem的改进算法,KDD’16,August13-17,2016,SanFrancisco,CA,USA;线性累和模型是将相同的数据进行加减或比较替换。4.根据权利要求3所述基于大数据分析的O2O优惠券分发系统,其特征在于所述前端用户使用模块中的分发建议是根据大数据分析的机器学习算法预测的使用概率并由开发者设定的临界值确定的,能设置不同文字或者不同颜色给用户提示和辅助参考,下发按钮接入购物平台接口,实现优惠券的直接分发。5.根据权利要求4所述基于大数据分析的O2O优惠券分发系统,其特征在于所述平台接口为电子商务交易平台提供的平台优惠券分发接口,或个人商户购物网站提供的优惠券分发接口。6.一种采用如权利要求5所述系统实现优惠券分发的方法,其特征在于具体过程包括以下步骤:步骤一:对于获取的一定时间段内的线上用户商家和优惠券数据、线下用户商家和优惠券数据利用滑窗算法进行数据集的分割,得到分割的时间段;步骤二:对于分隔的多个时间段,分别建立对应时间段的验证集数据,并把验证集数据读取进XGBoost算法程序;步骤三:根据已经声明或定义的特征,进行优惠券相关特征、商户相关特征、用户相关特征、用户——商户交互特征的抽象和提取;步骤四:将分别提取的特征合并为一个数据帧,然后将一个数据帧中的各类特征合并,然后去除完全相同的数据并进行数据的规范化处理,将空值设置为程序可读的空值表示;步骤五:给除了测试集对应的特征集之外的其他特征集加上标签,其中标签的含义是该券是否在规定时间内被核销;步骤六:将步骤五中提取出来的特征集连接,形成一个总的特征集合,构建符合XGBoost模型要求的特征矩阵,然后使用XGBoost模型进行预测;其中特征矩阵形式符合XGBoost的规范传入形式,内容为训练集合提取的特征集;步骤七:对于步骤六的预测结果设定临界值,根据设定的临界值进行分发提示,实现优惠券的分发。7.根据权利要求6所述优惠券分发的方法,其特征在于步骤三所述特征提取包括文件的读取和数据集的划分、优惠券相关特征的提取、商户相关特征的提取、用户相关特征的提取、用户——商户相关特征的提取以及生成训练集和测试集,具体为:(一)文件的读取和数据集的划分:先从用户线下消费和优惠券领取行为文件、用户线上点击/消费和优惠券领取行为文件以及用户O2O线下优惠券使用预测样本文件中读取数据,三个文件分别记为原始文件一、原始文件二以及原始文件三;原始文件一、二中的记录从直观上分为三类,包括用户领取优惠券的记录、用户不用券消费的记录、用户使用优惠券消费的记录,每条记录有优惠券领取日期、消费日期以及相关的其他信息,用户不用券消费的记录中优惠券领取日期一项为空,用户领取优惠券的记录中消费日期一项为空,而用户用券消费的记录中两者都不为空;原始文件三只有用户领取优惠券的记录,为要求预测的数据;将从三个原始文件中读取出来的数据集合分别命名为off_train、on_train和off_test,其中off_train为线下数据集合,on_train为线上数据集合,off_test为需要预测的数据集合,然后将off_train和off_test中的数据按照时间划分为两类集合,包括dataset和feature,其中dataset为要求预测的记录和调参训练时用的记录,feature为用于提取特征的集合,这两类都有k个集合,k为整数;dataset类的集合中有一个集合直接等于off_test中的全部数据,其他的dataset类集合是off_train中的优惠券领取日期不为空的记录,不同的dataset集合是优惠券领取日期在不同日期区间内的记录,由于程序只检查领券日期是否在要求的日期区间内,并没有过滤消费日期和领券日期两项都不空的记录,因此dataset中包括用户领券记录和用户用券消费记录;feature是off_train中用户的消费日期或优惠券领取日期在不同日期区间内的数据;在为feature挑取数据时先检查消费日期是否在某个feature要求的日期区间内,如果消费日期为空,就检查优惠券领取日期是否在要求的日期区间,feature类的集合中均含有用券消费记录、不用券消费记录、领券记录三类数据;(二)其他类特征的提取:这部分特征从dataset中提取,对于不同的dataset分别提取,提取完后得到k个DataFrame,其他类特征包括:(1)用户在该dataset的日期区间内收到券的总数(2)用户在该日期区间内收到的某种优惠券的总数(3)用户在某一天内收到的券的数量(4)用户在某一天内收到某种优惠券的数量(5)这条记录是不是这个时间区间内收到相同优惠券的第一张、(6)这条记录是不是这个时间区间内收到相同优惠券的最后一张、(7)收到上一张相同的券距此条记录的间隔(8)收到下一张相同的券距此条记录的间隔前四个特征都是数量类的特征,提取的思路相同,先把要用到的若干列数据提取出来,用另外的DataFrame存放,再在每条记录后都加上一项,所有记录的这一项都是1,并将这列命名为该特征的名字,然后根据某一列用Python编程语言中pandas函数库中的groupby()函数分组;再统计每组中“1”的个数,即得到关于数量的特征;提取特征(5)(6)时,先提取用户ID、优惠券ID和领券日期三项,再根据用户ID和优惠券ID分组,即用户ID和优惠券ID都相同的记录分为一组,并求出每组中的最大领券日期和最小领券日期,然后把每条记录的领取日期和最大或最小日期比较,即得出这条记录是不是该日期区间内同种优惠券的的第一张或最后一张,即特征(5)、(6);提取特征(7)、(8)时使用提取特征(5)、(6)时得到的分组后的领取日期,然后将每条记录的领取日期和除了自己以外的其他日期做日期之间的相减,得到若干个天数差,取最小的差,得到的上一张或下一张领取相同的券的天数间隔;以上每项特征分别提取,提取完所有其他特征后,将所有其他特征合并为一个DataFrame;(三)优惠券相关特征的提取:优惠券相关特征是在dataset中提取的,优惠券相关特征包括:(...

【专利技术属性】
技术研发人员:王金程孙英华邱树浩李丹徐浩然
申请(专利权)人:青岛大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1