商品价格层次的获取方法、系统、计算机设备和存储介质技术方案

技术编号:20449509 阅读:20 留言:0更新日期:2019-02-27 03:20
本申请涉及一种商品价格层次的获取方法、系统、计算机设备和存储介质。该方法包括:获取预设商品类型在预设时间段内的发票数据,并从发票数据提取特征变量;根据特征变量生成与发票数据对应的待预测数据;将待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据输出值获取待预测数据的价格层次类型;统计价格层次类型中待预测数据的数量,将统计数量最多的待预测数据对应的价格层次类型确定为预设商品类型的价格在预设时间段内的价格层次。本方法基于大数据的智能计算对商品类型的价格层次类型进行分类,由于发票数据具有真实性以及可靠性,能够提供真实、准确的成交价格数据,实现对该商品类型的成交价格的价格层次类型的准确分类。

【技术实现步骤摘要】
商品价格层次的获取方法、系统、计算机设备和存储介质
本申请涉及数据挖掘
,特别是涉及一种商品价格层次的获取方法、系统、计算机设备和存储介质。
技术介绍
一件商品的市场成交价格往往会受到多种不同因素而发生波动,而商品的成交价格是企业的经营决策的重要参考指标。传统技术中,目前商品价格所处的价格层次通常是通过人工经验逐一对商品在市面上标售的零售价格进行分析给出,但是,市面上标售的商品价格往往是不真实、不准确的,与该商品真正的成交价格不相等,其可靠性低,根据市面上标售的商品价格难以准确分析出目前商品价格所处的价格层次,为企业的发展经营提供决策依据。
技术实现思路
基于此,有必要针对上述市面上标售的零售价格与商品真正的成交价格不相等难以准确分析出目前商品价格所处的价格层次,为企业的发展经营提供决策依据技术问题,提供一种商品价格层次的获取方法、系统、计算机设备和存储介质。一种商品价格层次的获取方法,所述方法包括:获取预设商品类型在预设时间段内的发票数据,并从所述发票数据中提取特征变量;根据各所述特征变量生成与所述发票数据对应的待预测数据;将所述待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据所述输出值获取所述待预测数据的价格层次类型;统计所述价格层次类型中所述待预测数据的数量,将统计数量最多的所述待预测数据对应的价格层次类型确定为所述预设商品类型的价格在预设时间段内的价格层次。在其中一个实施例中,所述将所述待预测数据输入至预先构建的随机森林分类模型中获取输出值的步骤之前,包括:获取所述预设商品类型的历史发票数据,并从所述历史发票数据提取特征变量;根据所述特征变量生成与所述历史发票数据对应的训练数据;根据所述历史发票数据中商品单价的价格层次类型对所述训练数据进行标注,根据训练数据以及对应的价格层次类型生成训练样本,并形成训练样本集;多次从所述训练样本集中随机挑选若干个所述训练样本生成训练样本子集,得到若干个训练样本子集;利用所述训练样本子集构建决策树,得到由若干个决策树形成随机森林分类模型。在其中一个实施例中,所述根据所述历史发票数据中商品单价的价格层次类型对所述训练数据进行标注的步骤,包括:获取所述历史发票数据中的商品单价,根据所述商品单价以及所述历史发票数据的数量计算所述预设商品类型的历史平均单价;若所述历史发票数据中的商品单价与所述历史平均单价的差值大于预设阈值,且所述商品单价大于所述历史平均单价,则将所述历史发票数据对应的训练数据的价格层次类型标注为价格偏高类型;若所述历史发票数据中的商品单价与所述历史平均价的差值大于所述预设阈值,且所述商品单价小于所述历史平均单价,则将所述历史发票数据对应的训练数据的价格层次类型标注为价格偏低类型;若所述历史发票数据中的商品单价与所述历史平均单价的差值小于所述预设阈值,则将所述历史发票数据对应的训练数据的价格层次标记为价格适中类型。在其中一个实施例中,所述根据各所述特征变量生成与所述发票数据对应的待预测数据的步骤,包括:根据所述发票数据中对应的数据字段的字段信息确定各所述特征变量的特征值;将各所述特征变量作为所述待预测数据的数据字段,将所述特征变量的特征值作为所述待预测数据的数据字段,生成待预测数据。在其中一个实施例中,所述特征变量包括购买方企业信用指标以及销售方企业信用指标;所述根据所述发票数据中对应的数据字段的字段信息确定各所述特征变量的特征值的步骤,包括:获取所述发票数据中的购买方企业税号以及销售方企业税号;根据所述购买方企业税号以及所述销售方税号分别查找对应的购买方企业信用等级以及所述销售方企业信用等级;将所述购买方企业信用等级以及所述销售方企业信用等级量化生成购买方企业信用指标值以及销售方企业信用指标值;将所述购买方企业信用指标值以及所述销售方企业信用指标值分别确定为所述购买方企业信用指标的特征值以及所述销售方企业信用指标的特征值。在其中一个实施例中,所述特征变量包括购买方企业地区以及销售方企业地区;所述根据所述发票数据中对应的数据字段的字段信息确定各所述特征变量的特征值的步骤,包括:获取所述发票数据中的购买方企业地址信息以及销售方企业地址信息;根据所述购买方企业地址信息以及所述销售方企业地址信息获取购买方企业地区编号以及销售方企业地区编号;将所述购买方企业地区编号以及所述销售方企业地区编号分别确定为所述购买方企业地区的特征值以及所述销售方企业地区的特征值。一种商品价格层次的获取系统,所述系统包括:特征变量获取模块,用于获取预设商品类型在预设时间段内的发票数据,并从所述发票数据中提取特征变量;待预测数据获取模块,用于根据各所述特征变量生成与所述发票数据对应的待预测数据;价格层次分类模块,用于将所述待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据所述输出值获取所述待预测数据的价格层次类型;价格层次确定模块,用于统计所述价格层次类型中所述待预测数据的数量,将统计数量最多的所述待预测数据对应的价格层次类型确定为所述预设商品类型的价格在预设时间段内的价格层次。在其中一个实施例中,所述系统还包括随机森林分类模型创建模块;随机森林分类模型创建模块用于获取所述预设商品类型的历史发票数据,并从所述历史发票数据提取特征变量;根据所述特征变量生成与所述历史发票数据对应的训练数据;根据所述历史发票数据中商品单价的价格层次类型对所述训练数据进行标注,根据训练数据以及对应的价格层次类型生成训练样本,并形成训练样本集;多次从所述训练样本集中随机挑选若干个所述训练样本生成训练样本子集,得到若干个训练样本子集;利用所述训练样本子集构建决策树,得到由若干个决策树形成随机森林分类模型。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取预设商品类型在预设时间段内的发票数据,并从所述发票数据中提取特征变量;根据各所述特征变量生成与所述发票数据对应的待预测数据;将所述待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据所述输出值获取所述待预测数据的价格层次类型;统计所述价格层次类型中所述待预测数据的数量,将统计数量最多的所述待预测数据对应的价格层次类型确定为所述预设商品类型的价格在预设时间段内的价格层次。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取预设商品类型在预设时间段内的发票数据,并从所述发票数据中提取特征变量;根据各所述特征变量生成与所述发票数据对应的待预测数据;将所述待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据所述输出值获取所述待预测数据的价格层次类型;统计所述价格层次类型中所述待预测数据的数量,将统计数量最多的所述待预测数据对应的价格层次类型确定为所述预设商品类型的价格在预设时间段内的价格层次。上述商品价格层次的获取方法、系统、计算机设备和存储介质中,通过获取最近一段时间段内的某一商品类型的发票数据,实现对该商品类型的成交价格的价格层次的预测分类,由于发票数据的真实性以及可靠性,为该商品类型的价格层次类型的分类提供真实、准确的成交价格数据,提高该商品类型的价格所处价格层次分析结果的准确性,为企业的发展经营提供决策依据。附图本文档来自技高网...

【技术保护点】
1.一种商品价格层次的获取方法,所述方法包括:获取预设商品类型在预设时间段内的发票数据,并从所述发票数据中提取特征变量;根据各所述特征变量生成与所述发票数据对应的待预测数据;将所述待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据所述输出值获取所述待预测数据的价格层次类型;统计所述价格层次类型中所述待预测数据的数量,将统计数量最多的所述待预测数据对应的价格层次类型确定为所述预设商品类型的价格在预设时间段内的价格层次。

【技术特征摘要】
1.一种商品价格层次的获取方法,所述方法包括:获取预设商品类型在预设时间段内的发票数据,并从所述发票数据中提取特征变量;根据各所述特征变量生成与所述发票数据对应的待预测数据;将所述待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据所述输出值获取所述待预测数据的价格层次类型;统计所述价格层次类型中所述待预测数据的数量,将统计数量最多的所述待预测数据对应的价格层次类型确定为所述预设商品类型的价格在预设时间段内的价格层次。2.根据权利要求1所述的方法,其特征在于,所述将所述待预测数据输入至预先构建的随机森林分类模型中获取输出值的步骤之前,包括:获取所述预设商品类型的历史发票数据,并从所述历史发票数据提取特征变量;根据所述特征变量生成与所述历史发票数据对应的训练数据;根据所述历史发票数据中商品单价的价格层次类型对所述训练数据进行标注,根据训练数据以及对应的价格层次类型生成训练样本,并形成训练样本集;多次从所述训练样本集中随机挑选若干个所述训练样本生成训练样本子集,得到若干个训练样本子集;利用所述训练样本子集构建决策树,得到由若干个决策树形成随机森林分类模型。3.根据权利要求2所述的方法,其特征在于,所述根据所述历史发票数据中商品单价的价格层次类型对所述训练数据进行标注的步骤,包括:获取所述历史发票数据中的商品单价,根据所述商品单价以及所述历史发票数据的数量计算所述预设商品类型的历史平均单价;若所述历史发票数据中的商品单价与所述历史平均单价的差值大于预设阈值,且所述商品单价大于所述历史平均单价,则将所述历史发票数据对应的训练数据的价格层次类型标注为价格偏高类型;若所述历史发票数据中的商品单价与所述历史平均价的差值大于所述预设阈值,且所述商品单价小于所述历史平均单价,则将所述历史发票数据对应的训练数据的价格层次类型标注为价格偏低类型;若所述历史发票数据中的商品单价与所述历史平均单价的差值小于所述预设阈值,则将所述历史发票数据对应的训练数据的价格层次标记为价格适中类型。4.根据权利要求1所述的方法,其特征在于,所述根据各所述特征变量生成与所述发票数据对应的待预测数据的步骤,包括:根据所述发票数据中对应的数据字段的字段信息确定各所述特征变量的特征值;将各所述特征变量作为所述待预测数据的数据字段,将所述特征变量的特征值作为所述待预测数据的数据字段,生成待预测数据。5.根据权利要求4所述的方法,其特征在于,所述特征变量包括购买方企业信用指标以及销售方企业信用指标;所述根据所述发票数据中对应的数据字段的字段信息确定各所述特征变量的特征值的步骤,包括:获取所述发票数据中的购买...

【专利技术属性】
技术研发人员:夏良超
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1