The invention discloses a method and device for predicting commodity attribute data and training its model, in which the method for training and predicting commodity attribute data model includes acquiring the feature vector of a shop, the feature vector of a shop including the feature value of the shop grade, and acquiring the feature vector of commodity attribute, including the commodity belonged to. The eigenvalues of attribute classes corresponding to the class and the known attribute data of commodities are combined with the feature vectors of stores and commodity attributes to train the mathematical regression model and obtain the model for predicting the unknown attribute data of commodities. In the present invention, a more accurate prediction result can be obtained by training the mathematical regression model of predicting commodity attribute data obtained by combining the feature vectors of stores with the feature vectors of commodity attributes, and the Gauss mixture model is adopted to effectively use unsupervised clustering method to classify stores, based on word bags and vectors. Characteristic representation of commodity attributes.
【技术实现步骤摘要】
一种预测商品属性数据及训练其模型的方法和装置
本专利技术涉及计算机领域,具体是机器学习领域,尤其涉及一种预测商品属性数据及训练其模型的方法和装置。
技术介绍
目前,商品在出售前需要进行相关的市场调研以预测商品相关属性数据信息,例如,包括商品价格、销售量和市场寿命等等,尤其是商品定价,传统的定价方法来源于成本和收益方面的考量,实际操作中受定价人主观因素(经验、认知等)的影响,这样的定价方法往往忽略了当前客观市场情况和商品自身的情况。另一方面,企业通过市场调查的方法来对商品定价,即设计实验抽样得到样本并对总体估计,但这种方法得到的价格与实际存在偏差,且对资源和技术手段要求较高,不利于实施。因此,本领域的技术人员致力于开发一种预测商品属性数据及训练其模型的方法和装置
技术实现思路
有鉴于现有技术的上述缺陷,本专利技术所要解决的技术问题是提供一种能够准确预测商品属性数据的预测商品属性数据及训练其模型的方法和装置。为实现上述目的,本专利技术提供了一种训练预测商品属性数据模型的方法,包括以下步骤:获取店铺的特征向量,所述店铺的特征向量包括店铺等级的特征值,所述店铺等级的特征值基于高斯混合模型获得,其中高斯混合模型公式是其中K为模型的个数,h为所述店铺的特征向量的元素个数,πk为第k个高斯的权重,N(xi|μk,σk)则为第k个高斯的概率密度函数,其参数μk为均值,σk为方差,xi是所述店铺的特征向量的第i个元素;获取商品属性的特征向量,所述商品属性的特征向量包括商品所属品类所对应的属性类别的特征值和商品的已知属性数据;结合所述店铺的特征向量和所述商品属性的特征向量训练数学 ...
【技术保护点】
1.一种训练预测商品属性数据模型的方法,其特征在于,包括以下步骤:获取店铺的特征向量,所述店铺的特征向量包括店铺等级的特征值,所述店铺等级的特征值基于高斯混合模型获得,其中高斯混合模型公式是
【技术特征摘要】
1.一种训练预测商品属性数据模型的方法,其特征在于,包括以下步骤:获取店铺的特征向量,所述店铺的特征向量包括店铺等级的特征值,所述店铺等级的特征值基于高斯混合模型获得,其中高斯混合模型公式是其中K为模型的个数,h为所述店铺的特征向量的元素个数,πk为第k个高斯的权重,N(xi|μk,σk)则为第k个高斯的概率密度函数,其参数μk为均值,σk为方差,xi是所述店铺的特征向量的第i个元素;获取商品属性的特征向量,所述商品属性的特征向量包括商品所属品类所对应的属性类别的特征值和商品的已知属性数据;结合所述店铺的特征向量和所述商品属性的特征向量训练数学回归模型,以获得用于预测商品的未知属性数据的模型。2.如权利要求1所述的训练预测商品属性数据模型的方法,其特征在于,所述店铺的特征向量还包括店铺总销售额的特征值、店铺商品总数量的特征值、品类总销售额的特征值和该品类商品总数量的特征值。3.如权利要求1所述的训练预测商品属性数据模型的方法,其特征在于,所述商品所述品类所对应的属性类别基于词袋模型获得。4.如权利要求1所述的训练预测商品属性数据模型的方法,其特征在于,当所述商品的描述与商品所属品类所对应的属性类别匹配,则该商品所属品类所对应的属性类别赋值为1,否则赋值为0。5.如权利要求1所述的训练预测商品属性数据模型的方法,其特征在于,还包括:在训练数学回归模型前,对特征值进行预处理,所述预处理包括归一化处理和/或高维变量处理。6.如权利要求5所述的训练预测商品属性数据模型的方法,其特征在于,所述归一化处理是将特征值除以该特征值所对应的最大值,所述高维变量处理是对特征值计算相应的平方项、立方项、四次方项和五次方项。7.如权利要求1所述的训练预测商品属性数据模型的方法,其特征在于,所述商品的未知属性数据为商品的价格,所述数学回归模型为价值回归模型。8.如权利要求7所述的训练预测商品属性数据模型的方法,其特征在于,所述价值回归模型包括随机森林回归模型、随机梯度下降模型和梯度提升决策模型中...
【专利技术属性】
技术研发人员:杨骏,史建明,李杰,
申请(专利权)人:上海宏原信息科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。