数据挖掘方法及装置制造方法及图纸

技术编号:16365562 阅读:36 留言:0更新日期:2017-10-10 21:36
本发明专利技术公开了一种数据挖掘方法及装置,涉及数据挖掘技术领域。其中的方法包括:将目标的内容数据输入内容卷积神经网络CNN,获取目标的内容特征向量;将目标的内容特征向量输入深度神经网络DNN,获取目标的预估数据。从而在不需要提供目标的历史数据的情况下,高效的获取目标更为准确的预估数据。

Data mining method and device

The invention discloses a data mining method and a device, relating to the technical field of data mining. The method includes the content data input convolutional neural network target CNN, target content feature vector extraction; content target feature vector input depth DNN neural network, prediction data acquisition target. Thus, more accurate prediction data can be obtained efficiently without the historical data needed to provide the target.

【技术实现步骤摘要】
数据挖掘方法及装置
本专利技术涉及数据挖掘
,特别涉及一种数据挖掘方法及装置。
技术介绍
物流调度是电商网站运营的重要环节,高效的物流调度依赖于准确的商品销量预估。因此,优化销量预估方法,对降低电商网站运营成本,提高用户购物体验而言至关重要。如果能准确预估目标商品在目标时间和地域条件下的销量,可以提前对目标商品在各区域的库存进行调度和备货,或提前引导消费者合理安排消费,从而可以节省货物运输和库存成本,提高用户的购物体验。传统销量预估方法,通常需要积累目标商品的历史销量数据,并通过历史销量数据估计目标商品的实际销量数据。这种方法过于依赖于积累目标商品的历史销量数据,不能举一反三,因此对新品销量预估的准确性较差,容易造成新品货物积压或备货不足的现象,进而造成损失。现有技术中还存在的销量预估方法是,分析目标商品的属性,并利用目标商品的属性将目标商品与其它商品相关联。例如,书籍的属性包括作者、内容分类等等。然后,从不同的属性维度统计目标商品、相关商品或属性聚合商品的统计销量数据。最后,根据得到的各维度统计销量数据,例如该作者以及该内容分类的统计销量数据,预测得到目标商品的销量。这种方法本文档来自技高网...
数据挖掘方法及装置

【技术保护点】
一种数据挖掘方法,其特征在于,包括:将目标的内容数据输入内容卷积神经网络CNN,获取目标的内容特征向量;将目标的内容特征向量输入深度神经网络DNN,获取目标的预估数据。

【技术特征摘要】
1.一种数据挖掘方法,其特征在于,包括:将目标的内容数据输入内容卷积神经网络CNN,获取目标的内容特征向量;将目标的内容特征向量输入深度神经网络DNN,获取目标的预估数据。2.如权利要求1所述的方法,其特征在于,所述方法还包括:将目标的历史数据输入统计CNN,获取目标的统计特征向量;将目标的内容特征向量和目标的统计特征向量级联后输入深度神经网络DNN,获取目标的预估数据。3.如权利要求1所述的方法,其特征在于,所述将目标的内容数据输入内容卷积神经网络CNN,获取目标的内容特征向量包括:利用文本深度表示模型,将目标的文本描述编码为二维矩阵;将所述二维矩阵输入所述内容CNN,获取目标的文本特征向量,并将所述文本特征向量作为目标的内容特征向量。4.如权利要求1所述的方法,其特征在于,所述将目标的内容数据输入内容卷积神经网络CNN,获取目标的内容特征向量包括:根据目标的图片的像素值,将目标的图片编码为多维矩阵;将所述多维矩阵输入所述内容CNN,获取目标的图片特征向量,并将所述图片特征向量作为目标的内容特征向量。5.如权利要求1所述的方法,其特征在于,所述内容CNN包括第一内容CNN和第二内容CNN;所述将目标的内容数据输入内容卷积神经网络CNN,获取目标的内容特征向量包括:利用文本深度表示模型,将目标的文本描述编码为二维矩阵;将所述二维矩阵输入第一内容CNN,获取目标的文本特征向量;根据目标的图片的像素值,将目标的图片编码为多维矩阵;将所述多维矩阵输入第二内容CNN,获取目标的图片特征向量;将所述文本特征向量与所述图片特征向量作为目标的内容特征向量。6.如权利要求2所述的方法,其特征在于,所述将目标的历史数据输入统计CNN,获取目标的统计特征向量包括:将目标在不同时段的历史数据级联为时域统计序列;将所述时域统计序列输入所述统计CNN,获取目标的时域统计特征向量,并将所述时域统计特征向量作为目标的统计特征向量。7.如权利要求2所述的方法,其特征在于,所述将目标的历史数据输入统计CNN,获取目标的统计特征向量包括:将目标的统计区域离散化为多个子区域;将目标在相同时段不同子区域内的历史数据编码为地域统计矩阵;将所述地域统计矩阵输入所述统计CNN,获取目标的地域统计特征向量,并将所述地域统计特征向量作为目标的统计特征向量。8.如权利要求2所述的方法,其特征在于,所述统计CNN包括第一统计CNN和第二统计CNN;所述将目标的历史数据输入统计CNN,获取目标的统计特征向量包括:将目标在不同时段的历史销量级联为时域统计序列;将所述时域统计序列输入第一统计CNN,获取目标的时域统计特征向量;将目标的统计区域离散化为多个子区域;将目标在相同时段不同子区域内的历史数据编码为地域统计矩阵;将所述地域统计矩阵输入第二统计CNN,获取目标的地域统计特征向量;将所述时域统计特征向量与所述地域统计特征向量作为所述目标的统计特征向量。9.如权利要求1至5中任一项所述的方法,其特征在于,所述内容CNN由卷积层、池化层、全连接层以及输出层组成。10.如权利要求2、6至8中任一项所述的方法,其特征在于,所述统计CNN由卷积层、池化层、以及输出层组成。11.如权利要求1或2所述的方法,其特征在于,所述DNN由全连接层和输出层组成,所述全连接层中的各个神经元执行非线性激活函数运算。12.如权利要求2所述的方法,其特征在于,所述方法还包括:计算目标的实际数据与预估数据的平均平方误差;利用反向传播算法,将所述平均平方误差从所述内容CNN、所述统计CNN以及所述DNN组成的组合神经网络的输出层向输入层传递,以迭代更新所述组合神经网络中各层的参数。13.如权利要求2所述的方法,其特征在于,所述方法还包括:利用样本的内容数据和样本的历史数据,对所述内容CNN、所述统计CNN以及所述DNN组成的组合神经网络进行训练。14.一种数据挖掘装置,其特征在于,包括:内容特征向量获取模块,配置为将目标的内容数据输入内容卷积神经网络CNN,获取目标的内容特征向量;预估数...

【专利技术属性】
技术研发人员:李满天王玉张波
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1