销量预测及其模型训练方法、装置制造方法及图纸

技术编号:20745791 阅读:25 留言:0更新日期:2019-04-03 10:29
本发明专利技术公开了一种销量预测及其模型训练方法、装置、计算机设备及存储介质,其中模型训练方法包括:获取训练样本数据;按照样本类别将所述训练样本数据进行分类,形成多列样本数据;将所述多列样本数据逐列分发到部署在无服务器架构上的训练模型,由所述训练模型进行训练,得到训练后的模型,其中,部署在无服务器架构上的所述训练模型为在单机上运行的模型。本发明专利技术避免了训练模型在单机上运行资源有限,在分布式集群服务器上运行则需要大幅度调整训练模型的算法代码的问题。

【技术实现步骤摘要】
销量预测及其模型训练方法、装置
本专利技术涉及深度学习
,具体涉及一种销量预测及其模型训练方法、装置、计算机设备及存储介质。
技术介绍
目前,深度学习的各类训练模型已经比较成熟,这些成熟的训练模型一般运行在单机上,但是单机的CPU和内存资源比较有限。由于当前对商品销售企业(例如,零售便利店或零售超市)采集的数据量比较大,如果采用单机则需要极高的配置才能实现。而如果采用分布式集群服务器,则需要需要对训练模型的算法代码本身做出很多调整,大大增加了训练模型的算法应用的复杂度,增加了研发人员的工作量。
技术实现思路
本专利技术要解决现有技术中现有的训练模型在单机上运行资源有限,在分布式集群服务器上运行则需要大幅度调整训练模型的算法代码的问题,从而提供一种销量预测及其模型训练方法、装置、计算机设备及存储介质。本专利技术的一方面,提供了一种模型训练方法,包括:获取训练样本数据;按照样本类别将所述训练样本数据进行分类,形成多列样本数据;将所述多列样本数据逐列分发到部署在无服务器架构上的训练模型,由所述训练模型进行训练,得到训练后的模型,其中,部署在无服务器架构上的所述训练模型为在单机上运行的模型。可选地,在按照样本类别将所述训练样本数据进行分类,形成多列样本数据之后,还包括:将所述多列样本数据存储在分布式存储服务器上。可选地,按照样本类别将所述训练样本数据进行分类,形成多列样本数据包括:将所述训练样本数据打包形成数据矩阵,其中,所述数据矩阵中每一列代表一个样本类别。可选地,还包括:在所述无服务器架构上按照所述样本类别构建对应的子训练模型,其中,每个样本类别对应一个子训练模型;其中,将所述多列样本数据逐列分发到部署在无服务器架构上的训练模型包括:按照所述样本类别将每列样本数据分发到对应的子训练模型中进行训练。可选地,所述训练样本数据为商品销量数据,所述样本类别为商品类别,所述训练模型为销量预测模型。本专利技术的另一方面,提供了一种销量预测方法,包括:获取预设时间的商品销量数据;按照商品类别对所述商品销量数据进行分类,形成多列商品销量数据;逐列将所述商品销量数据输入到所述的模型训练方法训练得到的模型中,得到每个商品类别的商品销量预测结果。本专利技术的另一方面,提供了一种模型训练装置,包括:样本获取模块,用于获取训练样本数据;样本分类模块,用于按照样本类别将所述训练样本数据进行分类,形成多列样本数据;训练模块,用于将所述多列样本数据逐列分发到部署在无服务器架构上的训练模型,由所述训练模型进行训练,得到训练后的模型,其中,部署在无服务器架构上的所述训练模型为在单机上运行的模型。本专利技术的另一方面,提供了一种销量预测装置,包括:销量数据获取模块,用于获取预设时间的商品销量数据;商品数据分类模块,用于按照商品类别对所述商品销量数据进行分类,形成多列商品销量数据;预测模块,用于逐列将所述商品销量数据输入到所述的模型训练方法训练得到的模型中,得到每个商品类别的商品销量预测结果。本专利技术的另一方面,提供了一种计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述方法的步骤。本专利技术的另一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述方法的步骤。本专利技术实施例中,通过将只能在单机上运行的训练模型部署到无服务器架构上,也即是将训练模型的代码和特征部署在无服务器架构上,只需要在训练模型的代码上增加一个资源调用的函数,就可以利用无服务器架构所具有的资源调用方式,实现大数据量的模型训练,避免了训练模型在单机上运行资源有限,在分布式集群服务器上运行则需要大幅度调整训练模型的算法代码的问题。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例中学习信息的处理方法的流程图;图2为本专利技术实施例中消息队列的示意图;图3为本专利技术实施例中学习信息的处理装置的示意图;图4为本专利技术实施例计算机设备的硬件结构示意图;以及图5示出了具有处理器以及存储器的计算机设备。具体实施方式下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在本专利技术的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,下面所描述的本专利技术不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。本专利技术实施例提供了一种模型训练方法,如图1所示,该方法包括:步骤S101,获取训练样本数据。训练样本数据可以包括训练数据和检测数据,其中,训练数据用于训练模型进行训练使用,检测数据则用于检测训练模型的准确性,从而保证训练后的模型的检测精确度。步骤S102,按照样本类别将所述训练样本数据进行分类,形成多列样本数据。具体地,可以将所述训练样本数据打包形成数据矩阵,其中,所述数据矩阵中每一列代表一个样本类别。在分类之后,将所述多列样本数据存储在分布式存储服务器上。步骤S103,将所述多列样本数据逐列分发到部署在无服务器架构上的训练模型,由所述训练模型进行训练,得到训练后的模型,其中,部署在无服务器架构上的所述训练模型为在单机上运行的模型。其中,无服务器架构可以是指采用无服务器计算的架构,无服务器计算是在无需最终用户管理的基础设施上托管应用程序的新方式。无服务器计算是一种云服务,托管服务提供商会实时为你分配充足的资源,而不是让你预先为专用的服务器或容量付费。本专利技术实施例中,通过将只能在单机上运行的训练模型部署到无服务器架构上,也即是将训练模型的代码和特征部署在无服务器架构上,只需要在训练模型的代码上增加一个资源调用的函数,就可以利用无服务器架构所具有的资源调用方式,实现大数据量的模型训练,避免了训练模型在单机上运行资源有限,在分布式集群服务器上运行则需要大幅度调整训练模型的算法代码的问题。本专利技术实施例中,不限定任何训练模型的算法,只要训练模型的算法为现有的、开源的、在单机上运行的算法即可。可选地,本专利技术实施例的所述训练样本数据可以是商品销量数据,所述样本类别可以是商品类别,所述训练模型可以是销量预测模型。对于商品销量数据,可以采用矩阵的方式进行数据存储,其中,每一列代表一个商品类别,每一行代表一个时间单位的数据。从而矩阵中的每一个元素代表某个时间单位的某个商品的销量。对于一个有2500个SKU的零售便利店,可以采集近两年的商品销量数据,建立730行2500列的矩阵,用以表示最近两年的2500个SKU的销售数据。作为一种可选的实施方式,无服务器架构支持多列形式的接收数据,并对每一列构建模型,因此,本专利技术实施例的模型训练方法还包括:在所述无服务器架构上按照所述样本类别构建对应的子训练模型,其中,每个样本类别对应一个子训练模型。相应地,将所述多列本文档来自技高网...

【技术保护点】
1.一种模型训练方法,其特征在于,包括:获取训练样本数据;按照样本类别将所述训练样本数据进行分类,形成多列样本数据;将所述多列样本数据逐列分发到部署在无服务器架构上的训练模型,由所述训练模型进行训练,得到训练后的模型,其中,部署在无服务器架构上的所述训练模型为在单机上运行的模型。

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取训练样本数据;按照样本类别将所述训练样本数据进行分类,形成多列样本数据;将所述多列样本数据逐列分发到部署在无服务器架构上的训练模型,由所述训练模型进行训练,得到训练后的模型,其中,部署在无服务器架构上的所述训练模型为在单机上运行的模型。2.根据权利要求1所述的方法,其特征在于,在按照样本类别将所述训练样本数据进行分类,形成多列样本数据之后,还包括:将所述多列样本数据存储在分布式存储服务器上。3.根据权利要求1所述的方法,其特征在于,按照样本类别将所述训练样本数据进行分类,形成多列样本数据包括:将所述训练样本数据打包形成数据矩阵,其中,所述数据矩阵中每一列代表一个样本类别。4.根据权利要求1所述的方法,其特征在于,还包括:在所述无服务器架构上按照所述样本类别构建对应的子训练模型,其中,每个样本类别对应一个子训练模型;其中,将所述多列样本数据逐列分发到部署在无服务器架构上的训练模型包括:按照所述样本类别将每列样本数据分发到对应的子训练模型中进行训练。5.根据权利要求1-4任一项所述的方法,其特征在于,所述训练样本数据为商品销量数据,所述样本类别为商品类别,所述训练模型为销量预测模型。6.一种销量预测方法,其特征在于,包括:获取预设时间的商品销量数据;按照商品类别对所述商品...

【专利技术属性】
技术研发人员:李健豪
申请(专利权)人:北京超萌国际文化有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1