商品推荐方法及装置制造方法及图纸

技术编号:36387944 阅读:59 留言:0更新日期:2023-01-18 09:51
本公开涉及电子商务技术领域,提供了一种商品推荐方法及装置。该方法包括:获取训练数据集;获取单位时间内用户为新用户的第一概率、用户信息缺失的第二概率以及用户为新商品的第三概率;基于单位时间内用户为新用户的第一概率、用户信息缺失的第二概率以及用户为新商品的第三概率,对训练数据集进行数据增强处理;提取经过数据增强处理后的训练数据集的每组训练数据的数据特征,其中,每组训练数据的数据特征,包括:用户标识码特征、用户信息特征、商品标识码特征、商品信息特征和交互特征;利用提取到的多组数据特征训练商品推荐模型;利用训练好的商品推荐模型为目标用户提供商品推荐服务。品推荐服务。品推荐服务。

【技术实现步骤摘要】
商品推荐方法及装置


[0001]本公开涉及电子商务
,尤其涉及一种商品推荐方法及装置。

技术介绍

[0002]在线上电子商务业务中,如何根据用户的个性化特征推荐合适的商品或服务给用户一直是一个重要课题。在某些相对低频场景下,如线上广告,线上租房,线上买房等,由于往往新注册用户多,用户整体粘性低,使用频率低,新上架商品多,商品上下架频繁等,导致新用户的标识码和新商品的标识码往往没有被训练过或只是被很少地训练过,另外,新用户的信息也容易出现不完整的情况,不完整的用户信息也会对训练造成影响。因此传统的商品推荐模型无法很好地对新注册用户或新上架商品进行很好地学习,商品推荐模型在这类新用户或新商品上的泛化能力弱,在提高用户转化率上有一定的局限性。
[0003]在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下技术问题:商品推荐模型对于新用户或新商品泛化能力弱的问题。

技术实现思路

[0004]有鉴于此,本公开实施例提供了一种商品推荐方法、装置、电子设备及计算机可读存储介质,以解决现有技术中,商品推荐模型对于新用户或新商品泛化能力弱的问题。
[0005]本公开实施例的第一方面,提供了一种商品推荐方法,包括:获取训练数据集,其中,训练数据集,包括:多组训练数据,每组训练数据,包括:用户标识码、用户信息、商品标识码、商品信息和关于用户与商品的交互行为的交互信息;获取单位时间内用户为新用户的第一概率、用户信息缺失的第二概率以及用户为新商品的第三概率;基于单位时间内用户为新用户的第一概率、用户信息缺失的第二概率以及用户为新商品的第三概率,对训练数据集进行数据增强处理;提取经过数据增强处理后的训练数据集的每组训练数据的数据特征,其中,每组训练数据的数据特征,包括:用户标识码特征、用户信息特征、商品标识码特征、商品信息特征和交互特征;利用提取到的多组数据特征训练商品推荐模型;利用训练好的商品推荐模型为目标用户提供商品推荐服务。
[0006]本公开实施例的第二方面,提供了一种商品推荐装置,包括:第一获取模块,被配置为获取训练数据集,其中,训练数据集,包括:多组训练数据,每组训练数据,包括:用户标识码、用户信息、商品标识码、商品信息和关于用户与商品的交互行为的交互信息;第二获取模块,被配置为获取单位时间内用户为新用户的第一概率、用户信息缺失的第二概率以及用户为新商品的第三概率;处理模块,被配置为基于单位时间内用户为新用户的第一概率、用户信息缺失的第二概率以及用户为新商品的第三概率,对训练数据集进行数据增强处理;提取模块,被配置为提取经过数据增强处理后的训练数据集的每组训练数据的数据特征,其中,每组训练数据的数据特征,包括:用户标识码特征、用户信息特征、商品标识码特征、商品信息特征和交互特征;训练模块,被配置为利用提取到的多组数据特征训练商品推荐模型;服务模块,被配置为利用训练好的商品推荐模型为目标用户提供商品推荐服务。
[0007]本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
[0008]本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
[0009]本公开实施例与现有技术相比存在的有益效果是:因为本公开实施例通过获取训练数据集,其中,训练数据集,包括:多组训练数据,每组训练数据,包括:用户标识码、用户信息、商品标识码、商品信息和关于用户与商品的交互行为的交互信息;获取单位时间内用户为新用户的第一概率、用户信息缺失的第二概率以及用户为新商品的第三概率;基于单位时间内用户为新用户的第一概率、用户信息缺失的第二概率以及用户为新商品的第三概率,对训练数据集进行数据增强处理;提取经过数据增强处理后的训练数据集的每组训练数据的数据特征,其中,每组训练数据的数据特征,包括:用户标识码特征、用户信息特征、商品标识码特征、商品信息特征和交互特征;利用提取到的多组数据特征训练商品推荐模型;利用训练好的商品推荐模型为目标用户提供商品推荐服务,因此,采用上述技术手段,可以解决现有技术中,商品推荐模型对于新用户或新商品泛化能力弱的问题,进而提高商品推荐模型对于新用户或新商品的泛化能力。
附图说明
[0010]为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0011]图1是本公开实施例的应用场景的场景示意图;
[0012]图2是本公开实施例提供的一种商品推荐方法的流程示意图;
[0013]图3是本公开实施例提供的一种商品推荐装置的结构示意图;
[0014]图4是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
[0015]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
[0016]下面将结合附图详细说明根据本公开实施例的一种商品推荐方法和装置。
[0017]图1是本公开实施例的应用场景的场景示意图。该应用场景可以包括终端设备101、102和103、服务器104以及网络105。
[0018]终端设备101、102和103可以是硬件,也可以是软件。当终端设备101、102和103为硬件时,其可以是具有显示屏且支持与服务器104通信的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等;当终端设备101、102和103为软件时,其可以安装在如上的电子设备中。终端设备101、102和103可以实现为多个软件或软件模
块,也可以实现为单个软件或软件模块,本公开实施例对此不作限制。进一步地,终端设备101、102和103上可以安装有各种应用,例如数据处理应用、即时通信工具、社交平台软件、搜索类应用、购物类应用等。
[0019]服务器104可以是提供各种服务的服务器,例如,对与其建立通信连接的终端设备发送的请求进行接收的后台服务器,该后台服务器可以对终端设备发送的请求进行接收和分析等处理,并生成处理结果。服务器104可以是一台服务器,也可以是由若干台服务器组成的服务器集群,或者还可以是一个云计算服务中心,本公开实施例对此不作限制。
[0020]需要说明的是,服务器104可以是硬件,也可以是软件。当服务器104为硬件时,其可以是为终端设备101、102和103提供各种服务的各种电子设备。当服务器104为软件时,其可以是为终端设备101、102和103提供各种服务的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种商品推荐方法,其特征在于,包括:获取训练数据集,其中,所述训练数据集,包括:多组训练数据,每组训练数据,包括:用户标识码、用户信息、商品标识码、商品信息和关于用户与商品的交互行为的交互信息;获取单位时间内用户为新用户的第一概率、用户信息缺失的第二概率以及用户为新商品的第三概率;基于所述单位时间内用户为新用户的第一概率、用户信息缺失的第二概率以及用户为新商品的第三概率,对所述训练数据集进行数据增强处理;提取经过所述数据增强处理后的训练数据集的每组训练数据的数据特征,其中,每组训练数据的数据特征,包括:用户标识码特征、用户信息特征、商品标识码特征、商品信息特征和交互特征;利用提取到的多组数据特征训练商品推荐模型;利用训练好的商品推荐模型为目标用户提供商品推荐服务。2.根据权利要求1所述的方法,其特征在于,所述基于所述单位时间内用户为新用户的第一概率、用户信息缺失的第二概率以及用户为新商品的第三概率,对所述训练数据集进行数据增强处理,包括:对所述训练数据集进行如下多次采样:将所述训练数据集中的用户标识码按照所述第一概率保留原始值,将不保留原始值的用户标识码置为掩码;将所述训练数据集中的用户信息按照所述第二概率保留原始值,将不保留原始值的用户信息置为掩码;将所述训练数据集中的商品标识码按照所述第三概率保留原始值,将不保留原始值的商品标识码置为掩码。3.根据权利要求1所述的方法,其特征在于,所述提取经过所述数据增强处理后的训练数据集的每组训练数据的数据特征,包括:从所述用户标识码中提取所述用户标识码特征;从所述用户信息中提取所述用户信息特征;从所述商品标识码中提取所述商品标识码特征;从所述商品信息中提取所述商品信息特征;从所述用户与商品的交互行为的交互信息中提取所述交互特征。4.根据权利要求1所述的方法,其特征在于,所述提取经过所述数据增强处理后的训练数据集的每组训练数据的数据特征,包括:利用映射方法对每组训练数据中数量类型的数据进行处理,得到每组训练数据的数据特征;和/或利用编码方法对每组训练数据中非数量类型的数据进行处理,得到每组训练数据的数据特征。5.根据权利要求1所述的方法,其特征在于,所述利用提取到的多组数据特征训练商品推荐模型,包括:获取所述训练数据集中每组训练数据对应的用于表示用户对商品是否存在转化行...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:深圳须弥云图空间科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1