电子商务市场中基于人工智能的相似性制造技术

技术编号:37162189 阅读:17 留言:0更新日期:2023-04-06 22:28
系统和方法提供了基于在线购物系统中的至少物品和查询之间的相似性来确定物品列表。具体地,该系统和方法基于机器学习模型和相似性索引数据的组合来确定物品、用户、产品、消息、评论和查询之间的相似性。机器学习模型(例如,变换器模型和神经网络模型)生成在线购物系统中的物品、查询和其他数据的嵌入式向量表示。可以至少基于与在线购物系统中的物品相关联的数据对机器学习模型进行预训练,并且基于各种相似性映射对机器学习模型进行微调:物品到物品、用户到物品、查询到物品等。相似性索引数据包括用于基于接收到的查询确定相似性范围内的物品的k近邻索引数据。围内的物品的k近邻索引数据。围内的物品的k近邻索引数据。

【技术实现步骤摘要】
电子商务市场中基于人工智能的相似性
[0001]相关申请的交叉引用
[0002]本申请要求于2022年1月28日提交的第17/587,698号、名为“SIMILARITY BASED ON ARTIFICIAL INTELLIGENCE INE

COMMERCE MARKETPLACE”的美国专利申请的优先权,该专利申请要求于2021年9月30日提交的第63/250,695号、名为“SIMILARITY BASED ON ARTIFICIAL INTELLIGENCE INE

COMMERCE MARKETPLACE”的美国临时申请的优先权,这两项申请各自的全部公开内容通过全文引用一并于此。

技术介绍

[0003]传统的电子商务市场系统通过基于接收到的对商品的查询生成这种商品的列表来促进购物体验。这些系统需要具有可扩展性,同时保持高性能并且提高识别买家所寻求物品的准确性水平。一些在线购物网站已经成长得如此之多,以至于它们致力于容纳对超过一亿的活跃买家可购买的超过十亿的物品。此外,一些在线购物网站通过显示彼此相似的商品的列表来向买家提供对相关商品的选择或推荐。一些其他在线购物网站基于各个买家的个人资料和过去购物历史提供个性化的购物体验。
[0004]因此,期望开发一种更好地满足买家和在线购物网站的需求的技术,以提高可扩展性方面的鲁棒性和性能,同时提高提供满足买家期望的商品列表的准确性。本文所公开的方面正是关于这些考虑和其他一般考虑而提出的。而且,尽管可能讨论相对具体的问题,但是应当理解,这些示例不应限于解决在本公开的
技术介绍
或其他部分中标识的具体问题。

技术实现思路

[0005]根据本公开,通过使用机器学习模型自动生成相似性索引数据和使用该相似性索引数据确定物品、产品、用户和查询之间的相似性来解决上述问题和其他问题。所公开的技术基于相似性生成物品列表来作为对查询的响应。
[0006]本公开涉及在在线购物网站上自动生成商品列表。具体地,本公开使用在识别彼此相似的商品、查询、买家、卖家、买家与卖家之间的消息、产品评论、用户评论等方面是鲁棒的、可扩展的和准确的人工智能。人工智能包括用于预测相似性的一个或多个经训练的模型(例如,变换器模型(transformer model)、神经网络模型等)。例如,所公开的技术使用确定物品、查询和买家之间的相似性的变换器模型。
[0007]变换器模型的训练包括两个阶段:预训练和微调。预训练器基于两种类型的训练数据的组合对变换器模型进行预训练。第一类型的训练数据包括作为一般知识的一般词汇与单词和文本的定义的集合。第二类型的训练数据包括与在线购物网站上正在销售的商品相关联的数据。与商品相关联的数据包括产品名称、产品描述、产品规格等。微调器通过各种类型的训练数据对经预训练的变换器模型进行微调,这些训练数据至少包括在线购物网站中用于描绘广告、搜索和编目的各个域中的相似性的用例的以下组合:用户到物品、物品到物品、查询到物品、查询到查询、以及物品到产品。在各方面,术语“物品”是指一个或多个
产品的列表。在一些方面,术语“产品”是指产品目录中的条目。
[0008]具体地,所公开的技术包括生成和更新用于k近邻(kNN)搜索的索引以确定物品、用户、查询和产品之间的相似性。例如,所公开的技术执行离线处理,该离线处理用于学习在线购物网站中列出的物品和产品的表示并且生成kNN索引。所公开的技术还执行在线处理,该在线处理用于基于接收到的查询处理kNN搜索,并且基于来自用户的交互数据和对物品列表的更新来更新kNN索引。
[0009]本公开涉及用于基于相似性生成物品列表的系统和方法。该计算机实现的方法包括:接收查询;基于接收到的查询,使用模型生成嵌入式向量(embedded vector)数据。嵌入式向量数据指示接收到的查询和物品之间的相似性的向量表示。模型包括基于至少在一个或多个关系中的相似性的经训练的模型,该一个或多个关系包括:物品到物品、用户到物品、或查询到物品。该方法还包括:基于使用相似性索引数据和嵌入式向量数据的相似性索引搜索来确定用于列出的一个或多个物品;发送该一个或多个物品的列表;以及基于所确定的用于列出的一个或多个物品更新相似性索引数据。该方法还包括至少使用与在线购物系统中的物品相关联的数据对模型进行预训练。模型包括变换器模型。该方法还包括:基于与至少以下一项或多项之间的相似性相关联的训练数据对模型进行微调:物品到物品、用户到物品、产品到物品、或查询到物品;以及生成嵌入式向量数据。
[0010]该方法还包括基于嵌入式向量数据生成相似性索引数据。相似性索引数据包括具有分层结构形式的多个节点层的图。模型包括孪生网络(Siamese network),并且该方法还包括:从训练数据中检索输入对,该输入对指示以下一项或多项的基准真实(ground truth)示例:物品到物品、用户到物品、产品到物品、或查询到物品;以及基于该输入对来训练孪生网络,孪生网络包括多个编码器,每个编码器对该输入对中的一个输入进行编码以生成嵌入向量(embedding vector)数据。相似性索引数据包括k近邻索引。相似性索引数据包括分层可导航小世界图(Hierarchical Navigable Small World graph)。该方法还包括基于所确定的用于列出的一个或多个物品生成该一个或多个物品的列表来作为对接收到的查询的回应。所公开的技术还涉及一种存储计算机可执行指令的计算机可读存储介质。该计算机可执行指令当由处理器执行时使系统执行如上概述的方法。
[0011]提供本
技术实现思路
是为了以简化的形式介绍概念的选集,这些内容将在下面的具体实施方式中进一步加以描述。本
技术实现思路
不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。示例的附加方面、特征和/或优点将部分地在以下描述中阐述,并且部分地从该描述中将是显而易见的,或者可以通过实践本公开而获知。
附图说明
[0012]参考以下附图来描述非限制性和非穷举性的示例。
[0013]图1示出了根据本公开的各方面的用于生成搜索结果的示例系统的概述图。
[0014]图2示出了根据本公开的各方面的用于生成相似性索引数据的示例系统的概述图。
[0015]图3示出了根据本公开的各方面的基于查询来生成物品列表的示例。
[0016]图4示出了根据本公开的各方面的基于查询来生成物品列表的示例。
[0017]图5示出了根据本公开的各方面的用于生成相似性索引数据的方法的示例。
[0018]图6示出了根据本公开的各方面的用于基于相似性来生成物品列表的方法的示例。
[0019]图7是示出可以用来实践本公开的各方面的计算设备的示例物理组件的框图。
具体实施方式
[0020]下面参考附图来更全面地描述本公开的各个方面,附图是本公开的一部分,并且示出了具体的示例方面。然而,本公开的不同方面可以以许多不同的方式来实现,并且不应被本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于基于相似性生成物品列表的计算机实现的方法,所述方法包括:接收查询;基于接收到的查询,使用模型生成嵌入式向量数据,其中,所述嵌入式向量数据指示接收到的查询和物品之间的相似性的向量表示,并且其中,所述模型包括基于至少在一个或多个关系中的相似性的经训练的模型,所述一个或多个关系包括:物品到物品、用户到物品、或查询到物品;基于使用相似性索引数据和所述嵌入式向量数据的相似性索引搜索来确定用于列出的一个或多个物品;发送所述一个或多个物品的列表;以及基于所确定的用于列出的一个或多个物品更新所述相似性索引数据。2.根据权利要求1所述的计算机实现的方法,所述方法还包括:至少使用与在线购物系统中的物品相关联的数据对所述模型进行预训练,其中,所述模型包括变换器模型;基于与至少以下一项或多项之间的相似性相关联的训练数据对所述模型进行微调:物品到物品、用户到物品、产品到物品、或查询到物品;以及生成所述嵌入式向量数据。3.根据权利要求1所述的计算机实现的方法,所述方法还包括:基于所述嵌入式向量数据生成所述相似性索引数据,其中,所述相似性索引数据包括具有分层结构形式的多个节点层的图。4.根据权利要求2所述的计算机实现的方法,其中,所述模型包括孪生网络,并且所述方法还包括:从所述训练数据中检索输入对,所述输入对指示以下一项或多项的基准真实示例:物品到物品、用户到物品、产品到物品、或查询到物品;以及基于所述输入对来训练所述孪生网络,所述孪生网络包括多个编码器,每个编码器对所述输入对中的一个输入进行编码以生成嵌入向量数据。5.根据权利要求1所述的计算机实现的方法,其中,所述相似性索引数据包括k近邻索引。6.根据权利要求1所述的计算机实现的方法,其中,所述相似性索引数据包括分层可导航小世界图。7.根据权利要求1所述的计算机实现的方法,所述方法还包括:基于所确定的用于列出的一个或多个物品生成所述一个或多个物品的列表,来作为对接收到的查询的回应。8.一种基于相似性生成物品列表的系统,所述系统包括:处理器;以及存储计算机可执行指令的存储器,所述计算机可执行指令当被执行时使所述系统执行包括以下各项的方法:接收查询;基于接收到的查询,使用模型生成嵌入式向量数据,其中,所述嵌入式向量数据指示接收到的查询和物品之间的相似性的向量表示,并且其中,所述模型包括基于至少在一个或
多个关系中的相似性的经训练的模型,所述一个或多个关系包括:物品到物品、用户到物品、或查询到物品;基于使用相似性索引数据和所述嵌入式向量数据的相似性索引搜索来确定用于列出的一个或多个物品;发送所述一个或多个物品的列表;以及基于所确定的用于列出的一个或多个物品更新所述相似性索引数据。9.根据权利要求8所述的系统,所述计算机可执行指令当被执行时还使所述系统执行包括以下各项的方法:至少使用与在线购物系统中的物品相关联的数据对所述模型进行预训练,其中,所述模型包括变换器模型;基于与至少以下一项或多项之间的相似性相关联的训练数据对所述模型进行微调:物品到物品、用户到物品、产品到物品、或查询到物品;以及生成所述嵌入式向量数据。10.根据权利要求8所述的系统,所述计算机可执行指令当被执行时还使所述系统执行包括以下各项的方法:基于所述嵌入式向量数据...

【专利技术属性】
技术研发人员:塞尔丘克
申请(专利权)人:电子湾有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1