搜索引擎处的项目选项识别和搜索结果呈现制造技术

技术编号:36419328 阅读:16 留言:0更新日期:2023-01-20 22:26
推荐引擎在针对与搜索引擎处的搜索查询相关联的用户确定诸如项目特征的项目选项时,利用包括机器学习神经网络模型在内的深度学习方法来识别具有公共购买历史的用户的用户组集群。所确定的项目选项在搜索结果页面处或作为项目列表呈现给用户,作为针对项目选项类别的项目选项的可选选项的预选,从而识别并提供特定项目变体。搜索结果页面可以通过排除具有相同项目选项类别集合或相同识别的项目选项的项目来精简,从而提供允许提供并由用户识别其他上下文相关项目的搜索结果页面或项目列表。列表。列表。

【技术实现步骤摘要】
搜索引擎处的项目选项识别和搜索结果呈现


[0001]本文描述的方面涉及使用深度学习识别项目选项并以精简搜索结果页面的方式呈现项目选项。

技术介绍

[0002]搜索引擎用于通过识别与搜索查询相关的网页来导航互联网或其他网络。响应于搜索查询来呈现搜索结果页面,并且搜索结果页面包括到相关网页的链接。一些搜索引擎是网站特定的,这意味着搜索引擎返回与网站的不同网页相对应的搜索结果。这帮助用户通过启用单词搜索来导航网站,而不是用户必须浏览网站结构以找到特定网页或输入特定URL(统一资源定位符)。其他搜索引擎通过爬取互联网来识别整个互联网的搜索结果,并将找到的相关网页在搜索结果页面处呈现给用户。

技术实现思路

[0003]从高层面来看,本文描述的方面涉及使用深度学习识别项目选项并以精简搜索结果页面的方式呈现项目选项。
[0004]项目通常具有项目的各种模型或变体。例如,手机可以具有许多型号,每个型号都具有不同的特征,即项目选项。项目选项通常是项目选项类别的部分,例如具有不同颜色和存储选项的新版本手机。
[0005]为了响应于搜索引擎处的搜索查询来识别针对项目选项类别的项目选项,采用了经训练的机器学习模型。可以使用多个用户的已知用户特征和用户购买历史来训练经训练的机器学习模型。当被采用时,经训练的机器学习模型使用搜索查询作为输入,并通过识别具有公共用户历史的用户组并基于用户组的公共用户历史预测项目选项来输出项目选项。即,经训练的模型识别类似于与搜索查询相关联的用户的用户,并通过确定组成员将基于组成员的用户历史选择项目选项的概率以及基于相对于针对项目选项类别的其他项目选项的概率识别项目选项来识别项目选项。
[0006]一旦被确定,项目选项可以作为预选呈现在显示器处。项目选项可以作为项目列表或搜索结果页面的部分进行呈现。在项目列表或搜索结果页面处,项目选项是从项目选项类别的其他项目选项中预选择的,并且针对项目选项类别的项目选项被配置为具有已经选择的所识别的项目选项的可选选项。当被提供为搜索结果页面的部分时,搜索结果页面可以排除包括相同项目选项或相同项目选项类别集合的其他项目列表。
[0007]本
技术实现思路
意在以简化形式介绍在本公开的具体实施方式中进一步描述的构思的选择。本
技术实现思路
不意在标识所请求保护的主题的关键特征或基本特征,也不意在帮助确定所请求保护的主题的范围。将提供本技术的附加目的、优点和新颖特征,并且在阅读本公开或通过本技术的实践学习之后将部分地对本领域技术人员变得明显。
附图说明
[0008]下面参考附图详细描述本技术,其中:
[0009]图1是根据本文描述的方面的可以采用示例推荐引擎的操作环境;
[0010]图2是根据本文描述的方面的被生成以提供示例项目列表的图形用户界面,该示例项目列表具有由图1的推荐引擎识别的项目选项;
[0011]图3是根据本文描述的方面的被生成以提供示例搜索结果页面的另一图形用户界面,该示例搜索结果页面包括具有由图1的推荐引擎识别的项目选项的项目列表;
[0012]图4和图5是根据本文描述的各方面的用于使用图1的推荐引擎来识别并呈现项目选项的示例方法;以及
[0013]图6是根据本文描述的方面的适合于实现所描述的技术的示例计算设备。
具体实施方式
[0014]常规搜索引擎通过爬取网页并返回与搜索查询相关的网站的网页来向用户提供搜索结果。一些搜索引擎返回与搜索查询相关的网页,该网页是特定网站的部分。由于互联网的庞大和不断变化的性质,常规搜索引擎倾向于返回大量的搜索结果,因为存在与搜索查询相关的相当大数量的网页。
[0015]大量的潜在搜索结果对于搜索引擎和互联网用户是有问题的。具体地,用户只能查看这么多的搜索结果,并且在用户界面处只能提供有限数量的搜索结果。例如,在提交本申请时,在常用搜索引擎中输入的“12码鞋”的搜索提供了超过850,000,000个相关网页。很难想象,一个人可以筛选这些网页中的每一个,并且没有办法在显示器上呈现哪怕是该数量的一小部分的网站。因此,由于互联网的性质,如何在搜索结果页面处提供搜索结果对于互联网的运行至关重要。否则,一个人找到上下文相关网页作为搜索结果的概率接近于零,因为仅少数搜索结果可以呈现在显示器上,而且不可能在搜索结果中逐页筛选如此大的数量,从而实际上使得无法导航互联网。
[0016]以另一种方式来描述该问题,存在与任何给定搜索查询紧密匹配的很多潜在搜索结果,用户识别与搜索上下文相关但不是精确匹配的网页的概率接近于零,因为这种网页将穿插在大量的搜索结果内,并可能仅首先出现在搜索结果排名的深处。例如,如果用户搜索“12码鞋”,但发现12码的红色运动鞋最相关,则用户将可能永远不会识别一双12码的红色运动鞋,因为850,000,000个结果中可能穿插的相关网页很少,而第一个相关结果可能是850,000,000个中排名靠后的几千个相关网页。因此,搜索引擎对搜索结果进行排名并显示的方式对互联网的运行至关重要,否则用户必须提供足够特定的搜索查询以区别于例如850,000,000个结果,假设这种特异性在不知道网页的确切内容或其URL的情况下甚至是可能的。
[0017]为了克服该问题的一些方面,搜索引擎寻求以给予用户定位预期网页的能力的方式来提供搜索结果。在电子商务的上下文中,这包括为用户提供定位预期项目的能力,该预期项目存储在具有搜索引擎的电子商务网站的项目列表数据库中。为用户提供搜索结果的一些方法包括采用深度学习以更好地预测与搜索查询相关的搜索结果,该搜索结果最可能与用户的意图相关。
[0018]然而,该领域的一些常规机器学习技术用途有限,因为在许多情况下,没有足够的
关于特定用户的数据来针对许多可能的搜索查询准确预测用户的意图。作为补偿,已经采用了一些无监督学习技术,但结果可能仍然不够准确以将最佳搜索结果与数百万个潜在搜索结果区分开。
[0019]用于克服这些挑战中的一些挑战的另一方法包括搜索结果的特定呈现方法。一些现有方法提供重新排序或打乱排名靠前的搜索结果,以避免所有排名靠前的搜索结果与同一网页或项目相关。
[0020]本技术提供了可以用于帮助克服这些挑战的附加机制,该附加机制在
中不是常规的。为了克服这些挑战中的一些挑战,本技术的一些方面采用基于类似用户组进行搜索结果预测的深度学习方法,这在与常规方法相比时允许使用关于与搜索查询相关联的用户的较少数据进行更准确的预测。通过用较少的用户数据进行更准确的预测,可以向用户呈现最好的相关搜索结果,因此使用户能够实际上识别预期搜索结果,例如网页或项目,并且该技术可以用于更多用户,包括数据有限的那些用户。
[0021]此外,本技术描述了以精简方式向用户提供搜索结果的呈现方法,因此允许通过排除类似的搜索结果来呈现与搜索查询具有不同上下文关系的附加搜索结果。例如,一些呈现方法提供可选择的选项,从而允许排除一些搜索结果并能够呈现其他上下文相关的搜索结果。
[0022]此外,如将更本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种由一个或多个处理器执行的用于提供项目选项的计算机化的方法,所述方法包括:在搜索引擎处接收搜索查询,所述搜索查询是从用户计算设备接收的;识别对应于所述搜索查询的项目,所述项目与项目数据库内的项目列表相关联,其中,所述项目列表包括不同的项目选项;从在所述项目的项目选项类别内可用的多个项目选项中确定项目选项,所述项目选项基于具有公共用户历史的用户组来确定;以及向所述用户计算设备提供来自所述项目数据库的项目列表作为针对所述搜索查询的搜索结果,所述项目列表包括具有所述项目选项的项目。2.根据权利要求1所述的方法,还包括:在所述搜索引擎处将所述多个项目选项呈现为针对所述项目选项类别的可选选项集合,所述项目选项被呈现为来自所述可选选项集合的预选。3.根据权利要求1所述的方法,还包括:使用多个用户的已知用户特征和用户购买历史来训练神经网络,其中,所述项目选项通过以下方式确定:采用经训练的神经网络识别具有所述公共用户历史的所述用户组,并基于所述用户组的所述公共用户历史预测所述项目选项。4.根据权利要求1所述的方法,其中,确定所述项目选项包括:执行汤普森采样以从针对所述用户组识别的项目选项中选择所述项目选项。5.根据权利要求1所述的方法,其中,所述项目与多个项目选项类别相关联,每个项目选项类别包括项目选项,并且其中,所述方法还包括确定针对每个项目选项类别的一个项目选项。6.根据权利要求5所述的方法,其中,确定针对每个项目选项类别的所述一个项目选项包括:采用经训练的神经网络来确定每个项目选项的概率值,所述概率值指示每个项目选项与所述用户组的所述公共用户历史之间的相关的强度,所述一个项目选项在每个项目选项类别内具有最大概率值。7.根据权利要求5所述的方法,其中,针对每个项目选项类别的所述一个项目选项是独立确定的。8.根据权利要求1所述的方法,其中,所述项目列表被提供为搜索结果页面的一部分,其中,所述搜索结果页面排除针对所述项目的具有所述项目选项的其他项目列表。9.一种或多种计算机存储介质,存储计算机可读指令,所述计算机可读指令在由处理器执行时,使所述处理器执行用于提供项目选项的操作,所述操作包括:使用包括多个用户的已知用户特征和用户购买历史的训练数据集来训练机器学习模型;采用使用搜索查询作为输入的经训练的机器学习模型来确定项目的项目选项类别内的项目选项,所述经训练的机器学习模型用于通过以下方式来确定针对与所述搜索查询相关联的用户的所述项目选项:识别具有公共用户历史的用户组,并基于所述用户组的所述公共用户历史预测所述项目选项;以及导致生成图形用户界面,所述图形用户界面包括针对所述项目的项目列表,所述项目列表具有针对与所述项目选项相关联的项目选项类别的可选选项集合,通过采用所述经训<...

【专利技术属性】
技术研发人员:桑托什
申请(专利权)人:电子湾有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1