【技术实现步骤摘要】
对二分图索引的快速神经排序
[0001]本公开总体上涉及可以提供改进的计算机性能、特征和用途的计算机学习系统和方法。更具体地,本公开涉及快速神经排序图上搜索系统和方法。
技术介绍
[0002]基于神经网络的排序由于其在复杂关系(比如,用户与项目或问题与答案之间的关系)建模方面的强大能力而被广泛采用。因为神经网络指标通常是非凸的且非对称的,在线神经网络排序(即,所谓的“快速神经排序”)被认为是具有挑战性的。通常侧重于度量排序指标的传统的近似最近邻(ANN)搜索不适用于这些复杂指标。因此,需要的是适合于快速神经排序的图上搜索方法系统和方法。
附图说明
[0003]将参考本公开的实施例,在附图中可以图示这些实施例的示例。这些附图旨在是说明性的,而不是限制性的。尽管在这些实施例的上下文中总体地描述了本公开,但是应当理解,这并不旨在将本公开的范围限制于这些特定实施例。附图中的项可能未按比例绘制。
[0004]图1描绘了神经网络排序指标的简化示例。
[0005]图2A和图2B分别描绘了与现有的最优二元函数 ...
【技术保护点】
【技术特征摘要】
1.一种用于生成二分图以确定给定输入查询的相关结果的计算机实施的方法,所述方法包括:在至少给定一组基础元素、一组查询元素和定义相关性度量的二元函数的情况下:初始化二分图;迭代包括以下各项的步骤,直到达到停止条件:将已经从所述一组基础元素中选择的基础元素插入到所述二分图中;使用基础元素搜索来搜索所述二分图中的顶点,以识别根据所述相关性度量排序的顶部查询元素候选项;响应于没有超过所述基础元素的出边数量,使用两跳边选择过程来添加从所述基础元素到所述顶部查询元素候选项中的无法从所选查询元素在两跳内到达的每个查询元素的有向边;将已经从所述一组查询元素中选择的查询元素插入到所述二分图中;使用查询元素搜索来识别所述二分图中根据所述相关性度量排序的顶部基础元素候选项;以及响应于没有超过所述查询元素的出边数量,使用所述两跳边选择过程来添加从所述查询元素到所述顶部基础元素候选项中的无法从所选基础元素在两跳内到达的每个基础元素的有向边;以及输出所述二分索引图。2.如权利要求1所述的计算机实施的方法,其中,所述二元函数是以下各项之一:所有元素总和、舍入总和、MLP拼接、MLP
‑
Em总和、DeepFM或基于神经网络的度量。3.如权利要求1所述的计算机实施的方法,其中,所述两跳边选择包括交替地插入基础元素和查询元素。4.如权利要求1所述的计算机实施的方法,其中,所述停止条件包括已经插入了所述一组基础元素和所述一组查询元素中的元素数量较小的一组元素的元素。5.如权利要求4所述的计算机实施的方法,其中,响应于所述较小的数量是所述一组基础元素中的元素数量,继续将查询元素插入到所述二分图中,直到所有查询元素都被添加到所述二分图中。6.如权利要求4所述的计算机实施的方法,其中,响应于所述较小的数量是一组查询元素中的元素数量,继续将基础元素插入到所述二分图中,直到所有基础元素都被添加到所述二分图中。7.如权利要求1所述的计算机实施的方法,其中,所述查询向量中的至少一些查询向量是随机生成的。8.如权利要求1所述的计算机实施的方法,其中,所述基础元素搜索或所述查询元素搜索中的至少一个包括贪婪搜索。9.一种用于确定给定输入查询的相关结果的计算机实施的搜索方法,所述方法包括:在至少给定查询元素、二分图、以及在给定基础元素和所述查询元素的情况下提供相关性度量的二元函数的情况下:从一组基础顶点中随机选择所述二分图上的基础顶点作为起始点;使用所述基础顶点来用成对条目初始化优先级队列,所述成对条目包括:(1)通过使用
所述基础顶点和所述查询元素作为所述二元函数的输入而获得的所述相关性度量,以及(2)所述基础顶点或所述基础顶点的标识符;将所述基础顶点视为已检查的,并且将所述一组基础顶点的剩余部分视为未检查的;响应于未满足停止条件,迭代包括以下各项的步骤:从所述优先级队列中获得顶部基础元素;使用在所述二分图中连接所述一组基础顶点和查询顶点并且具有最高相关指标的边,来识别一组顶部未...
【专利技术属性】
技术研发人员:谭树龙,赵炜捷,李平,
申请(专利权)人:百度美国有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。