使用图和神经网络的极限分类处理制造技术

技术编号：39715870 阅读：6 留言：0更新日期：2023-12-17 23:23

提供了用于学习分类器的系统和方法，该分类器用于在存在超过一百万个标签的极限分类下利用预测标签来注释文档

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用图和神经网络的极限分类处理

技术介绍

[0001]传统系统通过从候选集合中确定推荐来提供推荐作为接收搜索查询的结果
。
这些系统分析接收到的搜索查询的词语或上下文并将其分类为数千个候选类中的一个或多个类
。
这些分类系统可以在各种应用中
(
例如，
web
搜索
、
产品推荐和查询重写等
)。
在实践中，当候选类的大小不够大时，推荐的准确性成为问题
。
例如，候选类集合
(
例如，数千个类
)
可以不必包括准确地从数百万个可能的推荐中反映期望推荐的候选
。
提高提供推荐的准确性需要更多
、
更多的候选类
。
实际上，在不牺牲训练或分类的性能的情况下，不是仅需要数千个而是需要数百万个候选类
。
因此，期望开发在分类系统的训练和预测阶段两者中具有足够性能的
、
更好满足这些要求的技术
。
[0002]关于这些和其他一般考虑做出了本文中公开的各方面
。
此外，虽然可以讨论相对特定的问题，但是应当理解，示例不应当限于解决在本公开的背景或其他地方中标识的特定问题
。

技术实现思路

[0003]根据本公开，通过基于文档和标签的联合图生成分类器集合来训练极限分类
(extreme classification)
系统来解决上述和其它问题
。
在各...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.
一种训练分类器的计算机实现的方法，所述方法包括：接收联合图，其中所述联合图包括节点和有向边，并且其中每个节点是文档类型或是标签类型；基于所述联合图的图卷积，生成文档的多个多维向量表示，其中所述文档由所述联合图中的文档节点表示，并且其中所述文档的每个多维向量表示与相邻节点离所述联合图中的所述文档节点的不同层级对应；使用神经网络的残差层，基于所述文档的所生成的所述多个多维向量表示，来生成所述文档的经变换的多维向量表示，其中所述残差层包括残差网络和跳跃连接；使用标签注意力来生成所述文档的多个每标签多维向量表示，其中所述文档的每个每标签多维向量表示与多个标签中的标签对应，并且其中所述标签注意力将可变加权应用于所述文档的所述经变换的多维向量表示中的一个或多个经变换的多维向量表示，以生成所述每标签多维向量表示；训练针对所述多个标签中的每个标签的分类器；以及发送多个经训练的分类器以用于在标签预测过程中的部署
。2.
根据权利要求1所述的计算机实现的方法，其中相邻节点离所述文档节点的所述层级与离所述联合图中的所述文档节点的跳数对应，并且其中针对尾标签的所述标签注意力对所述文档的基于相邻节点的更高层级而被生成的多维向量表示施加更高的加权
。3.
根据权利要求1所述的计算机实现的方法，其中所述文档的所述多个多维向量表示包括基于离所述文档节点一跳之内的节点的第一多维向量表示
、
基于离所述文档节点两跳之内的节点的第二多维向量表示
、
基于离所述文档节点三跳之内的节点的第三多维向量表示
。4.
根据权利要求1所述的计算机实现的方法，其中所述图卷积包括：向量化文档和与离所述文档节点的预定数目的跳之内的节点相关联的标签的特征，以生成所述文档的所述多维向量表示
。5.
根据权利要求1所述的计算机实现的方法，其中所述多个标签的数目至少是一百万，并且其中所述文档的所述多个每标签多维向量表示的数目至少是一百万
。6.
根据权利要求1所述的计算机实现的方法，所述方法还包括：部署所述多个经训练的分类器以用于标签预测过程；接收文档；使用所述多个经训练的分类器的子集来生成针对所接收的所述文档的推荐候选标签的集合；以及发送所生成的所述推荐候选标签作为对所述文档的响应
。7.
根据权利要求1所述的计算机实现的方法，其中所述文档包括以下至少一项：
web
搜索应用中的查询，赞助搜索应用中的查询，产品推荐应用中的产品，或者内容推荐应用中的内容标题
。8.
根据权利要求1所述的计算机实现的方法，其中所述多个标签中的每个标签包括以下之一：
作为所述
web
搜索应用中的搜索结果的网页，所述赞助搜索应用中的定向内容片段，所述产品推荐应用中的另一产品，或者内容推荐应用中的另一内容标题
。9.
一种用于学习针对极限分类处理中的标签的分类器的系统，所述系统包括：处理器；以及存储器，存储计算机可执行指令，所述计算机可执行指令在由所述处理器执行时使所述系统：接收联合图，其中所述联合图包括节点和有向边，并且其中每个节点是文档类型或是标签类型；基于所述联合图的图卷积，生成文档的多个多维向量表示，其中所述文档由所述联合图中的文档节点表示，并且其中所述文档的每个多维向量表示与相邻节点离所述联合图中的所述文档节点的不同层级对应...

【专利技术属性】
技术研发人员：K，
申请(专利权)人：微软技术许可有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人