一种匹配方法以及相关设备组成比例

技术编号:26342677 阅读:30 留言:0更新日期:2020-11-13 20:36
本申请涉及人工智能领域中的标签匹配技术,公开了一种匹配方法以及相关设备。方法包括:同一图结构数据中包括搜索对象的描述信息和类别信息这两类不同的信息,将图结构数据输入图神经网络,通过图神经网络执行特征更新操作,以得到的第一特征,第一特征在与搜索对象的描述信息对应的特征基础上,融合了类别信息的特征,根据第一特征,生成指示搜索对象与各个预定义特征之间的预测匹配率的第一预测匹配信息,根据第一预测匹配信息、正确匹配信息和损失函数,对图神经网络进行训练。相对于仅利用搜索对象的描述信息为搜索对象匹配预定义特征,提高了匹配结果的精度;利用图神经网络充分融合类别信息,进一步提高结果的精度。

【技术实现步骤摘要】
一种匹配方法以及相关设备
本申请涉及人工智能领域,尤其涉及一种匹配方法以及相关设备。
技术介绍
人工智能(ArtificialIntelligence,AI)是利用计算机或者计算机控制的机器模拟、延伸和扩展人的智能。人工智能包括研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。目前,利用神经网络为搜索系统中搜索对象匹配标签是人工智能一种可行的研究方向。具体的,根据搜索对象的描述文本,通过神经网络从候选分类标签集合中选取与搜索对象匹配的分类标签。但目前这种分类标签的匹配方法的精度较低,一种更高精度的分类标签的匹配方法亟待推出。
技术实现思路
本申请实施例提供了一种匹配方法以及相关设备,训练后的图神经网络能够根据描述信息和类别信息为搜索对象匹配预定义特征,相对于仅利用描述信息为搜索对象匹配预定义特征,提高了匹配结果的精度;利用图神经网络处理该图结构数据,有利于在第一特征中充分融合类别信息,进一步提高匹配结果的精度。为解决上述技术问题,本申请实施例提供以下技术方案:第一方面,本本文档来自技高网...

【技术保护点】
1.一种匹配方法,其特征在于,所述方法包括:/n获取图结构数据,所述图结构数据中包括第一节点、第二节点和边数据,所述第一节点用于指示搜索对象的描述信息,所述第二节点用于指示与搜索对象对应的类别信息,所述边数据反映所述第一节点与所述第二节点之间的对应关系;/n将所述图结构数据输入至图神经网络中,得到所述第一节点的第一特征;/n根据每个所述第一节点的第一特征,生成每个所述第一节点的第一预测匹配信息,第一预测匹配信息指示搜索对象与N个预定义特征之间的预测匹配率,所述N为大于或等于1的整数;/n根据所述第一预测匹配信息,从所述N个预定义特征中选取与搜索对象匹配的预定义特征。/n

【技术特征摘要】
1.一种匹配方法,其特征在于,所述方法包括:
获取图结构数据,所述图结构数据中包括第一节点、第二节点和边数据,所述第一节点用于指示搜索对象的描述信息,所述第二节点用于指示与搜索对象对应的类别信息,所述边数据反映所述第一节点与所述第二节点之间的对应关系;
将所述图结构数据输入至图神经网络中,得到所述第一节点的第一特征;
根据每个所述第一节点的第一特征,生成每个所述第一节点的第一预测匹配信息,第一预测匹配信息指示搜索对象与N个预定义特征之间的预测匹配率,所述N为大于或等于1的整数;
根据所述第一预测匹配信息,从所述N个预定义特征中选取与搜索对象匹配的预定义特征。


2.根据权利要求1所述的方法,其特征在于,所述第二节点为与搜索对象对应的分类标签的信息,所述边数据反映M个第一节点和N个第二节点之间的连接关系,指示搜索对象的描述信息和分类标签之间的对应关系,所述M为大于或等于1的整数;
所述得到所述第一节点的第一特征,包括:
得到所述第一特征和所述第二节点的第二特征;
所述根据每个所述第一节点的第一特征,生成每个所述第一节点的第一预测匹配信息,所述第一预测匹配信息指示搜索对象与N个预定义特征之间的预测匹配率,包括:
计算所述第一特征与所述第二特征之间的相似度,以得到每个所述第一节点的第一预测匹配信息,所述第一预测匹配信息指示搜索对象与N个分类标签之间的预测匹配率。


3.根据权利要求1所述的方法,其特征在于,所述第二节点为与搜索对象对应的搜索词的信息,所述边数据指示搜索对象的描述信息和搜索词之间的对应关系,所述第一特征为在与搜索对象的描述信息对应的特征基础上,融合了与搜索词对应的特征;
所述根据每个所述第一节点的第一特征,生成每个所述第一节点的第一预测匹配信息,包括:
将所述第一特征输入至分类网络,得到所述分类网络输出的每个所述第一节点的第一预测匹配信息。


4.根据权利要求1所述的方法,其特征在于,所述第二节点包括第三节点和第四节点,所述第三节点为与搜索对象对应的分类标签的信息,所述第四节点为与搜索对象对应的搜索词的信息,所述边数据包括第一边数据和第二边数据,所述第一边数据反映M个第一节点和N个第三节点之间的对应关系,所述第二边数据反映M个第一节点和P个第四节点之间的对应关系,所述M和所述P均为大于或等于1的整数;
所述得到所述第一节点的第一特征,包括:
得到所述第一特征和所述第三节点的第三特征;
所述根据每个所述第一节点的第一特征,生成每个所述第一节点的第一预测匹配信息,所述第一预测匹配信息指示搜索对象与N个预定义特征之间的预测匹配率,包括:
计算所述第一特征与所述第三特征之间的相似度,以得到每个所述第一节点的第一预测匹配信息,所述第一预测匹配信息指示搜索对象与N个分类标签之间的预测匹配率。


5.根据权利要求1至4任一项所述的方法,其特征在于,所述图结构数据为根据以下中的一项或多项生成的:与搜索对象对应的用户交互行为数据和标注数据;
其中,所述用户交互行为数据包括至少一个第一记录,所述第一记录包括第三搜索对象的标识信息、第一搜索词和第一交互次数,所述第一交互次数记录通过所述第一搜索词所触发的对所述第三搜索对象进行点击操作的次数,搜索对象的标识信息用于获取搜索对象的描述信息;
所述标注数据包括至少一个第二记录,所述第二记录指示一个搜索对象的标识信息与至少一个分类标签的对应关系。


6.一种神经网络的训练方法,其特征在于,所述方法包括:
获取图结构数据,所述图结构数据中包括第一节点、第二节点和边数据,所述第一节点用于指示搜索对象的描述信息,所述第二节点用于指示与搜索对象对应的类别信息,所述边数据反映所述第一节点与所述第二节点之间的对应关系;
将所述图结构数据输入至图神经网络中,得到所述第一节点的第一特征;
根据每个所述第一节点的第一特征,生成每个所述第一节点的第一预测匹配信息,第一预测匹配信息指示搜索对象与N个预定义特征之间的预测匹配率,所述N为大于或等于1的整数;
根据所述第一预测匹配信息、正确匹配信息和第一损失函数,对所述图神经网络进行训练,所述正确匹配信息指示搜索对象与N个预定义特征之间的正确匹配率,所述第一损失函数的训练目标为拉近所述第一预测匹配信息和所述正确匹配信息之间的相似度。


7.根据权利要求6所述的方法,其特征在于,所述第二节点为与搜索对象对应的分类标签的信息,所述边数据反映M个第一节点和N个第二节点之间的连接关系,指示搜索对象的描述信息和分类标签之间的对应关系,所述M为大于或等于1的整数;
所述将所述图结构数据输入至图神经网络中,包括:
将所述图结构的初始特征输入至所述图神经网络中,所述图结构的初始特征包括所述第一节点的初始特征;
所述方法还包括:
计算所述第一节点的初始特征和所述第二节点的第二特征之间的相似度,以得到第二预测匹配信息,所述第二预测匹配信息指示搜索对象与N个分类标签之间的预测匹配率;
根据所述第二预测匹配信息、正确匹配信息和第二损失函数,对所述图神经网络进行训练,所述第二损失函数的训练目标为拉近所述第二预测匹配信息和所述正确匹配信息之间的相似度。


8.根据权利要求6所述的方法,其特征在于,所述第二节点包括第三节点和第四节点,所述第三节点为与搜索对象对应的分类标签的信息,所述第四节点为与搜索对象对应的搜索词的信息,所述边数据包括第一边数据和第二边数据,所述第一边数据反映M个第一节点和N个第三节点之间的对应关系,所述第二边数据反映M个第一节点和P个第四节点之间的对应关系,所述M和所述P均为大于或等于1的整数;
所述将所述图结构数据输入至图神经网络中,包括:
将所述图结构的初始特征输入至所述图神经网络中,所述图结构的初始特征包括所述第一节点的初始特征;
所述方法还包括:
计算所述第一节点的初始特征和所述第三节点的第三特征之间的相似度,以得到第三预测匹配信息,所述第三预测匹配信息指示搜索对象与N个分类标签之间的预测匹配率;
根据所述第三预测匹配信息、正确匹配信息和第三损失函数,对所述图神经网络进行训练,所述第三损失函数的训练目标为拉近所述第三预测匹配信息和所述正确匹配信息之间的相似度。


9.根据权利要求6至8任一项所述的方法,其特征在于,所述图结构数据为根据以下中的一项或多项生成的:与搜索对象对应的用户交互行为数据和标注数据;
其中,所述用户交互行为数据包括至少一个第一记录,所述第一记录包括第三搜索对象的标识信息、第一搜索词和第一交互次数,所述第一交互次数记录通过所述第一搜索词所触发的对所述第三搜索对象进行点击操作的次数,搜索对象的标识信息用于获取搜索对象的描述信息;
所述标注数据包括至少一个第二记录,所述第二记录指示一个搜索对象的标识信息与至少一个分类标签的对应关系。


10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
获取用户交互行为数据,所述用户交互行为数据包括至少一个第一记录,所述第一记录包括第三搜索对象的标识信息、第一搜索词和第一交互次数,所述第一交互次数记录通过所述第一搜索词所触发的对所述第三搜索对象进行点击操作的次数;
获取标注数据,所述标注数据包括至少一个第二记录,所述第二记录指示一个搜索对象的标识信息与至少一个分类标签的对应关系;
将所述用户交互行为数据中包括的所有搜索对象的标识信息确定为第一标识信息集合,并从所述标注数据中选取与所述第一标识信息集合对应的至少一个第二记录;
根据所述第一标识信息集合,获取每个搜索对象的描述信息;
其中,搜索对象的描述信息用于生成第一节点,与所述第一标识信息集合对应的至少一个第二记录用于生成所述第三节点和所述第一边数据,所述用户交互行为数据用于生成所述第四节点和所述第二边数据。


11.根据权利要求6所述的方法,其特征在于,第二节点中包括与分类标签对应的至少一个第一字符,所述方法还包括:
训练设备对每个第一字符进行向量化处理,得到与第二节点对应的至少一个第二向量;
获取所述第二节点的标识信息,并对所述第二节点的标识信息进行向量化处理,得到第三向量;
将所述第三向量和所述与所述至少一个第二向量的平均值组合,以生成所述第二节点的初始特征。


12.根据权利要求8所述的方法,其特征在于,所述第二节点包括第三节点和第四节点,所述第三节点为与搜索对象对应的分类标签的信息,所述第三节点中包括与分类标签对应的至少一个第一字符,所述第四节点为与搜索对象对应的搜索词的信息,所述第四节点中包括与搜索词对应的至少一个第一字符,所述方法还包括:
获取所述第三节点的标识信息,并对所述第三节点的标识信息进行向量化处理,得到第四向量;
对所述第三节点中每个第一字符进行向量化处理,得到与所...

【专利技术属性】
技术研发人员:卢彪朱杰明毛科龙何秀强
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1