【技术实现步骤摘要】
一种对样本进行分类的方法及系统
本说明书涉及计算机处理
,特别涉及一种对样本进行分类的方法及系统。
技术介绍
近年来,随着计算机技术和机器学习技术的快速发展,多模态学习(MultimodalDeepLearning,MDL)得到了广泛的关注。多模态学习旨在通过机器学习的方法实现处理和理解多源模态信息的能力。例如,对于视觉语义学习而言,不仅需要充分理解视觉信号(例如,图像或视频)所包括的丰富信息,还需要以自然语言的形式表达理解结果,例如,准确回答相关问题或描述视觉信号内容。然而,多模态学习通常需要大量的训练样本且需要训练样本的类别(或标签)是已知的,这在一定程度上限制了多模态学习的广泛应用。为此,本说明书提出一种对样本进行分类的方法及系统,在小样本学习场景下,基于部分类别已知的样本,确定待分类样本的类别。
技术实现思路
本说明书实施例的一个方面提供一种对样本进行分类的方法,其特征在于,所述方法包括:获取多个输入样本,所述多个输入样本中的每一个包括内容和问询,所述多个输入样本包括至少一个待分类样 ...
【技术保护点】
1.一种对样本进行分类的方法,其特征在于,所述方法包括:/n获取多个输入样本,所述多个输入样本中的每一个包括内容和问询,所述多个输入样本包括至少一个待分类样本和至少一个参考样本,其中,/n所述至少一个待分类样本中的每一个包括待分类内容和待分类问询,/n所述至少一个参考样本中的每一个包括参考内容、参考问询和参考答复,所述参考答复是基于所述参考内容对所述参考问询的响应;/n基于样本分类模型,对所述多个输入样本进行处理,得到所述多个输入样本对应的多个处理结果;其中,对所述多个输入样本中的每一个:/n确定所述输入样本的至少一个内容特征向量,所述至少一个内容特征向量中的每一个至少与所 ...
【技术特征摘要】
1.一种对样本进行分类的方法,其特征在于,所述方法包括:
获取多个输入样本,所述多个输入样本中的每一个包括内容和问询,所述多个输入样本包括至少一个待分类样本和至少一个参考样本,其中,
所述至少一个待分类样本中的每一个包括待分类内容和待分类问询,
所述至少一个参考样本中的每一个包括参考内容、参考问询和参考答复,所述参考答复是基于所述参考内容对所述参考问询的响应;
基于样本分类模型,对所述多个输入样本进行处理,得到所述多个输入样本对应的多个处理结果;其中,对所述多个输入样本中的每一个:
确定所述输入样本的至少一个内容特征向量,所述至少一个内容特征向量中的每一个至少与所述内容与所述问询间的关联关系相关;
确定所述输入样本的至少一个问询特征向量,所述至少一个问询特征向量中的每一个至少与所述内容与所述问询间的关联关系相关;
至少根据所述至少一个内容特征向量、所述至少一个问询特征向量、所述内容的表达向量和所述问询的表达向量,确定所述处理结果;
对于所述至少一个待分类样本中的每一个,基于所述待分类样本对应的处理结果,确定所述待分类样本的分类结果,所述分类结果体现所述待分类样本中的所述待分类问询对应所述至少一个参考答复中每一个的概率。
2.如权利要求1所述的方法,其特征在于,
所述样本分类模型包括内容处理模型、问询处理模型和关系感知处理模型,所述内容处理模型、所述问询处理模型或所述关系感知处理模型中的至少一个为多层神经网络;
所述基于样本分类模型,对所述多个输入样本进行处理,得到所述多个输入样本对应的多个处理结果包括:
对所述多个输入样本中的每一个:
基于所述内容处理模型,确定所述输入样本的所述至少一个内容特征向量;
基于所述问询处理模型,确定所述输入样本的所述至少一个问询特征向量;
基于所述关系感知处理模型,至少根据所述至少一个内容特征向量、所述至少一个问询特征向量、所述内容的表达向量和所述问询的表达向量,确定所述处理结果。
3.如权利要求2所述的方法,其特征在于,所述内容处理模型的层数和所述问询处理模型的层数相同。
4.如权利要求2所述的方法,其特征在于,所述内容处理模型、所述问询处理模型或所述关系感知处理模型中的至少一个为多层图神经网络,所述多层图神经网络中每一层由N个节点全连接构成,其中,N为所述多个输入样本的数量,所述N个节点与所述多个输入样本一一对应。
5.如权利要求2所述的方法,其特征在于,基于所述内容处理模型,确定所述输入样本的至少一个内容特征向量包括:
对于所述多个输入样本中的每一个,在所述内容处理模型第i层,其中,i≥1,
确定所述输入样本的初始内容特征向量;
获取所述输入样本的初始问询特征向量;
根据第一注意力机制,基于所述初始内容特征向量和所述初始问询特征向量,确定所述输入样本在所述内容处理模型第i层的内容特征向量。
6.如权利要求5所述的方法,其特征在于,确定所述输入样本的初始内容特征向量包括:
当i=1时,至少基于所述输入样本中的所述内容的表达向量,确定所述输入样本的初始内容特征向量;
当i>1时,基于所述输入样本在所述内容处理模型第i-1层的初始内容特征向量和内容特征向量确定所述输入样本在第i层的初始内容特征向量。
7.如权利要求5所述的方法,其特征在于,根据第一注意力机制,基于所述初始内容特征向量和所述初始问询特征向量,确定所述输入样本在所述内容处理模型第i层的内容特征向量包括:
基于所述第一注意力机制,对所述初始内容特征向量进行处理,确定所述输入样本与所述多个输入样本中其他输入样本之间的内容注意力参数;
基于所述第一注意力机制,对所述初始问询特征向量进行处理,确定所述输入样本与所述多个输入样本中其他输入样本之间的问询注意力参数;
基于所述内容注意力参数、所述问询注意力参数以及所述其他输入样本在所述内容处理模型第i层的初始内容特征向量,确定所述输入样本在所述内容处理模型第i层的内容特征向量。
8.如权利要求2所述的方法,其特征在于,基于所述问询处理模型,确定所述输入样本的至少一个问询特征向量包括:
对于所述多个输入样本中的每一个,在所述问询处理模型的第x层,其中,x≥1,
确定所述输入样本的初始问询特征向量;
获取所述输入样本的初始内容特征向量;
根据第一注意力机制,基于所述初始内容特征向量和所述初始问询特征向量,确定所述输入样本在所述问询处理模型第x层的问询特征向量。
9.如权利要求8所述的方法,其特征在于,确定所述输入样本的初始问询特征向量包括:
当x=1时,至少基于所述输入样本中的所述问询的表达向量,确定所述输入样本的初始问询特征向量;
当x>1时,基于所述输入样本在所述问询处理模型第x-1层的初始问询特征向量和问询特征向量确定所述输入样本在第x层的初始问询特征向量。
10.如权利要求8所述的方法,其特征在于,根据第一注意力机制,基于所述初始内容特征向量和所述初始问询特征向量,确定所述输入样本在所述问询处理模型第x层的问询特征向量包括:
基于所述第一注意力机制,对所述初始内容特征向量进行处理,确定所述输入样本与所述多个输入样本中其他输入样本之间的内容注意力参数;
基于所述第一注意力机制,对所述初始问询特征向量进行处理,确定所述输入样本与所述多个输入样本中其他输入样本之间的问询注意力参数;
基于所述内容注意力参数、所述问询注意力参数以及所述其他输入样本在所述问询处理模型第x层的初始问询特征向量,确定所述输入样本在所述问询处理模型第x层的问询特征向量。
11.如权利要求2所述的方法,其特征在于,所述基于所述关系感知处理模型,至少根据所述至少一个内容特征向量、所述至少一个问询特征向量、所述内容的表达向量和所述问询的表达向量,确定所述处理结果,包括:
对于所述多个输入样本中的每一个,在所述关系感知处理模型的第j层,其中,j≥1,
获取所述输入样本的初始感知特征向量;
基于第二注意力机制,对所述初始感知特征向量进行处理,确定所述输入样本在所述关系感知处理模型第j层的更新感知特征向量;
将所述输入样本在所述关系感知处理模型中最后一层的更新感知特征向量,作为所述输入样本对应的处理结果。
12.如权利要求11所述的方法,其特征在于,获取所述输入样本的初始感知特征向量包括:
当j=1时,至少基于所述输入样本中的所述内容的表达向量、所述输入样本中的所述问询的表达向量、所述输入样本的所述至少一个内容特征向量和所述输入样本的所述至少一个问询特征向量,确定所述初始感知特征向量;
当j>1时,基于所述样本在所述关系感知处理模型第j-1层的初始感知特征向量和更新感知特征向量确定所述输入样本在第j层的初始感知特征向量。
13.如权利要求11所述的方法,其特征在于,所述基于第二注意力机制,对所述初始感知特征向量进行处理,确定所述输入样本在所述关系感知处理模型第j层的更新感知特征向量,包括:
基于所述第二注意力机制,对所述初始感知特征向量进行处理,确定所述输入样本与所述多个输入样本中其他输入样本之间的感知权重系数;
基于所述感知权重系数和所述其他输入样本在所述关系感知处理模型第j层的初始感知特征向量,确定所述输入样本在所述关系感知处理模型第j层的更新感知特征向量。
14.如权利要求1所述的方法,所述内容...
【专利技术属性】
技术研发人员:车正平,尹程翔,伍堃,姜波,唐剑,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。