【技术实现步骤摘要】
文本分类方法、装置、计算机设备及计算机可读存储介质
[0001]本申请涉及人工智能
,特别涉及一种文本分类方法、装置、计算机设备及计算机可读存储介质。
技术介绍
[0002]自然语言处理(Nature Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。文本分类作为自然语言处理中的一个重要环节,被广泛应用于问答匹配、内容检测等多种场景。
[0003]目前,在进行文本分类时,通常是基于词典、词袋模型等对文本进行向量化表示,再基于文本的向量化表示进行特征提取以及分类,得到文本所属的类别。但是,在上述文本分类过程中,没有考虑到文本所包括的实体之间的关联关系,文本分类的准确率较低。
技术实现思路
[0004]本申请实施例提供了一种文本分类方法、装置、计算机设备及计算机可读存储介质,能够提高文本分类结果的准确率。该技术方案如下:
[0005]一方面,提供了一种文本分类方法,该方法包括:
[0006]获取目标文本对应的语义图,该语义图中的节点对应于 ...
【技术保护点】
【技术特征摘要】
1.一种文本分类方法,其特征在于,所述方法包括:获取目标文本对应的语义图,所述语义图中的节点对应于所述目标文本中的实体或所述实体对应的语义概念,所述语义图中的边用于指示任两个节点之间的关联关系;基于所述语义图,确定所述目标文本的第一分类信息;基于所述目标文本的上下文信息,确定所述目标文本的第二分类信息;基于所述第一分类信息和所述第二分类信息,得到所述目标文本的分类信息。2.根据权利要求1所述的方法,其特征在于,所述关联关系包括语义关系和语法关系中的至少一项;所述获取目标文本对应的语义图,包括:基于所述目标文本中的所述实体和对应的语义概念,确定所述语义图中的节点;若任两个第一节点所对应的实体之间具有语法关系,则在所述任两个第一节点之间添加边;若任一个第一节点具有对应的第二节点,则在所述第一节点和所述第二节点之间添加边,其中,所述第二节点对应于所述第一节点所指示实体的语义概念。3.根据权利要求1所述的方法,其特征在于,所述基于所述语义图,确定所述目标文本的第一分类信息,包括:通过第一文本分类模型中的至少一个图处理层,基于所述语义图中的所述节点以及所述任两个节点之间的关联关系,提取所述语义图的图特征;通过所述第一文本分类模型中的分类层基于所述图特征进行分类,得到所述第一分类信息。4.根据权利要求3所述的方法,其特征在于,所述通过第一文本分类模型中的至少一个图处理层,基于所述语义图中的所述节点以及所述任两个节点之间的关联关系,提取所述语义图的图特征,包括:所述至少一个图处理层为L层图处理层,在L为大于1的正整数的情况下,对于所述第一文本分类模型中的第一个图处理层,通过所述第一个图处理层对所述语义图中的所述节点和所述任两个节点之间的关联关系进行软聚类,得到中间图;对于所述第一文本分类模型中的第l+1个图处理层,通过所述第l+1个图处理层对目标中间图中的节点以及任两个节点之间的关联关系进行软聚类,得到一个新的中间图,所述目标中间图是第l个图处理层输出的中间图,l为大于或等于1小于L的正整数;基于所述第一文本分类模型中最后一个图处理层输出的中间图,确定所述图特征。5.根据权利要求4所述的方法,其特征在于,所述对于所述第一文本分类模型中的第一个图处理层,通过所述第一个图处理层对所述语义图中的所述节点和所述任两个节点之间的关联关系进行软聚类,得到中间图,包括:通过所述图处理层中的至少一个子层,对各个节点的第一节点特征和各个关联关系的第一关系特征进行至少一次更新,得到各个节点的第二节点特征和各个关联关系的第二关系特征,所述第一节点特征是节点所指示的实体或语义概念的特征表示,所述第一关系特征是关联关系的特征表示;基于所述语义图中所述各个节点的第二节点特征,对所述各个节点进行软聚类,得到所述中间图中的至少一个节点;
基于所述语义图中所述各个关联关系的第二关系特征,对所述各个关联关系进行聚类处理,得到所述中间图中所述至少一个节点之间的关联关系。6.根据权利要求5所述的方法,其特征在于,所述通过所述图处理层中的至少一个子层,对各个节点的第一节点特征和各个关联关系的第一关系特征进行至少一次更新,得到各个节点的第二节点特征和各个关联关系的第二关系特征,包括:对于所述图处理层中的任一子层,通过所述任一子层基于任一节点的第一节点特征、所述任一节点的相连节点的第一节点特征、至少一个候选关联关系的第一关系特征,确定所述任一节点对应的中间节点特征,所述候选关联关系是所述任一节点与任一相连节点之间的关联关系;通过所述任一子层对任一关联关系的第一关系特征进行线性处理,得到所述任一关联关系的中间关系特征;将所述各个节点的中间节点特征、各个关联关系的中间关系特征作为新的第一节点特征和第一关系特征输入下一子层,得到所述下一子层输出的新的中间节点特征和新的中间关系特征;将所述图处理层中最后一个子层输出的各个节点的中间节点特...
【专利技术属性】
技术研发人员:蒋海云,史树明,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。