类目识别方法、装置、电子设备、存储介质及程序产品制造方法及图纸

技术编号:39280287 阅读:6 留言:0更新日期:2023-11-07 10:54
本申请实施例提供了一种类目识别方法、装置、电子设备、存储介质及程序产品,涉及人工智能技术领域,可应用于商户类目识别的场景。该方法包括:基于获取到的主体名称信息进行文本类目识别,得到多个主体分别对应的第一类目信息;基于第一类目信息确定存在数据交互关系的主体关系对;基于主体关系对构建主体拓扑图;主体拓扑图中包括已知类目信息的第一主体和未知类目信息的第二主体;通过训练得到的图神经网络,基于主体拓扑图中第一主体的类目信息,预测得到第二主体的类目信息。本申请的实施解决了基于文本识别无法得到主体类目的问题,提高了主体类目识别的覆盖率。提高了主体类目识别的覆盖率。提高了主体类目识别的覆盖率。

【技术实现步骤摘要】
类目识别方法、装置、电子设备、存储介质及程序产品


[0001]本申请涉及人工智能
,具体而言,本申请涉及一种类目识别方法、装置、电子设备、存储介质及程序产品。

技术介绍

[0002]在商户的经营行业中,商户需要填写经营类目,以便于进行管理。然而,常常存在商户未填写类目或填写了错误类目的情况,导致无法知悉商户经营的真实类目。
[0003]在现有技术中,为了识别出商户经营的真实类目,可以采用文本模型通过商户的名称识别商户经营的类目。然而,该方法的缺点在于当商户的名称无法体现商户的类目时,文本模型无法发挥作用,导致基于文本识别可能存在无法识别得到类目的问题,所识别类目的覆盖率较低;比如针对商户名称“ABB”,通过文本识别根本无法识别出该商户经营的类目或所识别的类目准确度非常低;又如针对商户名称“个体户_XX”,无法从名称上识别该商户经营的类目。

技术实现思路

[0004]本申请实施例为解决上述至少一项技术问题,提供了一种类目识别方法、装置、电子设备、存储介质及程序产品。所述技术方案如下:
[0005]第一方面,本申请实施例提供了一种类目识别方法,包括:
[0006]基于获取到的主体名称信息进行文本类目识别,得到多个主体分别对应的第一类目信息;
[0007]基于所述第一类目信息确定存在数据交互关系的主体关系对;
[0008]基于所述主体关系对构建主体拓扑图;所述主体拓扑图中包括已知类目信息的第一主体和未知类目信息的第二主体;
[0009]基于所述主体拓扑图中所述第一主体的类目信息,识别得到所述第二主体的类目信息。
[0010]在一可行的实施例中,所述基于获取到的主体名称信息进行文本类目识别,得到多个主体分别对应的第一类目信息,包括:
[0011]针对每一主体名称信息,通过训练所得的文本类目识别模型,对该主体名称信息进行处理,得到文本特征信息,并基于该文本特征信息进行分类得到相应主体的至少一项第二类目信息及各项第二类目信息分别相应的置信度;所述主体名称信息包括主体自身的名称和主体所属组织的名称中的至少一项;
[0012]针对每一主体的第二类目信息,将满足预设的置信条件的第二类目信息确定为该主体的第一类目信息;所述置信条件包括置信度最高和置信度大于或等于预设阈值中的至少一项。
[0013]在一可行的实施例中,所述基于所述第一类目信息确定存在数据交互关系的主体关系对,包括:
[0014]从与所述第一类目信息相应的主体所设定的对象中提取存在数据交互关系的交互对象,所述交互对象对应于两个不同的对象,且同一对象与至少一个其他对象具有数据交互关系;
[0015]基于交互次数大于或等于预设次数的交互对象所相应的主体确定主体关系对。
[0016]在一可行的实施例中,所述基于所述主体关系对构建主体拓扑图,包括:
[0017]将所述主体关系对中涉及的主体作为节点、主体之间的数据交互关系作为边,构建主体拓扑图,并获取相应主体的交互特征信息作为所述节点的交互属性;
[0018]其中,所述主体拓扑图为无向图,所述交互特征信息与交互次数、交互数值和交互方式中的至少一项相关。
[0019]在一可行的实施例中,所述基于所述主体拓扑图中所述第一主体的类目信息,识别得到所述第二主体的类目信息,包括:
[0020]针对所述主体拓扑图进行特征提取操作,得到主体特征信息;
[0021]针对每一第二主体,基于所述主体特征信息以及与该第二主体具有数据交互关系的第一主体的类目信息进行分类操作,得到该第二主体与各类目相应的类目概率,并基于该类目概率确定该第二主体的类目信息。
[0022]在一可行的实施例中,通过图卷积神经网络执行所述基于所述主体拓扑图中所述第一主体的类目信息,识别得到所述第二主体的类目信息的步骤;
[0023]所述针对所述主体拓扑图进行特征提取操作,得到主体特征信息,包括:采用图卷积的方式,提取所述主体拓扑图中的主体特征信息;
[0024]所述分类操作包括节点分类、图分类和边预测中的至少一项操作。
[0025]在一可行的实施例中,在类目信息包括至少两个层级的信息时,所识别得到的所述文本类目信息和所述第二主体的类目信息属于末端类目信息,且将各末端类目信息进行信息汇总得到相应上一层级的至少一个类目信息。
[0026]在一可行的实施例中,所述基于所述主体拓扑图中所述第一主体的类目信息,识别得到所述第二主体的类目信息,包括以下至少一项:
[0027]若针对任一第二主体,存在至少两个与该第二主体具有数据交互关系的其他主体,则基于每一其他主体与该第二主体之间的数据交互次数确定两者之间的权重系数,并基于该权重系数识别该第二主体的类目信息;其中,所述其他主体包括所述第一主体和所述第二主体中的至少一项;
[0028]若针对任一第二主体,存在至少两个与该第二主体具有数据交互关系的第一主体,则基于每一第一主体与该第二主体之间的数据交互次数确定两者之间的权重系数,并基于该权重系数识别该第二主体的类目信息。
[0029]第二方面,本申请实施例提供了一种类目识别装置,包括:
[0030]第一识别模块,用于基于获取到的主体名称信息进行文本类目识别,得到多个主体分别对应的第一类目信息;
[0031]关系对确定模块,用于基于所述第一类目信息确定存在数据交互关系的主体关系对;
[0032]拓扑图构建模块,用于基于所述主体关系对构建主体拓扑图;所述主体拓扑图中包括已知类目信息的第一主体和未知类目信息的第二主体;
[0033]第二识别模块,用于通过训练得到的图神经网络,基于所述主体拓扑图中所述第一主体的类目信息,识别得到所述第二主体的类目信息。
[0034]第三方面,本申请实施例提供了一种电子设备,该电子设备包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现上述第一方面提供的类目识别方法的步骤。
[0035]第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面提供的类目识别方法的步骤。
[0036]第五方面,本申请实施例提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述第一方面提供的类目识别方法的步骤。
[0037]本申请实施例提供的技术方案带来的有益效果是:
[0038]本申请实施例提供一种类目识别的方法,具体地,针对获取到的多个主体名称信息,可以进行文本类目识别得到多个主体分别对应的第一类目信息,也即在对多个主体进行文本类目识别时,可以通过与主体相应的主体名称信息进行类目识别,得到与各主体一一对应的第一类目信息;在该基础上,可以基于第一类目信息确定存在数据交互关系的主体关系对,继而基于主体关系对构建出主体拓扑图,以基于拓扑图指示的拓扑关联,可以通过关联的主体(已知类目信息的第一主体)的类目来识别目标主体(未本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种类目识别方法,其特征在于,包括:基于获取到的主体名称信息进行文本类目识别,得到多个主体分别对应的第一类目信息;基于所述第一类目信息确定存在数据交互关系的主体关系对;基于所述主体关系对构建主体拓扑图;所述主体拓扑图中包括已知类目信息的第一主体和未知类目信息的第二主体;基于所述主体拓扑图中所述第一主体的类目信息,识别得到所述第二主体的类目信息。2.根据权利要求1所述的方法,其特征在于,所述基于获取到的主体名称信息进行文本类目识别,得到多个主体分别对应的第一类目信息,包括:针对每一主体名称信息,通过训练所得的文本类目识别模型,对该主体名称信息进行处理,得到文本特征信息,并基于该文本特征信息进行分类得到相应主体的至少一项第二类目信息及各项第二类目信息分别相应的置信度;所述主体名称信息包括主体自身的名称和主体所属组织的名称中的至少一项;针对每一主体的第二类目信息,将满足预设的置信条件的第二类目信息确定为该主体的第一类目信息;所述置信条件包括置信度最高和置信度大于或等于预设阈值中的至少一项。3.根据权利要求1或2所述的方法,其特征在于,所述基于所述第一类目信息确定存在数据交互关系的主体关系对,包括:获取与所述第一类目信息相应主体所设定的第一对象存在数据交互关系的第二对象;从所述第二对象中筛选与所述第一对象的数据交互次数大于或等于预设次数的第三对象;基于所述第一对象与所述第三对象建立主体关系对;同一第一对象至少对应于一项主体关系对。4.根据权利要求1所述的方法,其特征在于,所述基于所述主体关系对构建主体拓扑图,包括:将所述主体关系对中涉及的主体作为节点、主体之间的数据交互关系作为边,构建主体拓扑图,并获取相应主体的交互特征信息作为所述节点的交互属性;其中,所述主体拓扑图为无向图,所述交互特征信息与交互次数、交互数值和交互方式中的至少一项相关。5.根据权利要求1所述的方法,其特征在于,所述基于所述主体拓扑图中所述第一主体的类目信息,识别得到所述第二主体的类目信息,包括:针对所述主体拓扑图进行特征提取操作,得到主体特征信息;针对每一第二主体,基于所述主体特征信息以及与该第二主体具有数据交互关系的第一主体的类目信息进行分类操作,得到该第二主体与各类目相应的类目概率,并基于该类目概率确定该第二主体的类目信息。6.根据权利要求5所述的方法,其特征在于,通过图卷积神经网络执行所述基于所述主体拓扑...

【专利技术属性】
技术研发人员:殷丽秋
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1