文本类别的确定方法、装置、设备及存储介质制造方法及图纸

技术编号:36780927 阅读:26 留言:0更新日期:2023-03-08 22:14
本申请公开了一种文本类别的确定方法、装置、设备及存储介质,涉及互联网技术领域,可以提高确定文本类别的效率和准确率。该方法包括:对目标文本进行预处理,得到目标文本中的N个关键词及N个关键词对应的位置信息;目标文本为工业互联网场景中的待分类文本;N为正整数;调用预设语义表示模型对N个关键词及N个关键词对应的位置信息进行处理,确定出N个关键词对应的N个向量;调用预设图神经网络模型对N个关键词对应的N个向量进行处理,确定出各N个关键词所属的文本类别;其中,预设图神经网络模型根据样本文本中的M个样本关键词对应的M个样本向量和M个样本关键词所属的文本类别得到;M为正整数。M为正整数。M为正整数。

【技术实现步骤摘要】
文本类别的确定方法、装置、设备及存储介质


[0001]本申请涉及互联网
,尤其涉及一种文本类别的确定方法、装置、设备及存储介质。

技术介绍

[0002]目前,在工业互联网场景中,可以通过知识库或知识图谱等来描述工业互联网场景中一些标准知识,从而可以通过人机交互(比如,知识问答)等形式向工业互联网从业者或其他需求者提供知识查询功能。在构建知识库或知识图谱时,一般需要先获取大量的文本信息(比如,可以是一些关键词),然后对这些文本信息所属的文本类别进行人工标注,打上分类标签,之后可以基于打上分类标签的文本信息构建知识库或知识图谱。
[0003]然而,现有确定文本信息所属的文本类别的方式,不仅效率低,影响了构建知识库或知识图谱的速度,而且受人为主观因素影响,确定分类结果的准确率也不高。

技术实现思路

[0004]本申请提供一种文本类别的确定方法、装置、设备及存储介质,可以提高确定文本类别的效率和准确率。
[0005]为达到上述目的,本申请采用如下技术方案:
[0006]第一方面,本申请提供一种文本类别的确定本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本类别的确定方法,其特征在于,包括:对目标文本进行预处理,得到所述目标文本中的N个关键词及所述N个关键词对应的位置信息;所述目标文本为工业互联网场景中的待分类文本;N为正整数;调用预设语义表示模型对所述N个关键词及所述N个关键词对应的位置信息进行处理,确定出所述N个关键词对应的N个向量;调用预设图神经网络模型对所述N个关键词对应的N个向量进行处理,确定出各所述N个关键词所属的文本类别;其中,所述预设图神经网络模型根据样本文本中的M个样本关键词对应的M个样本向量和所述M个样本关键词所属的文本类别得到;M为正整数。2.根据权利要求1所述的文本类别的确定方法,其特征在于,所述调用预设图神经网络模型对所述N个关键词对应的N个向量进行处理之前,所述方法还包括:基于所述M个样本关键词对应的M个样本向量的向量参数,将所述M个样本关键词划分为X个样本集合;一个样本集合对应一种样本向量,同一种样本向量的向量参数相同,且同一样本集合中的样本关键词所属的文本类别相同;X为正整数;根据预设关系图谱确定所述X个样本集合对应的目标关系图谱;所述预设关系图谱用于表征候选文本类别之间的关联关系;所述目标关系图谱中包括X个节点,一个节点对应一个样本集合;基于所述目标关系图谱、所述X个节点对应的X种样本向量以及各所述X个节点所属的文本类别,对所述X个节点进行信息更新,并对信息更新后的X个节点进行深度训练得到所述预设图神经网络模型。3.根据权利要求2所述的文本类别的确定方法,其特征在于,所述基于所述目标关系图谱、所述X个节点对应的X种样本向量以及各所述X个节点所属的文本类别,对所述X个节点进行信息更新,包括:基于所述目标关系图谱和预设卷积网络层数,从所述X个节点中确定出目标节点的关联节点;所述目标节点为所述X个节点中的任意一个节点;基于所述目标节点与所述关联节点的关联程度参数、所述目标节点对应的样本向量以及所述关联节点对应的样本向量,确定所述目标节点的目标函数;基于所述目标节点的目标函数和所述目标节点所属的文本类别,对所述目标节点进行信息更新。4.根据权利要求3所述的文本类别的确定方法,其特征在于,所述从所述X个节点中确定出目标节点的关联节点之后,所述方法还包括:根据所述目标节点对应的样本集合中的样本关键词的数量、所述关联节点对应的样本集合中的样本关键词的数量...

【专利技术属性】
技术研发人员:郭徽鲁效平孟祥秀段玉涛
申请(专利权)人:海尔数字科技青岛有限公司海尔卡奥斯物联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1