一种数据类别确定方法、模型及装置制造方法及图纸

技术编号:37464323 阅读:10 留言:0更新日期:2023-05-06 09:38
本发明专利技术提供一种数据类别确定方法、模型及装置,所述方法包括:将目标数据的特征信息与预先存储的每个样本特征信息进行特征交互,得到交互特征信息,所述交互特征信息用于表征所述目标数据的特征信息与所述每个样本特征信息之间的相同点和不同点;根据所述目标数据的特征信息和所述交互特征信息,确定所述目标数据的类别。在确定目标数据的类别时,可以参考预设的多种样本特征信息,综合考虑了目标数据的特征信息与样本特征信息之间的异同点,从而提升分类结果的准确性。提升分类结果的准确性。提升分类结果的准确性。

【技术实现步骤摘要】
一种数据类别确定方法、模型及装置


[0001]本专利技术涉及计算机
,尤其涉及一种数据类别确定方法、模型及装置。

技术介绍

[0002]随着计算机技术的发展,深度学习的网络模型广泛的应用在各行各业。例如,通过图像分类网络模型、文本分类网络模型等进行数据处理,以进行工单分类。
[0003]但是,不管是图像分类网络模型还是文本分类网络模型,都是基于训练数据将网络模型训练好后,用训练后的模型参数进行推理,实现工单分类的目的,这属于记忆式的学习。在进行测试推理的时候,往往只用到了训练好的模型参数,而没有使用训练集。对于庞大的工单系统,数据量大,且类型繁多,现有的分类方法完全依靠训练数据训练模型,不能很好的应对线上新增的不同描述的工单数据,导致分类结果的准确性较差。
[0004]可见,现有的分类方法存在准确性较差的问题。

技术实现思路

[0005]本专利技术实施例提供一种数据类别确定方法、模型及装置,以解决现有的分类方法准确性较差的问题。
[0006]本专利技术实施例提供了一种数据类别确定方法,所述方法包括:
[0007]将目标数据的特征信息与预先存储的每个样本特征信息进行特征交互,得到交互特征信息,所述交互特征信息用于表征所述目标数据的特征信息与所述每个样本特征信息之间的相同点和不同点;
[0008]根据所述目标数据的特征信息和所述交互特征信息,确定所述目标数据的类别。
[0009]可选地,所述目标数据的特征信息包括第一特征矩阵和第一标签向量,所述每个样本特征信息均包括第二特征矩阵和第二标签向量;
[0010]所述将目标数据的特征信息与预先存储的每个样本特征信息进行特征交互,得到交互特征信息,包括:
[0011]将所述第一特征矩阵与所述每个样本特征信息对应的第二特征矩阵进行特征交互,得到交互矩阵,所述交互矩阵拼接有交互标签向量,所述交互标签向量为根据所述第一标签向量与所述每个样本特征信息对应的第二标签向量进行标签交互得到的标签向量;
[0012]所述根据所述目标数据的特征信息和所述交互特征信息,确定所述目标数据的类别,包括:
[0013]将所述交互矩阵与所述第一特征矩阵进行特征合并,得到融合矩阵;
[0014]根据所述融合矩阵,确定所述目标数据的类别。
[0015]可选地,所述根据所述融合矩阵,确定所述目标数据的类别,包括:
[0016]将所述融合矩阵进行池化,得到池化后的融合矩阵;
[0017]根据所述池化后的融合矩阵,确定所述目标数据的类别。
[0018]可选地,在所述将目标数据的特征信息与预先存储的每个样本特征信息进行特征
交互,得到交互特征信息之前,所述方法还包括:
[0019]对多个样本数据进行特征提取,得到所述多个样本数据对应的样本特征信息;
[0020]将所述样本特征信息进行存储。
[0021]可选地,在根据所述目标数据的特征信息和所述交互特征信息,确定所述目标数据的类别之后,所述方法还包括:
[0022]在满足预设条件的情况下,将所述目标数据的特征信息作为样本特征信息进行存储,其中,所述预设条件包括如下任一项:
[0023]所述样本特征信息不包括所述目标数据的特征信息;
[0024]对所述目标数据的类别进行复检,存在分类错误。
[0025]本专利技术实施例还提供了一种数据类别确定模型,用于实现上述的数据类别确定方法,所述模型包括:
[0026]特征提取模块,包括第一特征提取器和第一标签子模块,所述第一特征提取器用于对所述目标数据进行特征提取,得到所述目标数据的第一特征矩阵,所述第一特征矩阵包括所述目标数据的第一标签向量,所述第一标签子模块用于对所述第一标签向量进行掩码;
[0027]内存模块,存储有多个样本数据的样本特征信息,所述样本特征信息包括第二特征矩阵和第二标签向量,其中,所述内存包括第二特征提取器和第二标签子模块,所述第二特征提取器用于对每个样本数据进行特征提取,得到每个样本数据的第二特征矩阵,所述第二特征矩阵包括对应的第二标签向量,所述第二标签子模块用于获取所述第二标签向量;
[0028]交互模块,用于将目标数据的特征信息与预先存储的每个样本特征信息进行特征交互,得到交互特征信息,所述交互特征信息用于表征所述目标数据的特征信息与所述每个样本特征信息之间的相同点和不同点;
[0029]输出模块,用于根据所述目标数据的特征信息和所述交互特征信息,确定所述目标数据的类别。
[0030]本专利技术实施例还提供了一种数据类别确定装置,包括:
[0031]交互模块,用于将目标数据的特征信息与预先存储的每个样本特征信息进行特征交互,得到交互特征信息,所述交互特征信息用于表征所述目标数据的特征信息与所述每个样本特征信息之间的相同点和不同点;
[0032]确定模块,用于根据所述目标数据的特征信息和所述交互特征信息,确定所述目标数据的类别。
[0033]可选地,所述目标数据的特征信息包括第一特征矩阵和第一标签向量,所述每个样本特征信息均包括第二特征矩阵和第二标签向量;
[0034]所述交互模块包括:
[0035]第一交互子模块,用于将所述第一特征矩阵与所述每个样本特征信息对应的第二特征矩阵进行特征交互,得到交互矩阵,所述交互矩阵拼接有交互标签向量,所述交互标签向量为根据所述第一标签向量与所述每个样本特征信息对应的第二标签向量进行标签交互得到的标签向量;
[0036]所述确定模块包括:
[0037]合并子模块,用于将所述交互矩阵与所述第一特征矩阵进行特征合并,得到融合矩阵;
[0038]确定子模块,用于根据所述融合矩阵,确定所述目标数据的类别。
[0039]可选地,所述确定子模块包括:
[0040]池化单元,用于将所述融合矩阵进行池化,得到池化后的融合矩阵;
[0041]确定单元,用于根据所述池化后的融合矩阵,确定所述目标数据的类别。
[0042]可选地,所述装置还包括:
[0043]提取模块,用于对多个样本数据进行特征提取,得到所述多个样本数据对应的样本特征信息;
[0044]第一存储模块,用于将所述样本特征信息进行存储。
[0045]本专利技术实施例中,通过将目标数据的特征信息与预先存储的每个样本特征信息进行特征交互,以在样本特征信息中捕捉与目标数据的特征信息之间的相同点和不同点,然后将得到的交互特征信息与目标数据的特征信息相结合,这样,在确定目标数据的类别时,可以参考预设的多种样本特征信息,综合考虑了目标数据的特征信息与样本特征信息之间的异同点,从而提升分类结果的准确性。
附图说明
[0046]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据类别确定方法,其特征在于,所述方法包括:将目标数据的特征信息与预先存储的每个样本特征信息进行特征交互,得到交互特征信息,所述交互特征信息用于表征所述目标数据的特征信息与所述每个样本特征信息之间的相同点和不同点;根据所述目标数据的特征信息和所述交互特征信息,确定所述目标数据的类别。2.根据权利要求1所述的方法,其特征在于,所述目标数据的特征信息包括第一特征矩阵和第一标签向量,所述每个样本特征信息均包括第二特征矩阵和第二标签向量;所述将目标数据的特征信息与预先存储的每个样本特征信息进行特征交互,得到交互特征信息,包括:将所述第一特征矩阵与所述每个样本特征信息对应的第二特征矩阵进行特征交互,得到交互矩阵,所述交互矩阵拼接有交互标签向量,所述交互标签向量为根据所述第一标签向量与所述每个样本特征信息对应的第二标签向量进行标签交互得到的标签向量;所述根据所述目标数据的特征信息和所述交互特征信息,确定所述目标数据的类别,包括:将所述交互矩阵与所述第一特征矩阵进行特征合并,得到融合矩阵;根据所述融合矩阵,确定所述目标数据的类别。3.根据权利要求2所述的方法,其特征在于,所述根据所述融合矩阵,确定所述目标数据的类别,包括:将所述融合矩阵进行池化,得到池化后的融合矩阵;根据所述池化后的融合矩阵,确定所述目标数据的类别。4.根据权利要求1所述的方法,其特征在于,在所述将目标数据的特征信息与预先存储的每个样本特征信息进行特征交互,得到交互特征信息之前,所述方法还包括:对多个样本数据进行特征提取,得到所述多个样本数据对应的样本特征信息;将所述样本特征信息进行存储。5.根据权利要求1所述的方法,其特征在于,在根据所述目标数据的特征信息和所述交互特征信息,确定所述目标数据的类别之后,所述方法还包括:在满足预设条件的情况下,将所述目标数据的特征信息作为样本特征信息进行存储,其中,所述预设条件包括如下任一项:所述样本特征信息不包括所述目标数据的特征信息;对所述目标数据的类别进行复检,存在分类错误。6.一种数据类别确定模型,其特征在于,用于实现权利要求1至5中任一项所述的数据类别确定方法,所述模型包括:特征提取模块,包括第一特征提取器和第一标签子模块,所述第一特征提取器用于对所述目标数据进行特征提取,得到所述目标数据的第一特征矩阵,所述...

【专利技术属性】
技术研发人员:董雷李青雯兰海
申请(专利权)人:中国铁塔股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1