System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 非结构化数据的分类方法、装置、设备及存储介质制造方法及图纸_技高网

非结构化数据的分类方法、装置、设备及存储介质制造方法及图纸

技术编号:40528266 阅读:7 留言:0更新日期:2024-03-01 13:48
本公开提供一种非结构化数据的分类方法、装置、设备及存储介质。非结构化数据的分类方法包括:获取待处理的非结构化数据;将所述非结构化数据转换为包含预设字段的内容列表;基于多个维度对所述内容列表进行特征提取,得到对应的多维度数据特征;基于所述多维度数据特征进行分类得到分类结果。

【技术实现步骤摘要】

本公开涉及计算机,尤其涉及一种非结构化数据的分类方法、装置、设备及存储介质


技术介绍

1、随着互联网的普及和技术的进步,大量无序、杂乱和多样化的非结构化数据不断产生和对非结构化数据进行分类和分级有着广泛的应用需求,这些非结构化数据不断增多和对应分类分级需求的提升,推动了非结构化数据分类分级技术的研究和发展。传统的人工分类方法往往需要依赖领域专家的知识和经验,并且需要耗费大量的时间和人力。除此之外,由于数据规模的增加和种类的多样化,人工分类面临着许多困难。


技术实现思路

1、本公开提出一种非结构化数据的分类方法、装置、设备、存储介质及程序产品,以在一定程度上解决非结构化数据的分类不准确且效率低的技术问题。

2、本公开第一方面,提供了一种非结构化数据的分类方法,包括:

3、获取待处理的非结构化数据;

4、将所述非结构化数据转换为包含预设字段的内容列表;

5、基于多个维度对所述内容列表进行特征提取,得到对应的多维度数据特征;

6、基于所述多维度数据特征进行分类得到分类结果。

7、本公开第二方面,提供了一种非结构化数据的分类装置,包括:

8、获取模块,用于获取待处理的非结构化数据;

9、内容模块,用于将所述非结构化数据转换为包含预设字段的内容列表;

10、特征模块,用于基于多个维度对所述内容列表进行特征提取,得到对应的多维度数据特征;

11、分类模块,用于基于所述多维度数据特征进行分类得到分类结果。

12、本公开第三方面,提供了一种电子设备,其特征在于,包括一个或者多个处理器、存储器;和一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被所述一个或多个处理器执行,所述程序包括用于执行根据第一方面或第二方面所述的方法的指令。

13、本公开第四方面,提供了一种包含计算机程序的非易失性计算机可读存储介质,当所述计算机程序被一个或多个处理器执行时,使得所述处理器执行第一方面或第二方面所述的方法。

14、本公开第五方面,提供了一种计算机程序产品,包括计算机程序指令,当所述计算机程序指令在计算机上运行时,使得计算机执行第一方面所述的方法。

15、从上面所述可以看出,本公开提供的一种非结构化数据的分类方法及相关设备,通过将非结构化数据转换为包含预设字段的内容列表,从多个维度对内容列表进行特征提取,并进行分类。不仅能够准确地基于非结构化数据的内容和安全性进行分类,也能够提高分类的效率。

本文档来自技高网...

【技术保护点】

1.一种非结构化数据的处理方法,其特征在于,包括:

2.根据权利要求1的方法,其特征在于,所述将所述非结构化数据转换为包含预设字段的内容列表,包括:

3.根据权利要求1的方法,其特征在于,所述基于多个维度对所述内容列表进行特征提取,得到对应的多维度数据特征,包括:

4.根据权利要求3的方法,其特征在于,基于多个维度对所述内容列表进行特征提取,包括如下多种:

5.根据权利要求4的方法,其特征在于,所述将所述关键字特征、所述正则表达特征或所述属性特征中的多个进行特征融合得到所述第一数据特征,包括:

6.根据权利要求4的方法,其特征在于,

7.根据权利要求1的方法,其特征在于,还包括:对所述分类结果设置对应的标识。

8.一种非结构化数据的分类装置,包括:

9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至7任意一项所述的方法。

10.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行权利要求1至7任一所述方法。

...

【技术特征摘要】

1.一种非结构化数据的处理方法,其特征在于,包括:

2.根据权利要求1的方法,其特征在于,所述将所述非结构化数据转换为包含预设字段的内容列表,包括:

3.根据权利要求1的方法,其特征在于,所述基于多个维度对所述内容列表进行特征提取,得到对应的多维度数据特征,包括:

4.根据权利要求3的方法,其特征在于,基于多个维度对所述内容列表进行特征提取,包括如下多种:

5.根据权利要求4的方法,其特征在于,所述将所述关键字特征、所述正则表达特征或所述属性特征中的多个进行特征融合得到所述第...

【专利技术属性】
技术研发人员:林山罗华辉张禛郑少明
申请(专利权)人:厦门安胜网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1