System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种结构化数据分类方法、装置、及服务器制造方法及图纸_技高网

一种结构化数据分类方法、装置、及服务器制造方法及图纸

技术编号:40602158 阅读:6 留言:0更新日期:2024-03-12 22:07
本发明专利技术提供一种结构化数据分类方法、装置、及服务器,涉及数据安全技术领域,该方法包括:从待分类结构化数据中提取待分类结构化数据的标识信息;根据多个业务专业语言组成的信息,确定与待分类结构化数据的标识信息相关联的关联信息;对关联信息进行数据分类处理,得到待分类结构化数据的业务类别。本发明专利技术实施例能够基于标识信息找到与其关联的信息,利用该信息进行分类,提高了分类的准确性。

【技术实现步骤摘要】

本专利技术涉及数据安全,尤其涉及一种结构化数据分类方法、装置、及服务器


技术介绍

1、在数据安全中,数据采集是数据安全生命周期的先导阶段,其中数据分类是以“属性”为标准的。具体而言,数据分类是按照数据的内容、来源、特征、作用等属性,将具有相同属性的数据进行划分和归类,此种数据分类的目的在于为后续针对某一类数据的特定属性而采取具体的安全保护措施提供基础。数据的自动分类有利于实现数据高效管理。

2、按照现有的分类方法划分,通过一些传统文本分类的文本处理工具,利用上下文逻辑等处理方式提取出有效的实体信息。结构化数据不同于一般用于文本分类的报道或者交流文本,数据库中核心的信息都包含在大量名词实体中,而非上下文的逻辑。采用现有方式进行数据提取再分类导致无法获取结构化数据的主要含义,从而分类的准确率比较低。


技术实现思路

1、本专利技术提供一种结构化数据分类方法、装置、及服务器,相比于利用上下文进行逻辑处理而进行分类处理,能够基于标识信息找到与其关联的信息,利用该信息进行分类,提高了分类的准确性。

2、第一方面,本专利技术实施例提供一种结构化数据分类方法,包括:

3、从待分类结构化数据中提取所述待分类结构化数据的标识信息;

4、根据多个业务专业语言组成的信息,确定与所述待分类结构化数据的标识信息相关联的关联信息;

5、对所述关联信息进行数据分类处理,得到所述待分类结构化数据的业务类别。

6、上述方法,通过提取待分类结构化数据的标识信息,从多个业务专业语言组成的信息中找到与标识信息相关联的信息,利用该信息进行数据分类,相比于利用上下文进行逻辑处理而进行分类处理,能够基于标识信息找到业务专业语言组成的信息,利用该信息进行分类,提高了分类的准确性。

7、在一种可能实施的方式中,根据多个业务专业语言组成的信息,确定与所述待分类结构化数据的标识信息相关联的关联信息,包括:

8、从多个业务专业语言组成的信息构建的知识图谱中,查找与所述待分类结构化数据的标识信息相关联的信息;

9、若查找到与所述待分类结构化数据的标识信息相关联的信息,则根据查找到的信息确定所述关联信息。

10、上述方法,能够通过多个业务专业语言组成的信息构建的知识图谱,查找与标识信息相关联的信息,利用该信息进行分类处理,这样基于知识图谱找到相关联的信息,提高了运算效率。

11、在一种可能实施的方式中,从多个业务专业语言组成的信息构建的知识图谱中,查找与所述待分类结构化数据的标识信息相关联的信息,包括:

12、若第一信息的个数为一个,则将所述第一信息作为查找到的信息;其中,所述第一信息为从多个业务专业语言组成的信息构建的知识图谱中,与所述待分类结构化数据的标识信息存在关联关系的信息;

13、若所述第一信息的个数为多个,则从多个业务专业语言组成的信息构建的知识图谱中,查找与所述待分类结构化数据所在数据库的数据库信息存在关联关系的第二信息,并将目标信息作为查找到的信息;其中,所述目标信息为所述第二信息与所述第一信息之间相同的信息。

14、上述方法,能够在第一信息为多个时,利用数据库相关信息再次查找存在关联关系的第二信息,利用第二信息辅助第一信息的方式,确定查找到的信息,提高了查找的准确率。

15、在一种可能实施的方式中,根据查找到的信息确定所述关联信息,包括:

16、若查找到的信息的个数为一个,则将查找到的信息作为所述关联信息;

17、若查找到的信息的个数为多个,则从多个所述目标信息中,挑出一个目标信息作为所述关联信息。

18、上述方法,能够在查找到的信息为一个时,直接将其作为关联信息,再查找到多个信息时,从第一信息和第二信息相同的信息中,挑出一个目标信息作为关联信息,这样在不同个数的查找到的信息时进行不同的处理,提高了挑选的准确率。

19、在一种可能实施的方式中,从多个所述目标信息中,挑出一个目标信息作为所述关联信息,包括:

20、从多个业务专业语言组成的信息构建的知识图谱中,查找与所述待分类结构化数据中每条数据存在关联关系的第三信息;

21、根据多个所述目标信息在多个所述第三信息中的数量,确定每个所述目标信息对应的权重;

22、根据每个所述目标信息对应的权重,从多个所述目标信息中挑出一个目标信息作为所述关联信息。

23、上述方法,通过待分类结构化数据中每条数据存在关联关系的第三信息,基于多个目标信息在多个第三信息中的数量,确定多个目标信息的权重,基于权重进行选择,这样利用结构化数据的数据本身辅助找出选择的信息,提高了选择的准确率。

24、在一种可能实施的方式中,根据多个所述目标信息在多个所述第三信息中的数量,确定每个所述目标信息对应的权重,包括:

25、将第一数值和每个所述目标信息对应的第二数值之间的差值,作为每个所述目标信息对应的权重;

26、其中,所述第一数值是根据所述第三信息的总个数确定的;

27、所述目标信息对应的第二数值是根据与所述目标信息之间的相似度超过预设值的第三信息的个数和所述第三信息的总个数之间的比值确定的。

28、上述方法,能够通过目标信息和多个第二数值中相似度比较高的个数,以及第三信息的总个数确定权重,这样体现目标信息哪个与待分类结构化数据关联度比较高,使得分类的准确率更加高。

29、在一种可能实施的方式中,所述方法还包括:

30、若没有查找到与所述待分类结构化数据的标识信息相关联的信息,则从多个业务专业语言组成的信息构建的知识图谱中,查找与所述待分类结构化数据中每条数据存在关联关系的第三信息;

31、将多个所述第三信息的词向量进行向量融合,得到融合全文语义信息的向量表示,并将融合全文语义信息的向量表示作为所述关联信息。

32、上述方法,能够在没有找到第一信息时,通过待分类结构化数据本身辅助进行选择信息,再将选择的信息进行融合,得到融合全部选择的信息的向量表示,利用这样向量表示作为选择的信息,提高了选择的准确率。

33、在一种可能实施的方式中,对所述关联信息进行数据分类处理,得到所述待分类结构化数据的业务类别,包括:

34、将所述关联信息与业务分类标准进行对比,将所述业务分类标准中与所述关联信息相似度最高的类别作为所述待分类结构化数据的业务类别。

35、上述方法,能够通过关联信息与业务分类标准进行对比,由于关联信息也是业务专业语言组成的信息,这样对比提高了准确率。

36、第二方面,本专利技术实施例提供一种结构化数据分类装置,包括:

37、提取模块,用于从待分类结构化数据中提取所述待分类结构化数据的标识信息;

38、选择模块,用于根据多个业务专业语言组成的信息,确定与所述待分类结构化数据的标识信息相关联的关联信息;<本文档来自技高网...

【技术保护点】

1.一种结构化数据分类方法,其特征在于,包括:

2.根据权利要求1所述的结构化数据分类方法,其特征在于,根据多个业务专业语言组成的信息,确定与所述待分类结构化数据的标识信息相关联的关联信息,包括:

3.根据权利要求2所述的结构化数据分类方法,其特征在于,从多个业务专业语言组成的信息构建的知识图谱中,查找与所述待分类结构化数据的标识信息相关联的信息,包括:

4.根据权利要求3所述的结构化数据分类方法,其特征在于,根据查找到的信息确定所述关联信息,包括:

5.根据权利要求4所述的结构化数据分类方法,其特征在于,从多个所述目标信息中,挑出一个目标信息作为所述关联信息,包括:

6.根据权利要求5所述的结构化数据分类方法,其特征在于,根据多个所述目标信息在多个所述第三信息中的数量,确定每个所述目标信息对应的权重,包括:

7.根据权利要求2所述的结构化数据分类方法,其特征在于,所述方法还包括:

8.根据权利要求1~7任一项所述的结构化数据分类方法,其特征在于,对所述关联信息进行数据分类处理,得到所述待分类结构化数据的业务类别,包括:

9.一种结构化数据分类装置,其特征在于,包括:

10.一种服务器,其特征在于,包括:

...

【技术特征摘要】

1.一种结构化数据分类方法,其特征在于,包括:

2.根据权利要求1所述的结构化数据分类方法,其特征在于,根据多个业务专业语言组成的信息,确定与所述待分类结构化数据的标识信息相关联的关联信息,包括:

3.根据权利要求2所述的结构化数据分类方法,其特征在于,从多个业务专业语言组成的信息构建的知识图谱中,查找与所述待分类结构化数据的标识信息相关联的信息,包括:

4.根据权利要求3所述的结构化数据分类方法,其特征在于,根据查找到的信息确定所述关联信息,包括:

5.根据权利要求4所述的结构化数据分类方法,其特征在于,从多...

【专利技术属性】
技术研发人员:周涛马尚荣刘紫千常力元马睿宁
申请(专利权)人:天翼安全科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1