System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 档案分类方法及平台技术_技高网

档案分类方法及平台技术

技术编号:40582690 阅读:4 留言:0更新日期:2024-03-06 17:26
本公开提供了一种档案分类方法及平台,属于数据分类技术领域,该方法包括:获取用户预先设定的多级分类类别,基于预设的映射关系确定多级分类类别对应的词组权重。词组权重为每个标准词组对应的权重。获取待分类的第一档案,提取第一档案中的词组,得到多个第一词组。将多个第一词组转换为多个对应的标准词组,得到多个目标标准词组。基于目标标准词组以及词组权重生成第一档案的特征向量。将第一档案的特征向量输入至预先训练的分类器中,得到第一档案对应的分类类别。本公开提供的档案分类方法能够自动对不同内容的档案进行分类,针对不同的级别顺序实现不同的分类结果,以达到更加全面智能的档案分类效果。

【技术实现步骤摘要】

本公开属于数据分类,更具体地说,是涉及一种档案分类方法及平台


技术介绍

1、随着计算机技术的发展,其在档案智能分类管理方面的应用也逐渐加强,档案的管理方式也在不断演化,目前的档案管理方式,已经越来越具科学性和技术性,但是仍然存在较多问题。由于数据的爆炸式增长和频繁变动,导致人工进行档案分类的工作量巨大,分类效率极低,并且由于人工分类过程中具有较强的主观因素,导致分类结果的准确性也较差,因此,亟需一种高效且准确的档案分类方法。


技术实现思路

1、本公开的目的在于提供一种档案分类方法及平台,以提高档案分类管理的智能化水平。

2、本公开实施例的第一方面,提供了一种档案分类方法,包括:

3、获取用户预先设定的多级分类类别,基于多级分类类别的级别顺序确定词组权重。词组权重为每个标准词组对应的权重。

4、获取待分类的第一档案,提取第一档案中的词组,得到多个第一词组。

5、将多个第一词组转换为多个对应的标准词组,得到多个目标标准词组。

6、基于目标标准词组以及词组权重生成第一档案的特征向量。

7、将第一档案的特征向量输入至预先训练的分类器中,得到第一档案对应的分类类别。

8、本公开实施例的第二方面,提供了一种档案分类平台,包括:

9、词组权重确定模块,用于获取用户预先设定的多级分类类别,基于多级分类类别的级别顺序确定词组权重。词组权重为每个标准词组对应的权重。

10、词组确定模块,用于获取待分类的第一档案,提取第一档案中的词组,得到多个第一词组。

11、标准词组确定模块,用于将多个第一词组转换为多个对应的标准词组,得到多个目标标准词组。

12、特征向量生成模块,用于基于目标标准词组以及词组权重生成第一档案的特征向量。

13、档案分类模块,用于将第一档案的特征向量输入至预先训练的分类器中,得到第一档案对应的分类类别。

14、本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的档案分类方法的步骤。

15、本公开实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的档案分类方法的步骤。

16、本公开实施例提供的档案分类方法及平台的有益效果在于:

17、本公开提供的档案分类方法及平台能够利用目标标准词组和词组权重生成第一档案的特征向量,将其输入预先训练的分类器中,从而得到第一档案对应的分分类别。目标标准词组可以通过对第一档案提取多个第一词组,将第一词组转换为标准词组,从而得到对应的多个目标标准词组;词组权重可以根据多级分类类别的级别顺序来确定。该方法可以自动对不同内容的档案进行分类,节省人工成本,提高档案分类的效率。除此之外,该方法还能够按照用户预先设定的多级分类类别,针对不同的级别顺序实现不同的分类结果,以达到更加全面智能的档案分类效果。

本文档来自技高网...

【技术保护点】

1.一种档案分类方法,其特征在于,包括:

2.如权利要求1所述的档案分类方法,其特征在于,所述提取所述第一档案中的词组,得到多个第一词组,包括:

3.如权利要求1所述的档案分类方法,其特征在于,所述将所述多个第一词组转换为多个对应的标准词组,得到多个目标标准词组,包括:

4.如权利要求1所述的档案分类方法,其特征在于,所述基于所述目标标准词组以及所述词组权重生成所述第一档案的特征向量,包括:

5.如权利要求4所述的档案分类方法,其特征在于,所述特征向量模板包含多个填充位置,每个填充位置对应一种词组属性;所述基于每个目标标准词组的特征向量对预设的特征向量模板进行填充,得到所述第一档案的特征向量,包括:

6.如权利要求1所述的档案分类方法,其特征在于,所述基于所述多级分类类别的级别顺序确定词组权重,包括:

7.如权利要求2所述的档案分类方法,其特征在于,所述提取所述第一档案中的文字信息,得到多个第一词组,包括:

8.一种档案分类平台,其特征在于,包括:

9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。

...

【技术特征摘要】

1.一种档案分类方法,其特征在于,包括:

2.如权利要求1所述的档案分类方法,其特征在于,所述提取所述第一档案中的词组,得到多个第一词组,包括:

3.如权利要求1所述的档案分类方法,其特征在于,所述将所述多个第一词组转换为多个对应的标准词组,得到多个目标标准词组,包括:

4.如权利要求1所述的档案分类方法,其特征在于,所述基于所述目标标准词组以及所述词组权重生成所述第一档案的特征向量,包括:

5.如权利要求4所述的档案分类方法,其特征在于,所述特征向量模板包含多个填充位置,每个填充位置对应一种词组属性;所述基于每个目标标准词组的特征向量对预设的特征向量模板进行填充,得到所述第一档案的特征向量,包括...

【专利技术属性】
技术研发人员:吉晓雯
申请(专利权)人:河北省中医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1