基于人工智能的OFD版式文件自动签章管理方法技术

技术编号:39163151 阅读:12 留言:0更新日期:2023-10-23 15:03
本申请涉及数据处理技术领域,特别是涉及一种基于人工智能的OFD版式文件自动签章管理方法,包括:获取多个OFD版式文件的撰写过程时间和文字内容并进行预处理得到撰写过程序列和主题词,基于主题词的数量和出现频率计算得到特异性指数,基于撰写过程序列计算得到版式文件生成效率指数,基于特异性指数和版式文件生成效率指数计算得到文件签章优先指数,基于创建者姓名和人员信息列表确定部门编码并结合特异性指数、文件签章优先指数构建特征信息向量,基于特征信息向量进行聚类处理得到多个聚类簇;基于各个聚类簇的聚类中心将版式文件分配给对应的签章处理责任人。本申请的方法能够实现版式文件自动签章管理,提高签章效率。提高签章效率。提高签章效率。

【技术实现步骤摘要】
基于人工智能的OFD版式文件自动签章管理方法


[0001]本专利技术涉及数据处理
,特别是涉及一种基于人工智能的OFD版式文件自动签章管理方法。

技术介绍

[0002]OFD(Open Fixed

layout Documents)版式文件的含义为开放版式文档,是我国自主研发、自主制定的国家文件格式标准。在不同软件、电脑等终端上打开,排版、内容都是高度一致的,因此OFD版式文件适合应用在一些严肃正式的场合,如各种正式的电子公文、电子合同、电子发票、电子证照等均为OFD版式文件。
[0003]OFD版式文件签章的目的是通过相关加密算法保证数据的完整性、真实性。OFD版式文件的签章功能较多,包括单页签章、多页签章、主题词签章、时间签章等,对OFD版式文件进行签章时需要耗费较多的人力物力,而且不同的OFD版式文件可能需要不同的部门、不同的负责人完成签章,因此需要对OFD版式文件进行聚类处理,使特征相似的OFD版式文件聚为一类,提高签章效率,并确保文件的安全性。传统的基于人工智能的聚类算法如K

means聚类算法,简单易于实现,适用于大规模数据,但需要预先指定聚类簇的数量;基于密度的DBSCAN聚类算法则无需指定聚类簇的数量,根据邻域密度进行聚类,但在OFD版式文件这类的高维空间中计算量较大,聚类效率低。

技术实现思路

[0004]鉴于上述问题,本申请提供了一种基于人工智能的OFD版式文件自动签章管理方法,能够实现OFD版式文件自动签章管理,提高签章效率。
[0005]本申请实施例提供了一种基于人工智能的OFD版式文件自动签章管理方法,包括:获取多个OFD版式文件的第一信息数据,所述第一信息数据包括撰写过程时间和文字内容;对每个所述OFD版式文件的所述第一信息数据进行预处理得到第二信息数据,所述第二信息数据包括撰写过程序列和主题词;对每个所述OFD版式文件,基于所述主题词的数量和出现频率进行特异性计算得到特异性指数,基于所述撰写过程序列进行生成效率计算得到版式文件生成效率指数,基于所述特异性指数和所述版式文件生成效率指数计算得到文件签章优先指数;对每个所述OFD版式文件,基于创建者姓名和人员信息列表确定部门编码,基于所述特异性指数、所述文件签章优先指数和所述部门编码构建特征信息向量;基于多个所述OFD版式文件的特征信息向量进行聚类处理,得到多个聚类簇;对每个聚类簇,基于所述聚类簇的聚类中心将所述聚类簇的OFD版式文件分配给对应的签章处理责任人。
[0006]在一种可能的实现方式中,所述对每个所述OFD版式文件的所述第一信息数据进行预处理得到第二信息数据,所述第二信息数据包括撰写过程序列和主题词,包括:
对每个所述OFD版式文件,基于所述OFD版式文件的撰写过程时间构建撰写过程序列。
[0007]在一种可能的实现方式中,所述对每个所述OFD版式文件的所述第一信息数据进行预处理得到第二信息数据,所述第二信息数据包括撰写过程序列和主题词,还包括:对每个所述OFD版式文件,基于所述OFD版式文件的文字内容进行分词处理,得到多个分词和所述分词的出现频率,按照第一选取条件选取多个分词中的部分分词作为主题词。
[0008]在一种可能的实现方式中,所述基于所述主题词的数量和出现频率进行特异性计算得到特异性指数,包括:对每个所述OFD版式文件,基于所述主题词的数量和出现频率进行特异性计算得到特异性指数,所述特异性指数的计算公式为:其中,表示第个OFD版式文件的特异性指数,表示第个OFD版式文件的主题词的数量,表示在第个OFD版式文件中第个主题词出现的频率,表示OFD版式文件的数量,表示在第个OFD版式文件中主题词出现最高的频率,表示第个OFD版式文件中第个主题词在第个OFD版式文件中出现的频率。
[0009]在一种可能的实现方式中,所述基于所述撰写过程序列进行生成效率计算得到版式文件生成效率指数,包括:对每个所述OFD版式文件,基于所述撰写过程序列进行生成效率计算得到版式文件生成效率指数,所述版式文件生成效率指数的计算公式为:其中,表示第个OFD版式文件的版式文件生成效率指数,表示所述撰写过程序列的长度,表示所述撰写过程序列中第个元素的值。
[0010]在一种可能的实现方式中,所述基于所述特异性指数和所述版式文件生成效率指数计算得到文件签章优先指数,包括:对每个所述OFD版式文件,基于所述特异性指数和所述版式文件生成效率指数计算得到文件签章优先指数,所述文件签章优先指数的计算公式为:其中,表示第个OFD版式文件的文件签章优先指数,表示第个OFD版式文件的特异性指数,为自然常数,表示第一时间差值与第二时间差值之间的比值,所述第一时间差值为第个OFD版式文件的截止时间与当前时间之差,所述第二时间差值为第个
OFD版式文件的截止时间与创建时间之差,表示第个OFD版式文件的版式文件生成效率指数。
[0011]在一种可能的实现方式中,所述基于创建者姓名和人员信息列表确定部门编码,包括:获取所述OFD版式文件的创建者姓名;基于创建者姓名和人员信息列表对创建者姓名和所在部门进行匹配,根据所述所在部门确定部门编码。
[0012]在一种可能的实现方式中,所述基于所述特异性指数、所述文件签章优先指数和所述部门编码构建特征信息向量,还包括:基于所述特异性指数、所述文件签章优先指数和所述部门编码构建特征信息向量,所述特征信息向量的构建方式为:其中,表示第个OFD版式文件的特征信息向量,表示第个OFD版式文件的特异性指数,表示第个OFD版式文件的文件签章优先指数,表示第个OFD版式文件的创建者所在部门的部门编码。
[0013]在一种可能的实现方式中,所述基于多个所述OFD版式文件的特征信息向量进行聚类处理,得到多个聚类簇,包括:对每个所述OFD版式文件,对所述特征信息向量进行归一化处理得到特征信息归一化向量,所述归一化处理的方法为Z

score方法;对每个所述OFD版式文件,计算所述OFD版式文件的特征信息归一化向量与其余OFD版式文件的特征信息归一化向量之间的欧式距离,得到第一距离;基于所述第一距离对多个所述OFD版式文件进行聚类处理得到多个聚类簇,所述聚类处理的算法为DBSCAN聚类算法。
[0014]在一种可能的实现方式中,所述对每个聚类簇,基于所述聚类簇的聚类中心将所述聚类簇的OFD版式文件分配给对应的签章处理责任人,包括:对每个聚类簇,计算所述聚类簇的聚类中心与坐标原点之间的欧式距离得到第二距离;对每个聚类簇,基于所述第二距离确定所述聚类簇的签章负责人等级;对每个聚类簇,基于所述签章负责人等级将所述聚类簇的OFD版式文件分配给对应的签章处理责任人。
[0015]本申请的有益效果在于:通过分析每个OFD版式文件与其余OFD版式文件主题词之间出现的频率,构建OFD版式文件的特异性指数,反映OFD版式文件文字内容的差异性,通过分析OFD版式文件历史撰写时间,构建版式文件生成效率指数,结合特异性指数和版式文件生本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的OFD版式文件自动签章管理方法,其特征在于,包括:获取多个OFD版式文件的第一信息数据,所述第一信息数据包括撰写过程时间和文字内容;对每个所述OFD版式文件的所述第一信息数据进行预处理得到第二信息数据,所述第二信息数据包括撰写过程序列和主题词;对每个所述OFD版式文件,基于所述主题词的数量和出现频率进行特异性计算得到特异性指数,基于所述撰写过程序列进行生成效率计算得到版式文件生成效率指数,基于所述特异性指数和所述版式文件生成效率指数计算得到文件签章优先指数;对每个所述OFD版式文件,基于创建者姓名和人员信息列表确定部门编码,基于所述特异性指数、所述文件签章优先指数和所述部门编码构建特征信息向量;基于多个所述OFD版式文件的特征信息向量进行聚类处理,得到多个聚类簇;对每个聚类簇,基于所述聚类簇的聚类中心将所述聚类簇的OFD版式文件分配给对应的签章处理责任人。2.根据权利要求1所述的基于人工智能的OFD版式文件自动签章管理方法,其特征在于,所述对每个所述OFD版式文件的所述第一信息数据进行预处理得到第二信息数据,所述第二信息数据包括撰写过程序列和主题词,包括:对每个所述OFD版式文件,基于所述OFD版式文件的撰写过程时间构建撰写过程序列。3.根据权利要求1或2所述的基于人工智能的OFD版式文件自动签章管理方法,其特征在于,所述对每个所述OFD版式文件的所述第一信息数据进行预处理得到第二信息数据,所述第二信息数据包括撰写过程序列和主题词,还包括:对每个所述OFD版式文件,基于所述OFD版式文件的文字内容进行分词处理,得到多个分词和所述分词的出现频率,按照第一选取条件选取多个分词中的部分分词作为主题词。4.根据权利要求1所述的基于人工智能的OFD版式文件自动签章管理方法,其特征在于,所述基于所述主题词的数量和出现频率进行特异性计算得到特异性指数,包括:对每个所述OFD版式文件,基于所述主题词的数量和出现频率进行特异性计算得到特异性指数,所述特异性指数的计算公式为:其中,表示第个OFD版式文件的特异性指数,表示第个OFD版式文件的主题词的数量,表示在第个OFD版式文件中第个主题词出现的频率,表示OFD版式文件的数量,表示在第个OFD版式文件中主题词出现最高的频率,表示第个OFD版式文件中第个主题词在第个OFD版式文件中出现的频率。5.根据权利要求1所述的基于人工智能的OFD版式文件自动签章管理方法,其特征在于,所述基于所述撰写过程序列进行生成效率计算得到版式文件生成效率指数,包括:对每个所述OFD版式文件,基于所述撰写过程序列进行生成效率计算得到版式文件生成效率指数,所述版式文件生成效率指数的计算公式为:
其中,表示第个OFD版式文件的版式文件生成效率指数,表示所述撰写过程序列的长...

【专利技术属性】
技术研发人员:赵云陆猛李超庄玉龙谢文迅
申请(专利权)人:北京点聚信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1