一种基于卷积神经网络的政府组织公文信息追溯方法及装置制造方法及图纸

技术编号:21952422 阅读:29 留言:0更新日期:2019-08-24 17:42
本发明专利技术提供一种基于卷积神经网络的政府组织公文信息追溯方法及装置。方法包括步骤:建立各级政府组织公文的自上而下的若干层目录;获取待追溯文本,将待追溯文本的所有字符作为目标字符;采用设定的神经网络模型将待追溯文本自下而上匹配各级政府组织公文的标题和正文;形成包括目标政府组织公文的标题和匹配段落的追溯子集;将上述追溯子集在电子设备上予以关系图显示。针对性解决政府组织公文的文档特点,提高了追溯政府组织公文信息的效率;采用了神经网络技术尤其是前馈卷积神经网络技术,对目标文本和公文信息的匹配准确性较高;以关系图及节点链接予以显示,利于人们的浏览的文件的调阅;对模型算法予以了优化,提高了匹配的准确性。

An Information Retrieval Method and Device for Government Documents Based on Convolutional Neural Network

【技术实现步骤摘要】
一种基于卷积神经网络的政府组织公文信息追溯方法及装置
本专利技术涉及电子文本处理领域,尤其涉及政府组织公文信息的归档追溯处理方法及装置。
技术介绍
目前包括政府公文在内的文档处理、收集和归档工作,在“两化融合”的背景下,越来越走向在线自动化处理,为企事业政府机关等单位办公带来很大便利性。政府组织的公文有其特殊性。第一是各级的由上至下的逐级传达,第二是兄弟单位的协助制定相关配套的公文函件,第三是主题的相关性较高。在大量的政府组织公文的日积月累下,政府组织自身有文档的存档,但后续制定出新的文档,存在追溯和归档困难,如果随意的追溯归档给日后的使用调阅带来很大的不便。对于关注政府组织公文的企业收集了大量与企业业务发展相关的大量政府组织公文,如果无序的归档和缺少合适的公文信息追溯方法或者电子设备,当需要调阅相关主题的历史文档时,显得捉襟见肘无法应对。另外在现有技术中存在对政府公文的相关处理方法,比如公开号为CN108829651A的专利文件,由平安科技(深圳)有限公司申请,解决的公文自动匹配的智能化问题,但仍不足以在出现相关待追溯信息或者主题时,便于人们快速地获取相关的历史政府组织的公文,这也是现有技术的不足之处。
技术实现思路
本专利技术要解决的技术问题是,针对现有技术中存在的上述不足,提供一种基于卷积神经网络的政府组织公文信息追溯方法及装置,实现对政府组织公文信息的追溯自动化,便于人们的信息获取,提高作业效率和降低成本。本专利技术为解决上述技术问题所采用的技术方案是:本专利技术的政府组织公文信息追溯方法,包括以下步骤:建立各级政府组织公文的自上而下的若干层目录;获取待追溯文本,将待追溯文本的所有字符作为目标字符;采用设定的神经网络模型将待追溯文本自下而上匹配各级政府组织公文的标题和正文;形成包括目标政府组织公文的标题和匹配段落的追溯子集;将上述追溯子集在电子设备上予以关系图显示。优选的是,若干层目录包括兄弟级目录、父子级目录和子孙级目录。优选的是,设定的神经网络模型为前馈卷积神经网络。优选的是,关系图为网络图谱关系图或时间序列关系图。优选的是,采用设定的神经网络模型将待追溯文本自下而上匹配政府组织公文的标题和正文,包括将待追溯文本分词后与公文分词后的标题和正文进行模型运算,其中标题所占权重系数不小于正文所占权重系数,得到待追溯文本与政府组织公文的关联度,当关联度大于预设阈值时将该政府组织公文纳入追溯子集。优选的是,关系图的节点链接到对应的公文正文。优选的是,追溯子集的关系图重新以兄弟级目录、父子级目录和子孙级目录的形式展现。优选的是,将该方法用于政府组织公文的分类归档。在本专利技术中还相应提供一种计算机可读存储介质。其中,该计算机可读存储介质,存储有政府组织公文且具有信息追溯的装置,该装置的执行器执行如前述的政府组织公文信息追溯方法。进一步地,在本专利技术中还相应提供一种用于政府组织公文信息追溯的装置。其中,该用于政府组织公文信息追溯的装置,包括:目录建立单元,用于在电子设备上建立各级政府组织公文的自上而下的若干层目录,若干层目录包括兄弟级目录、父子级目录和子孙级目录;追溯文本获取单元,用于获取待追溯文本,并将待追溯文本的所有字符作为目标字符;公文匹配单元,用于采用前馈卷积神经网络在建立的目录和公文中,将待追溯文本自下而上匹配各级政府组织公文的标题和正文;追溯子集形成单元,用于将上述公文匹配单元匹配之后,形成包括目标政府组织公文的标题和匹配段落的追溯子集;以及显示单元,用于将上述追溯子集在电子设备上予以关系图显示,关系图为网络图谱关系图或时间序列关系图。与现有技术相比,本专利技术的有益效果包括:(1)采用层级目录提高了信息追溯的效率和准确性,针对性解决政府组织公文的文档特点,提高了追溯政府组织公文信息的效率。(2)采用了神经网络技术尤其是前馈卷积神经网络技术,对目标文本和公文信息的匹配准确性较高。(3)重新对追溯子集予以汇总,以关系图及节点链接予以显示,利于人们的浏览的文件的调阅。(4)对模型算法予以了优化,提高了匹配的准确性;对现有技术提供了一种新的政府组织公文信息的归档追溯处理方法及装置。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术政府组织公文信息追溯方法的步骤示意图;图2为用于政府组织公文信息追溯的装置的结构示意图;图3为政府组织公文的若干层的层级示意图;图4为政府组织公文的时间序列关系图;其中,0-电子设备,1-目录建立单元,2-追溯文本获取单元,3-公文匹配单元,4-追溯子集形成单元,5-显示单元。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参照图1,政府组织公文信息追溯方法,包括以下步骤:01建立各级政府组织公文的自上而下的若干层目录;02获取待追溯文本,将待追溯文本的所有字符作为目标字符;03采用设定的神经网络模型将待追溯文本自下而上匹配各级政府组织公文的标题和正文;04形成包括目标政府组织公文的标题和匹配段落的追溯子集;05将上述追溯子集在电子设备上予以关系图显示。这里,若干层目录包括兄弟级目录、父子级目录和子孙级目录,可以像图3一样,实际的公文数量和层级比这里多很多。在科技部下发的公文中,通常需要财政部、海关总署或者教育部下发配套的相关公文,以推动政策的具体落地施行;到了地方政府,他们会根据上级的政策文件制定进一步的细化公文政策,予以具体布置;再进一步地公文到达县市级,会有更细化的公文政策,用于指导企业或者个人如何去操作。这里,设定的神经网络模型为前馈卷积神经网络。前馈卷积神经网络能够对文本滤波和降维,提高模型的准确性和可靠性。这里,关系图为网络图谱关系图或时间序列关系图,时间序列图的图示可为图4。对于追溯到子集,提供了网络图谱关系图,有利于人们了解公文的归口单位和协助单位;时间序列图有利于人们了解公文的发生时间,整个来龙去脉有据可循。这里,采用设定的神经网络模型将待追溯文本自下而上匹配政府组织公文的标题和正文,包括将待追溯文本分词后与公文分词后的标题和正文进行模型运算,其中标题所占权重系数不小于正文所占权重系数,得到待追溯文本与政府组织公文的关联度,当关联度大于预设阈值时将该政府组织公文纳入追溯子集。这里,关系图的节点链接到对应的公文正文。这里,追溯子集的关系图重新以兄弟级目录、父子级目录和子孙级目录的形式展现,子集也可如图3一样。这里,将该方法用于政府组织公文的分类归档。相应提供一种计算机可读存储介质。其中,该计算机可读存储介质,存储有政府组织公文且具有信息追溯的装置,其特征在于装置的执行器执行如前述的政府组织公文信息追溯方法。还相应提供一种用于政府组织公文信息追溯的装置。其中,该用于政府组织公文信息追溯的装置,如图2所述,包括:目录建立单元1,用于在电子设备0上建本文档来自技高网...

【技术保护点】
1.一种政府组织公文信息追溯方法,其特征在于,包括以下步骤:建立各级政府组织公文的自上而下的若干层目录;获取待追溯文本,将所述待追溯文本的所有字符作为目标字符;采用设定的神经网络模型将待追溯文本自下而上匹配各级政府组织公文的标题和正文;形成包括目标政府组织公文的标题和匹配段落的追溯子集;将上述追溯子集在电子设备上予以关系图显示。

【技术特征摘要】
1.一种政府组织公文信息追溯方法,其特征在于,包括以下步骤:建立各级政府组织公文的自上而下的若干层目录;获取待追溯文本,将所述待追溯文本的所有字符作为目标字符;采用设定的神经网络模型将待追溯文本自下而上匹配各级政府组织公文的标题和正文;形成包括目标政府组织公文的标题和匹配段落的追溯子集;将上述追溯子集在电子设备上予以关系图显示。2.根据权利要求1所述的政府组织公文信息追溯方法,其特征在于,所述若干层目录包括兄弟级目录、父子级目录和子孙级目录。3.根据权利要求1所述的政府组织公文信息追溯方法,其特征在于,所述设定的神经网络模型为前馈卷积神经网络。4.根据权利要求1所述的政府组织公文信息追溯方法,其特征在于,所述关系图为网络图谱关系图或时间序列关系图。5.根据权利要求1所述的政府组织公文信息追溯方法,其特征在于,所述的采用设定的神经网络模型将待追溯文本自下而上匹配政府组织公文的标题和正文,包括将待追溯文本分词后与公文分词后的标题和正文进行模型运算,其中标题所占权重系数不小于正文所占权重系数,得到待追溯文本与政府组织公文的关联度,当关联度大于预设阈值时将该政府组织公文纳入追溯子集。6.根据权利要求4所述的政府组织公文信...

【专利技术属性】
技术研发人员:付永晗孔嘉明宫勐
申请(专利权)人:北京捷风数据技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1