非结构化公文的管理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：21224868 阅读：28 留言：0更新日期：2019-05-29 05:36

本申请提出一种非结构化公文的管理方法、装置、计算机设备及存储介质，其中，方法包括：通过获取待识别非结构化公文；根据预设的识别模型对待识别非结构化公文进行识别，获取待识别非结构化公文中的属性信息；根据属性信息对待识别非结构化公文进行存储。由此，提高了非结构化公文的管理的有效性和准确性。

Management Method, Device, Computer Equipment and Storage Medium of Unstructured Documents

This application proposes a management method, device, computer equipment and storage medium for unstructured documents, which includes: obtaining unstructured documents to be identified; identifying unstructured documents to be identified according to the preset recognition model, obtaining attribute information of unstructured documents to be identified; and storing unstructured documents to be identified according to attribute information. Chu. As a result, the effectiveness and accuracy of unstructured document management are improved.

全部详细技术资料下载

【技术实现步骤摘要】
非结构化公文的管理方法、装置、计算机设备及存储介质
本申请涉及电子政务
，尤其涉及一种非结构化公文的管理方法、装置、计算机设备及存储介质。
技术介绍
目前，在政务公文处理上通常有管理手段和技术方案两种方式，其中，管理手段是在所有公文发出部门将所有要发公文实现对象化，主要是将公文摘要、接收部门、公文涉及人员、联系方式等人为的进行管理系统录入，但是管理手段效率低下，并且没有专职人员进行录入，历史公文无人过问，使得整个政务系统中平行和交叉部门的公文众多无法进行有效的录入；技术方案主要是将公文全部录入，进行部分公文或内容的简单匹配查询，在管理过程中没有有效的识别和有组织的管理，以及对交叉部门和平行部门的公文关系、公文关联等无法实现管理。因此，上述两种方案都无法对公文进行有效管理。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本申请提出一种非结构化公文的管理方法、装置及存储介质，用于解决现有技术中对于非结构化公文无法进行有效管理的技术问题。为达上述目的，本申请第一方面实施例提出了一种非结构化公文的管理方法，包括：获取待识别非结构化公文；根据预设的识别模型对所述待识别非结构化公文进行识别，获取所述待识别非结构化公文中的属性信息；根据所述属性信息对所述待识别非结构化公文进行存储。本申请实施例的非结构化公文的管理方法，通过获取待识别非结构化公文；根据预设的识别模型对待识别非结构化公文进行识别，获取待识别非结构化公文中的属性信息；根据属性信息对待识别非结构化公文进行存储。由此，提高了非结构化公文的管理的有效性和准确性。为达上述目的，本申请第...

【技术保护点】
1.一种非结构化公文的管理方法，其特征在于，包括以下步骤：获取待识别非结构化公文；根据预设的识别模型对所述待识别非结构化公文进行识别，获取所述待识别非结构化公文中的属性信息；根据所述属性信息对所述待识别非结构化公文进行存储。

【技术特征摘要】
1.一种非结构化公文的管理方法，其特征在于，包括以下步骤：获取待识别非结构化公文；根据预设的识别模型对所述待识别非结构化公文进行识别，获取所述待识别非结构化公文中的属性信息；根据所述属性信息对所述待识别非结构化公文进行存储。2.如权利要求1所述的方法，其特征在于，在所述根据预设的识别模型对所述多个分词进行识别，获取所述待识别非结构化公文中的属性信息之前，还包括：确定标注语料库；对多个训练非结构化公文进行分词处理，获取每一个训练非结构化公文中的多个训练分词；根据预设算法对所述标注语料库和所述多个训练分词进行处理，生成所述预设的识别模型。3.如权利要求2所述的方法，其特征在于，在生成所述预设的识别模型后，还包括：获取待测试非结构化公文；对所述待测试非结构化公文进行分词处理，获取所述待测试非结构化公文中的多个测试分词；根据所述预设的识别模型对所述多个测试分词进行识别，获取测试值；根据所述测试值和预设阈值判断所述预设的识别模型的有效性。4.如权利要求3所述的方法，其特征在于，所述测试值包括：准确率和召回率；所述根据所述测试值和预设阈值判断所述预设的识别模型的有效性，包括：获取所述准确率和所述召回率的比值；若所述比值大于等于预设阈值，则确定所述预设的识别模型有效。5.如权利要求1所述的方法，其特征在于，在根据所述目标分词对应的属性信息对所述待识别非结构化公文进行存储之后，还包括：获取抽取关键词；根据所述抽取关键词抽取目标非结构...

【专利技术属性】
技术研发人员：吴雄辉，王丽娟，秦锋剑，
申请(专利权)人：杭州绿湾网络科技有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人