一种基于文献的污染地块信息综合分析方法技术

技术编号:21224701 阅读:35 留言:0更新日期:2019-05-29 05:27
本发明专利技术提供了一种基于文献的污染地块信息综合分析方法,所述分析方法包括如下步骤:通过特征关键词从开放平台检索获取相应文献;读取检索获取的文献中的数字化文献内容,并将对应的文献内容划分为多个内容片段;对划分后的各内容片段中的原始内容,使用所述分析系统对各内容片段进行结构化数据的提取;通过数据库描述语言查询已提取的污染地块结构化信息。本发明专利技术所述的分析方法,能够针对土壤环境监管领域中的海量文献,通过计算机辅助的形式,有效地提取出污染地块污染情况的结构化信息并使用专业数据库进行存储,具有高效、准确的特点。

A Document-based Comprehensive Analysis Method for Polluted Land Block Information

The present invention provides a document-based comprehensive analysis method for contaminated land information, which includes the following steps: retrieving corresponding documents from an open platform through feature keywords; reading the digitized document content in the retrieved documents, and dividing the corresponding document content into multiple content segments; and dividing the original content of each content segment into several content segments, so as to make the original content of each content segment divided into several content segments. The analysis system is used to extract structured data from each content fragment, and the extracted structured information of contaminated land blocks is queried by database description language. The analytical method of the invention can effectively extract the structured information of the pollution situation of the polluted land by means of computer-aided form and store it in a professional database, aiming at a large number of documents in the field of soil environmental supervision, and has the characteristics of high efficiency and accuracy.

【技术实现步骤摘要】
一种基于文献的污染地块信息综合分析方法
本专利技术属于土壤污染监管领域,特别涉及一种基于文献的污染地块信息综合分析方法。
技术介绍
在土壤环境监管领域,研究者和技术人员常常需要能够从海量的文字资料中快速而准确的获取对应地块土壤污染情况等内容,以便于对其进行深入的分析或者进一步的知识发现。所以,从数量庞大、内容复杂的文献中获取结构化的描述内容是摆在科研人员面前的一个重要的问题。现有的工作方式中,从土壤研究文献中提取对应研究内容主要依赖人工对文献内容进行通读,然后再对他们进行标注提取。该种工作方式需要很多具有丰富经验和专门知识的分类人员做大量的工作,不仅代价高昂,效率底下,且容易出错。
技术实现思路
针对上述存在的问题,本专利技术的目的是提供一种基于文献的污染地块信息综合分析方法。通过计算机辅助的形式,规范文献识别范围以及识别内容,并辅以二次校验的方式,可以很好的解决上述问题。本专利技术的目的是通过以下技术方案实现的:一种基于文献的污染地块信息综合分析系统,包括文献基本信息模块、地块基本信息模块、研究对象信息模块和污染物监测与评价数据信息模块;所述文献基本信息模块,用于获取包括文献名称、来源本文档来自技高网...

【技术保护点】
1.一种基于文献的污染地块信息综合分析方法,其特征在于,所述方法包括以下步骤:S1:通过特征关键词从开放平台检索获取相应文献,使用文献管理软件对检索得到的文献基本信息进行管理分类,并筛选出调查类文献,建立研究文献数据库;根据研究方向从多个宏观和/或微观层面选取特征关键词,所述特征关键词是包括场地、污染介质、行业类型、有机污染物种类、污染物在内的相关中英文关键词;S2:读取检索获取的所述调查类文献中的数字化文献内容,对文献内容中的所有自然段落进行预处理,将所述自然段落根据结构相特征词,判定其描述内容,并划分为包括地块基本信息、研究对象基本信息、污染物监测与评价信息在内的多个内容片段,所述特征词是...

【技术特征摘要】
1.一种基于文献的污染地块信息综合分析方法,其特征在于,所述方法包括以下步骤:S1:通过特征关键词从开放平台检索获取相应文献,使用文献管理软件对检索得到的文献基本信息进行管理分类,并筛选出调查类文献,建立研究文献数据库;根据研究方向从多个宏观和/或微观层面选取特征关键词,所述特征关键词是包括场地、污染介质、行业类型、有机污染物种类、污染物在内的相关中英文关键词;S2:读取检索获取的所述调查类文献中的数字化文献内容,对文献内容中的所有自然段落进行预处理,将所述自然段落根据结构相特征词,判定其描述内容,并划分为包括地块基本信息、研究对象基本信息、污染物监测与评价信息在内的多个内容片段,所述特征词是文献中用于描述对应章节内容的词组;S3:对划分后的各内容片段中的原始内容,进行结构化数据的提取;S4:通过数据库描述语言查询已提取的污染地块结构化信息。2.根据权利要求1所述的基于文献的污染地块信息综合分析方法,其特征在于,...

【专利技术属性】
技术研发人员:马妍阮子渊运晓彤谢云峰杜晓明史怡谷庆宝王佳琪张梦頔张美娟周生坤
申请(专利权)人:中国矿业大学北京
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1