The present invention provides a document-based comprehensive analysis method for contaminated land information, which includes the following steps: retrieving corresponding documents from an open platform through feature keywords; reading the digitized document content in the retrieved documents, and dividing the corresponding document content into multiple content segments; and dividing the original content of each content segment into several content segments, so as to make the original content of each content segment divided into several content segments. The analysis system is used to extract structured data from each content fragment, and the extracted structured information of contaminated land blocks is queried by database description language. The analytical method of the invention can effectively extract the structured information of the pollution situation of the polluted land by means of computer-aided form and store it in a professional database, aiming at a large number of documents in the field of soil environmental supervision, and has the characteristics of high efficiency and accuracy.
【技术实现步骤摘要】
一种基于文献的污染地块信息综合分析方法
本专利技术属于土壤污染监管领域,特别涉及一种基于文献的污染地块信息综合分析方法。
技术介绍
在土壤环境监管领域,研究者和技术人员常常需要能够从海量的文字资料中快速而准确的获取对应地块土壤污染情况等内容,以便于对其进行深入的分析或者进一步的知识发现。所以,从数量庞大、内容复杂的文献中获取结构化的描述内容是摆在科研人员面前的一个重要的问题。现有的工作方式中,从土壤研究文献中提取对应研究内容主要依赖人工对文献内容进行通读,然后再对他们进行标注提取。该种工作方式需要很多具有丰富经验和专门知识的分类人员做大量的工作,不仅代价高昂,效率底下,且容易出错。
技术实现思路
针对上述存在的问题,本专利技术的目的是提供一种基于文献的污染地块信息综合分析方法。通过计算机辅助的形式,规范文献识别范围以及识别内容,并辅以二次校验的方式,可以很好的解决上述问题。本专利技术的目的是通过以下技术方案实现的:一种基于文献的污染地块信息综合分析系统,包括文献基本信息模块、地块基本信息模块、研究对象信息模块和污染物监测与评价数据信息模块;所述文献基本信息模块,用于获 ...
【技术保护点】
1.一种基于文献的污染地块信息综合分析方法,其特征在于,所述方法包括以下步骤:S1:通过特征关键词从开放平台检索获取相应文献,使用文献管理软件对检索得到的文献基本信息进行管理分类,并筛选出调查类文献,建立研究文献数据库;根据研究方向从多个宏观和/或微观层面选取特征关键词,所述特征关键词是包括场地、污染介质、行业类型、有机污染物种类、污染物在内的相关中英文关键词;S2:读取检索获取的所述调查类文献中的数字化文献内容,对文献内容中的所有自然段落进行预处理,将所述自然段落根据结构相特征词,判定其描述内容,并划分为包括地块基本信息、研究对象基本信息、污染物监测与评价信息在内的多个内 ...
【技术特征摘要】
1.一种基于文献的污染地块信息综合分析方法,其特征在于,所述方法包括以下步骤:S1:通过特征关键词从开放平台检索获取相应文献,使用文献管理软件对检索得到的文献基本信息进行管理分类,并筛选出调查类文献,建立研究文献数据库;根据研究方向从多个宏观和/或微观层面选取特征关键词,所述特征关键词是包括场地、污染介质、行业类型、有机污染物种类、污染物在内的相关中英文关键词;S2:读取检索获取的所述调查类文献中的数字化文献内容,对文献内容中的所有自然段落进行预处理,将所述自然段落根据结构相特征词,判定其描述内容,并划分为包括地块基本信息、研究对象基本信息、污染物监测与评价信息在内的多个内容片段,所述特征词是文献中用于描述对应章节内容的词组;S3:对划分后的各内容片段中的原始内容,进行结构化数据的提取;S4:通过数据库描述语言查询已提取的污染地块结构化信息。2.根据权利要求1所述的基于文献的污染地块信息综合分析方法,其特征在于,...
【专利技术属性】
技术研发人员:马妍,阮子渊,运晓彤,谢云峰,杜晓明,史怡,谷庆宝,王佳琪,张梦頔,张美娟,周生坤,
申请(专利权)人:中国矿业大学北京,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。