一种从英文文献正文中提取地理位置的软件系统及方法技术方案

技术编号:32276916 阅读:15 留言:0更新日期:2022-02-12 19:43
本发明专利技术公开了一种从英文文献正文中提取地理位置的软件系统及方法,其中的软件系统包括:打开文件模块,用于打开英文文献文件;导入EXCEL信息模块,用于打开EXCEL表格,插入数据库信息;查询地理位置模块,用于增加地理位置信息、查询信息、修改信息;提取地理位置模块,用于提取地理位置信息;软件说明模块,用于说明软件的应用详情和软件的使用说明。本发明专利技术的软件系统预留了临时添加地理位置特征的功能,也可以在源代码的基础上二次开发,能够快速寻找出相对应的地理位置信息。同时可以自由选择是批量提取或者进行单次提取。是批量提取或者进行单次提取。是批量提取或者进行单次提取。

【技术实现步骤摘要】
一种从英文文献正文中提取地理位置的软件系统及方法


[0001]本专利技术涉及英文文献提取技术,具体涉及一种从英文文献正文中提取地理位置的软件系统及方法。

技术介绍

[0002]目前,随着地学文献的逐步增加,面对大量的文献研究人员不知道从何下手,我们对文章研究时常常需要文章的研究区域与地理信息,但是如果对每一篇文章单独去寻找,则会极大地消耗时间与精力。
[0003]面对成百上千篇含有不同格式地理位置信息的文献,如果要提取地理位置信息,每篇文章需要熟读,而大部分文章除了地理位置,并无阅读需求,需要耗费大量不有必要时间。
[0004]其次,需要对文献进行准确的分段,直接下载的英文文献中由于有参考文献部分,对文献在论文题目库中进行匹配时会产生误导作用,而每篇文章的长度不同,很难准确截取。
[0005]最后的问题为数据的保存方法,因为需要保证数据的随时可重新使用,而无需重新匹配进行工作。
[0006]当前正则表达式被广泛使用,C#编程语言在Windows平台有着很好的兼容性。
[0007]但是面对当前地学领域的应用场景,很难找到定位准确的软件,即能够实现准确识别当前地学领域中英文文献中地理位置信息功能的软件。
[0008]因此,有使用的必要来开发该软件。

技术实现思路

[0009]本专利技术的主要目的在于提供一种从英文文献正文中提取地理位置的软件系统及方法。
[0010]根据本专利技术的一个方面,提供了一种从英文文献正文中提取地理位置的软件系统,包括:r/>[0011]打开文件模块,用于打开英文文献文件;
[0012]导入EXCEL信息模块,用于打开EXCEL表格,插入数据库信息;
[0013]查询地理位置模块,用于增加地理位置信息、查询信息、修改信息;
[0014]提取地理位置模块,用于提取地理位置信息;
[0015]软件说明模块,用于说明软件的应用详情和软件的使用说明。
[0016]进一步地,所述导入EXCEL信息模块包括打开表格单元和插入数据库单元,所述打开表格单元用于打开EXCEL表格,插入数据库单元用于插入数据库信息。
[0017]更进一步地,所述插入数据库单元包括提取单元和自定义提取单元,所述提取单元用于根据软件中已经提供的正则表达式,对文字进行匹配提取,所述自定义提取单元用于自定义提取单元用于对原软件功能进行补充,补充软件中正则表达式的不完整。
[0018]更进一步地,所述查询地理位置模块包括增加地理位置信息单元、查询地理位置信息单元及修改地理位置信息单元;
[0019]所述增加地理位置信息单元用于对调取出的数据进行审阅,如果不详细或者不全,进行补全和添加备注地理位置,最后保存入数据库;
[0020]所述查询地理位置信息单元用于调取数据库,逐条展示所有提取出的数据和匹配的地理位置信息;
[0021]所述修改地理位置信息单元用于对调取出的地理位置信息进行审阅,如果有需要修改的可以在操作界面进行修改,进行保存,如果有错误,不保存即可。
[0022]更进一步地,所述软件说明模块包括应用详情单元和使用说明单元,详情单元用于说明软件的应用详情,使用说明单元用于说明软件的使用详情。
[0023]根据本专利技术的一个方面,提供了一种从英文文献正文中提取地理位置的方法,包括:
[0024]首先需要对少部分论文中的地理位置进行人工提取,之后分析获得的大部分地理位置的总体特征,将他们依次写作正则表达式;正则表达式是由普通字符以及特殊字符组成的文字模式;
[0025]特殊字符是一些有特殊含义的字符就是表示任何字符串的意思;如果要查找文件名中有*的文件,则需要对*进行转义,许多元字符要求在试图匹配它们时特别对待;
[0026]若要匹配这些特殊字符,首先使字符转义,即将反斜杠字符(\)放在它们前面;根据对大量文献中地理位置信息和参考文献出现的位置,将文章分为两种情况,一种是标明参考文献位置的文章,选择使用正则的方法截取前面部分文献;另一种没有注明参考文献的文献,选择按照百分比进行截取,能够起到类似的效果。
[0027]本专利技术的优点:
[0028]本专利技术的软件系统面对经纬度和其他地学领域或相类似的学术文献中,已经集中归类了大部分的地理位置的信息格式,同时预留了临时添加地理位置特征的功能,也可以在源代码的基础上二次开发,能够快速寻找出相对应的地理位置信息。同时可以自由选择是批量提取或者进行单次提取。
[0029]该软件能够节省大量时间,准确找到地理位置信息。
[0030]除了上面所描述的目的、特征和优点之外,本专利技术还有其它的目的、特征和优点。下面将参照图,对本专利技术作进一步详细的说明。
附图说明
[0031]构成本申请的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0032]图1是本专利技术的软件系统功能结构框图;
[0033]图2是本专利技术的软件系统的程序流程图。
具体实施方式
[0034]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并
不用于限定本专利技术。
[0035]参考图1和图2,一种从英文文献正文中提取地理位置的软件系统,包括:
[0036]打开文件模块,用于打开英文文献文件;
[0037]导入EXCEL信息模块,用于打开EXCEL表格,插入数据库信息;
[0038]查询地理位置模块,用于增加地理位置信息、查询信息、修改信息;
[0039]提取地理位置模块,用于提取地理位置信息;
[0040]软件说明模块,用于说明软件的应用详情和软件的使用说明。
[0041]所述导入EXCEL信息模块包括打开表格单元和插入数据库单元,所述打开表格单元用于打开EXCEL表格,插入数据库单元用于插入数据库信息。
[0042]所述插入数据库单元包括提取单元和自定义提取单元,所述提取单元用于根据软件中已经提供的正则表达式,对文字进行匹配提取,所述自定义提取单元用于自定义提取单元用于对原软件功能进行补充,补充软件中正则表达式的不完整。
[0043]所述查询地理位置模块包括增加地理位置信息单元、查询地理位置信息单元及修改地理位置信息单元;
[0044]所述增加地理位置信息单元用于对调取出的数据进行审阅,如果不详细或者不全,进行补全和添加备注地理位置,最后保存入数据库;
[0045]所述查询地理位置信息单元用于调取数据库,逐条展示所有提取出的数据和匹配的地理位置信息;
[0046]所述修改地理位置信息单元用于对调取出的地理位置信息进行审阅,如果有需要修改的可以在操作界面进行修改,进行保存,如果有错误,不保存即可。
[0047]所述软件说明模块包括应用详情单元和使用本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种从英文文献正文中提取地理位置的软件系统,其特征在于,包括:打开文件模块,用于打开英文文献文件;导入EXCEL信息模块,用于打开EXCEL表格,插入数据库信息;查询地理位置模块,用于增加地理位置信息、查询信息、修改信息;提取地理位置模块,用于提取地理位置信息;软件说明模块,用于说明软件的应用详情和软件的使用说明。2.根据权利要求1所述的从英文文献正文中提取地理位置的软件系统,其特征在于,所述导入EXCEL信息模块包括打开表格单元和插入数据库单元,所述打开表格单元用于打开EXCEL表格,插入数据库单元用于插入数据库信息。3.根据权利要求2所述的从英文文献正文中提取地理位置的软件系统,其特征在于,所述插入数据库单元包括提取单元和自定义提取单元,所述提取单元用于根据软件中已经提供的正则表达式,对文字进行匹配提取,所述自定义提取单元用于自定义提取单元用于对原软件功能进行补充,补充软件中正则表达式的不完整。4.根据权利要求1所述的从英文文献正文中提取地理位置的软件系统,其特征在于,所述查询地理位置模块包括增加地理位置信息单元、查询地理位置信息单元及修改地理位置信息单元;所述增加地理位置信息单元用于对调取出的数据进行审阅,如果不详细或者不全,进行补全和添加备注地理位置,最后保存...

【专利技术属性】
技术研发人员:李娜杨济鸣马管刘启政
申请(专利权)人:中国科学院西北生态环境资源研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1