【技术实现步骤摘要】
一种数据采集软件的数据处理方法
[0001]本专利技术涉及数据采集
,具体为一种数据采集软件的数据处理方法。
技术介绍
[0002]数据采集软件是一种能够根据用户需求在互联网上进行相应数据采集的软件,并将数据进行下载,然后利用软件将数据进行处理,用户根据自身需要将数据导出成文档、表格以及其他格式。
[0003]在现有技术中,用户使用软件进行数据采集时,通过数据关键词进行数据搜索,但是对于数据的检索范围不足,容易遗漏相关的数据,并且数据采集后用户需要对数据进行后期处理,删除不需要的数据,使用较为不便。
技术实现思路
[0004](一)解决的技术问题
[0005]针对现有技术的不足,本专利技术提供了一种数据采集软件的数据处理方法,解决了对于数据的检索范围不足,容易遗漏相关的数据,并且数据采集后用户需要对数据进行后期处理,删除不需要的数据,使用较为不便的问题。
[0006](二)技术方案
[0007]为实现上述目的,本专利技术提供如下技术方案:一种数据采集软件的数据处理方法,包 ...
【技术保护点】
【技术特征摘要】
1.一种数据采集软件的数据处理方法,包括输入模块(1),其特征在于:所述输入模块(1)输出端连接有相关性联想模块(2),所述相关性联想模块(2)连接端连接有目标预选模块(3),所述目标预选模块(3)连接端连接有目标采集模块(4),所述目标采集模块(4)连接端连接有审核处理模块(5)以及领域规划模块(6),所述领域规划模块(6)连接端连接有网页定位标注模块(7),所述相关性联想模块(2)包括多名称检索单元(9)以及同义词检索单元(10),所述目标预选模块(3)包括目标种类识别单元(11)、常用目标罗列单元(12)以及常用目标增选单元(13),所述审核处理模块(5)包括逻辑公式选择单元(14)、重复数据删除单元(15)以及数据甄别对应单元(16),所述网页定位标注模块(7)包括网页网址记录单元(17)以及领域标签储存单元(8);还包括以下步骤:步骤一、输入需要采集的目标关键词;步骤二、根据输入的目标关键词进行检索,检索关键词是否拥有别名以及同义词;步骤三、按照输入的关键词、别名以及同义词互联网上进行数据搜索,并按照预选的目标种类进行采集;步骤四、将采集到的数据进行审核处理,对具有逻辑关系的数据进行甄别,并从公式库寻找与该逻辑关系对应的逻辑公式,将数据代入到公式中进行计算,并删除重复数据;步骤五、根据输入的关键词进行所属领域划分,并生成相应的领域标签,将网址记录在该领域标签下。2.根据权利要求1所述的一种数据采集软件的数据处理方法,其特征在于:所述步骤一中输入的关键词的数量可为多个,且所述步骤一中还可输入指定的网页网址。3.根据权利要求1所述的一种数据采集软件的数据处理方法,其特征在于:所述步骤二具体为通过相关性联想模块(2)中的多名称检索单元(9)在互联网上对所输入...
【专利技术属性】
技术研发人员:魏尧,刘晰涵,佟佳鸿,刘佳,蔡仁祺,杨茗,池权灏,张旭旭,李宗原,吕会涛,田佳琳,
申请(专利权)人:魏尧,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。