本发明专利技术公开的属于大数据关键字检索技术领域,具体为一种基于大数据的关键字检索系统,包括信息处理中央单元,所述信息处理中央单元分别电性双向连接有预加载缓冲模块、验证服务器和身份信息识别端,所述身份信息识别端电性双向连接有服务等级对比模块,所述服务等级对比模块与验证服务器电性双向连接,所述身份信息识别端电性输出连接有挑用Cookie记录存储端,本发明专利技术通过设有将现有的搜索引擎进行关键字检索,然后通过对检索内容采用进一步的抓取和标签识别,从而对检索内容进行进一步的筛选,通过网址的检索分类,完成对信息的分类,进一步的对检索信息进行归纳,便于提高对信息的检索速度。
A keyword retrieval system based on big data
【技术实现步骤摘要】
一种基于大数据的关键字检索系统
本专利技术涉及大数据关键字检索
,具体为一种基于大数据的关键字检索系统。
技术介绍
在现有大数据技术下,经常采用关键字检索系统,在公司、部门或者个人的数据中进行检索,从而可以快速的实现对相应的文件或者数据的快速调用,而现有的关键字检索系统大多为设备自带的检索系统或者第三方支持的检索系统,经常会出现不需要的广告界面,经常随着广告词条的增多,导致需要一个进一步检索的检索系统,将初步的内容进行进一步筛选后得到需要的资料进行使用,所以需要对现有的一种检索系统加以改进。
技术实现思路
本专利技术的目的在于提供一种基于大数据的关键字检索系统,以解决上述
技术介绍
中提出的如何对检索内容进一步进行检索筛选的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于大数据的关键字检索系统,包括信息处理中央单元,所述信息处理中央单元分别电性双向连接有预加载缓冲模块、验证服务器和身份信息识别端,所述身份信息识别端电性双向连接有服务等级对比模块,所述服务等级对比模块与验证服务器电性双向连接,所述身份信息识别端电性输出连接有挑用Cookie记录存储端,所述身份信息识别端电性双向连接有信息调用端,所述信息调用端电性输出连接有信息推送模块,所述预加载缓冲模块与信息推送模块电性双向连接,所述信息调用端电性双向连接有数据库服务器,所述数据库服务器与服务等级对比模块电性双向连接,所述数据库服务器电性双向连接有信息整理模块,所述信息整理模块电性双向连接有信息上传模块,所述信息上传模块电性双向连接有信息审核模块,所述信息审核模块与信息整理模块电性输出连接,所述数据库服务器分别电性双向连接有关键字检索模块、数转汉翻译模块和近义词检索模块,所述关键字检索模块电性双向连接有备用数据库服务器,所述备用数据库服务器分别与数转汉翻译模块和近义词检索模块电性双向连接。优选的,所述预加载缓冲模块还包括二次筛选标签模块。优选的,所述身份信息识别端包括账号信息身份信息识别端或员工编号身份信息识别端。优选的,所述信息整理模块采用时间、名称、内容大小进行整理,并生成相应的文件编号前缀。优选的,所述信息上传模块根据检索结果的来源网址分为广告信息、论坛信息、出厂信息和问答求助信息,然后根据来源网址进行相应的信息标签标记。优选的,所述信息推送模块为根据信息标签标记进行的信息推送模块。与现有技术相比,本专利技术的有益效果是:1)本专利技术通过设有将现有的搜索引擎进行关键字检索,然后通过对检索内容采用进一步的抓取和标签识别,从而对检索内容进行进一步的筛选,通过网址的检索分类,完成对信息的分类,进一步的对检索信息进行归纳,便于提高对信息的检索速度;2)本专利技术通过以插件等形式,在调用了初步的搜索结果后,通过对标签的识别,可起到对检索结果的分类屏蔽,从而减少无用的信息的弹出,影响搜索速度的问题发生,提供更加精简的检索的结果,便于使用。附图说明图1为本专利技术结构示意图;图2为本专利技术工作流程图。图中:1信息处理中央单元、2预加载缓冲模块、3验证服务器、4身份信息识别端、5服务等级对比模块、6挑用Cookie记录存储端、7信息调用端、8信息推送模块、9数据库服务器、10信息整理模块、11信息上传模块、12信息审核模块、13关键字检索模块、14数转汉翻译模块、15近义词检索模块、16备用数据库服务器。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在本专利技术的描述中,需要说明的是,术语“上”、“下”、“内”、“外”、“顶/底端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。在本专利技术的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“设置有”、“套设/接”、“连接”等,应做广义理解,例如“连接”,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。请参阅图1-2,本专利技术提供一种技术方案:一种基于大数据的关键字检索系统,包括信息处理中央单元1,所述信息处理中央单元1分别电性双向连接有预加载缓冲模块2、验证服务器3和身份信息识别端4,所述预加载缓冲模块2还包括二次筛选标签模块,所述身份信息识别端4包括账号信息身份信息识别端或员工编号身份信息识别端,用于实现对数据的处理和基于现有的第三方检索平台进行初步的检索调用,保证检索的范围和检索的信息量充足,并且可适用于个人或公司使用。所述身份信息识别端4电性双向连接有服务等级对比模块5,所述服务等级对比模块5与验证服务器3电性双向连接,所述身份信息识别端4电性输出连接有挑用Cookie记录存储端6,所述身份信息识别端4电性双向连接有信息调用端7,所述信息调用端7电性输出连接有信息推送模块8,所述预加载缓冲模块2与信息推送模块8电性双向连接,所述信息推送模块8为根据信息标签标记进行的信息推送模块,便于基于大数据对用户进行相应的信息推送,采用预加载缓冲模块2,将第三方的检索结果进行缓冲加载后,对通过浏览器自身提供的源代码功能进行抓取,从而对标签名和标签名对应的网址进行抓取,从而对检索后的信息进行二次提取,而在抓取过程中,可以通过用户预设的拉黑词条,将相应的标签名进行跳过,不进行抓取,完成屏蔽的效果,减少信息量,提高检索效果。所述信息调用端7电性双向连接有数据库服务器9,所述数据库服务器9与服务等级对比模块5电性双向连接,所述数据库服务器9电性双向连接有信息整理模块10,所述信息整理模块10电性双向连接有信息上传模块11,所述信息上传模块11电性双向连接有信息审核模块12,所述信息审核模块12与信息整理模块10电性输出连接,所述信息整理模块10采用时间、名称、内容大小进行整理,并生成相应的文件编号前缀,所述信息上传模块11根据检索结果的来源网址分为广告信息、论坛信息、出厂信息和问答求助信息,然后根据来源网址进行相应的信息标签标记,用于将通过第三方检索后的网站通过浏览器自带的“查看源代码”功能转化为源代码,并且对源代码中的网址和名称的标签名进行整体抓取后上传到信息整体模块10,并通过信息上传模块11和信息审核模块12将抓取来的数据进行整理和排序后,再输入到数据库服务器9中,传递到信息调用端7进行展示,减少广告等信息的抓取,便于检索使用。所述数据库服务器9分别电性双向连接本文档来自技高网...
【技术保护点】
1.一种基于大数据的关键字检索系统,包括信息处理中央单元(1),其特征在于:所述信息处理中央单元(1)分别电性双向连接有预加载缓冲模块(2)、验证服务器(3)和身份信息识别端(4),所述身份信息识别端(4)电性双向连接有服务等级对比模块(5),所述服务等级对比模块(5)与验证服务器(3)电性双向连接,所述身份信息识别端(4)电性输出连接有挑用Cookie记录存储端(6),所述身份信息识别端(4)电性双向连接有信息调用端(7),所述信息调用端(7)电性输出连接有信息推送模块(8),所述预加载缓冲模块(2)与信息推送模块(8)电性双向连接,所述信息调用端(7)电性双向连接有数据库服务器(9),所述数据库服务器(9)与服务等级对比模块(5)电性双向连接,所述数据库服务器(9)电性双向连接有信息整理模块(10),所述信息整理模块(10)电性双向连接有信息上传模块(11),所述信息上传模块(11)电性双向连接有信息审核模块(12),所述信息审核模块(12)与信息整理模块(10)电性输出连接,所述数据库服务器(9)分别电性双向连接有关键字检索模块(13)、数转汉翻译模块(14)和近义词检索模块(15),所述关键字检索模块(13)电性双向连接有备用数据库服务器(16),所述备用数据库服务器(16)分别与数转汉翻译模块(14)和近义词检索模块(15)电性双向连接。/n...
【技术特征摘要】
1.一种基于大数据的关键字检索系统,包括信息处理中央单元(1),其特征在于:所述信息处理中央单元(1)分别电性双向连接有预加载缓冲模块(2)、验证服务器(3)和身份信息识别端(4),所述身份信息识别端(4)电性双向连接有服务等级对比模块(5),所述服务等级对比模块(5)与验证服务器(3)电性双向连接,所述身份信息识别端(4)电性输出连接有挑用Cookie记录存储端(6),所述身份信息识别端(4)电性双向连接有信息调用端(7),所述信息调用端(7)电性输出连接有信息推送模块(8),所述预加载缓冲模块(2)与信息推送模块(8)电性双向连接,所述信息调用端(7)电性双向连接有数据库服务器(9),所述数据库服务器(9)与服务等级对比模块(5)电性双向连接,所述数据库服务器(9)电性双向连接有信息整理模块(10),所述信息整理模块(10)电性双向连接有信息上传模块(11),所述信息上传模块(11)电性双向连接有信息审核模块(12),所述信息审核模块(12)与信息整理模块(10)电性输出连接,所述数据库服务器(9)分别电性双向连接有关键字检索模块(13)、数转汉翻译模块(14)和近义词检索模块(15),所述关键...
【专利技术属性】
技术研发人员:余惠群,
申请(专利权)人:苏州墨子网络科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。