【技术实现步骤摘要】
定制潜在发生事件发生消息的实时搜索方法及系统
本专利技术涉及网络信息搜索
,尤其涉及一种定制潜在发生事件发生消息的实时搜索方法及系统。
技术介绍
当前,人们从互联网上获得信息的主要手段是通过搜索网页浏览、APP、引擎搜索等方式。网页浏览方式,人们在浏览器地址栏输入地址,打开网站,浏览网页或站内搜索,获得信息。APP方式,人们打开APP,浏览网页或站内搜索,获得信息。搜索引擎方式,搜索引擎根据一定的策略、运用特定的计算机程序从互联网上采集信息,在对信息进行组织和处理后,为用户提供检索服务,用户在搜索框中输入关键词,返回搜索结果,翻页、点击搜索结果,获得信息。无论是哪一种方式获取信息,都需要人们主动去查询,才能获得,而且查询是当场反馈的,查询结束,信息获取就结束。查询行为之后产生的信息,需要等下一次查询行为发生,才能获得。人们所关心的重要事件,是否发生、何时发生等消息,需要不停地查询、搜索,才能获得,既费时又费力,还不容易在第一时间获得。
技术实现思路
人们所关心的重要事件发生后,为帮助人们第一 ...
【技术保护点】
1.定制潜在发生事件发生消息的实时搜索方法,其特征在于,包括如下流程:/nS1:用户打开会员模块,注册账号,登陆实时搜索系统;/nS2:打开设置模块,设置潜在发生事件关键词群、目标网站群、最早发生时间、爬取间隔时间等搜索条件,设定通知方式、结束条件;/nS3:用户点击搜索按钮,发送搜索指令,离开搜索页面;/nS4:实时搜索系统后台执行搜索指令,访问目标网站群;/nS5:爬虫模块,按照爬取间隔时间不间断地抓取网页;/nS6:网页处理模块,对网页预处理,提取网页类型、分析超链接、去除重复URL、去除重复网页、网页反垃圾、提取网页生成时间、抽取文本、网页摘要等,相关数据存入数据库 ...
【技术特征摘要】
1.定制潜在发生事件发生消息的实时搜索方法,其特征在于,包括如下流程:
S1:用户打开会员模块,注册账号,登陆实时搜索系统;
S2:打开设置模块,设置潜在发生事件关键词群、目标网站群、最早发生时间、爬取间隔时间等搜索条件,设定通知方式、结束条件;
S3:用户点击搜索按钮,发送搜索指令,离开搜索页面;
S4:实时搜索系统后台执行搜索指令,访问目标网站群;
S5:爬虫模块,按照爬取间隔时间不间断地抓取网页;
S6:网页处理模块,对网页预处理,提取网页类型、分析超链接、去除重复URL、去除重复网页、网页反垃圾、提取网页生成时间、抽取文本、网页摘要等,相关数据存入数据库;
S7:网页比较模块,比较潜在发生事件的搜索条件,满足搜索条件,搜索成功,找到记载潜在发生事件发生的消息的网页,触发通知消息;
S8:通知模块,第一时间按通知方式将搜索结果、网页摘要等通知给用户;
S9:继续搜索,转到S4,结束搜索,转到S10;
S10:用户收到搜索结果通知,搜索结束。
2.根据权利要求1所述的定制潜在发生事件发生消息的实时搜索方法,其特征在于,所述的潜在发生事件,在搜索行为发生时,还没有发生,用户设置好搜索条件后,不必在搜索页面处等待搜索结果反馈回来,可以离开搜索页面,去干别的事情。
3.根据权利要求1所述的定制潜在发生事件发生消息的实时搜索方法,其特征在于,所述的最早发生时间,默认为搜索行为发生时间,用户可以自行调整。
4.根据权利要求1所述的定制潜在发生事件发生消息的实时搜索方法,其特征在于,所述的关键词群,是一个或多个关键词的集合,每一个关键词都是一个最小语义单元,不进一步分词,包括:网页必须包含的关键词群、网页不能包含的关键词群、网页可...
【专利技术属性】
技术研发人员:文特,文爱博,其他发明人请求不公开姓名,
申请(专利权)人:深圳创新黑科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。