当前位置: 首页 > 专利查询>张天山专利>正文

基于网站自动生成和搜索引擎的信息推送系统及方法技术方案

技术编号:2850500 阅读:207 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种基于网站自动生成和搜索引擎的信息推送系统及方法。本发明专利技术包括:计算机或移动设备通过互联网及路由器与模板式网站自动生成系统、专业搜索引擎系统及智能信息推送系统相连接;模板式网站自动生成系统,它包括:用户信息管理子系统、网页模板维护子系统、网站自动生成子系统、网站管理子系统、搜索竞价排名系统;专业搜索引擎系统,它包括:网页收集系统、海量存储系统、网页索引系统、索引检索系统;智能信息推送系统,它包括:专家知识库、信息匹配及推送、订阅管理系统、文章及信息分类。本发明专利技术使拥有搜索引擎技术与虚拟主机经营业务及网站建立业务三者统一为一体,它实现了“搜索引擎”技术的“信息推进”(Push)方法。

【技术实现步骤摘要】

本专利技术涉及一种互联网通讯信息
,特别是指一种。
技术介绍
目前,互联网以及相关技术的应用与普及,已经在全世界范围内从根本上改变了人们的生活。人们从信息、通讯、娱乐和工作等各个方面已经对这种新型的媒介形成了强大的依赖。在互联网的诞生地美国,几乎所有的企业都建立了自己的网站,越来越多的营销活动在网上进行,越来越多的人利用网络寻求商业信息,或直接在网上购物。互联网已经从通讯,娱乐等领域步入了人们的日常活动中。互联网在中国国内也得到了迅猛发展。根据最新统计,中国的上网人口总数已经超过一亿,网民数量超过美国,成为世界第一的互联网大国已经指日可待。互联网的广泛使用与搜索引擎的技术和应用有着密切的关系。当今世界上所有的搜索引擎技术,包括美国的Google、中国的百度,以及其他服务商的搜索引擎,所提供的应用方式主要是“信息求取”(Get),即搜索引擎服务商在他们自己的网站上显示搜索框,搜索者在搜索引擎公司网站上的搜索框中输入关键字,搜索引擎根据搜索者的请求抓取相关数据,并将其作为结果呈现给搜索者。其中搜索者为主动,搜索引擎为被动。此外,当今世界上所有的搜索引擎所使用的技术都包括以下三大功能模块(1)爬网;(2)分词索引;(3)搜索。其中,爬网是将全世界的网站网页尽可能多的“抓”到自己的服务器中存起来,然后用一定的方法进行分词检索,最后还要有大量的服务器阵列来应对大量的搜索请求。这三大功能模块也是搜索引擎技术的“信息求取”(Get)应用方式所必不可少的。
技术实现思路
本专利技术的目的在于提出一种。传统的搜索引擎技术应用方式为“信息求取”(Get),其中用户为主动,搜索引擎为被动。本专利技术所提出的搜索引擎技术应用方式为“信息推进”(Push),其中搜索引擎为主动,用户为被动。本专利技术是利用搜索引擎的分词技术,通过用户使用本专利技术所提供的“网站自动生成系统”生成的网站,从中发现用户的需求,尤其关注供求链中的上、下游关系。根据这些需求,本专利技术的搜索引擎就可从数据库中搜索到提供相应服务的企业,并可主动将该信息推送给用户。本专利技术的技术方案是一种基于网站自动生成和搜索引擎的信息推送系统,其特征在于它包括计算机或移动设备通过互联网及路由器与模板式网站自动生成系统、专业搜索引擎系统及智能信息推送系统相连接;模板式网站自动生成系统,它包括用户信息管理子系统、网页模板维护子系统、网站自动生成子系统、网站管理子系统、搜索竞价排名系统;专业搜索引擎系统,它包括网页收集系统、海量存储系统、网页索引系统、索引检索系统;智能信息推送系统,它包括专家知识库、信息匹配及推送、订阅管理系统、文章及信息分类。其中,所述的模板式网站自动生成系统,它包括用户信息管理子系统、网页模板维护子系统、网站自动生成子系统、网站管理子系统;A)、用户信息管理子系统负责收集用户信息;用户自管理功能;用户可以凭用户名密码登录到管理界面中增加,修改或删除用户信息。B)、网页模板维护子系统它设有不同的网站设计模板,包括不同的行业,如计算机、IT、电子、时尚、服装、服饰、金融、投资、保险等;并且每一个模板还设有搜索功能框;C)、网站自动生成子系统1)、用户注册,然后进入网站自动生成向导系统;2)、用户选择网站模板,系统提供几十个行业,上千个事先设计好的模板供用户选择;3)、用户选择网站栏目链接选如公司简介、业务或产品介绍、产品展示、联系方式等等;4)、用户输入网页信息编辑器允许用户输入不同形式的网页内容,它包括普通文字,或文字链接,或表格式文档;且编辑器还可允许用户改变文字字体、颜色、背景颜色;5)、如果用户选择了产品展示,则上传产品图片及输入关于产品的说明文字;6)、网站发布用户可即时看到系统自动生成的真实网站,任何人在世界任何地方可即时访问。其中,所述的网站自动生成系统,它还包括1)、客户留言允许网站的访问者输入留言和对公司服务与所销售产品的咨询,网站管理员可登录到管理界面中查询、管理留言;其中包括回复留言和将留言显示在网页上;2)、人才招聘它允许用户发布和随时更新招聘信息;并允许网站管理员登录到管理界面中查看应聘人员简历;在所述的管理系统中查询、浏览、响应所发布招聘职位的应聘简历,并与应聘人员取得联系。D)、网站管理子系统用户可随时到管理界面中管理网站,包括1)、允许用户在线删除和修改已经建成的网页内容或增加新的网页内容,并可随时发布浏览;管理系统允许用户随时增加、删除和修改包括产品图片在内的产品信息;2)、域名管理允许用户在线注册域名或转移域名,并将其与所选用的模板式网站绑定; 3)、邮箱管理允许用户在线设立增加新邮箱;改变已有邮箱大小;设置邮件转发;改变邮箱密码或找回邮箱密码;所述的专业搜索引擎系统,是本专利技术与用户外部使用界面,由索引检索系统接收用户查询请求,然后经广播/汇集器发送到检索服务阵列中进行同步查询;每一个检索服务器所使用的索引段又是由网页索引系统生成;被索引的网页则来自于网页搜集系统;这样各部分协同工作,构成一个搜索引擎整体。它包括网页收集系统,海量存储系统;网页索引系统;索引检索系统,其中,A)、所述的网页收集子系统,它是一个并行工作的爬虫系统,从互联网中并行高速地抓取网页,得到网页内容后由并行网页分析器对其进行内容分析,提取新的网页链接,存入链接管理器以备抓取所用;经过一段时间的收集后,子系统内就会收集并维护一份互联网全部网页的地址;包括(1)、链接管理器它是网页收集系统的处理起点,初始时,网页链接器内需要注入一个初始的链接集合,然后根据这些初始链接指挥具体的网页抓取器进行爬网,同时链接管理器接收链接分析器的输出结果(经过网页内容分析后所得的新链接集);这样经过几轮的爬网→分析→提取链接→入库→再爬网的循环,链接管理器内最终收录互联网的全部链接(无限逼近),每个链接的相关信息也都进入链接管理器内进行维护;(2)网页抓取器链接管理器根据平衡、高效的原则把所有已知链接分割成数个链接子集,每个链接子集交给一个网页抓取器,多个网页抓取器并行工作,把各自的链接集合内的网页内容抓取回来,存放在本地的网页池内,供后续的链接分析器工作之用。网页抓取器的工作原理于网页浏览器相似,它针对不同协议的链接类型,采取不同协议模块,利用从网页链接管理器中所提取的链接相关信息,处理各种复杂的情况(认证,https,加密,javascript等),把网页内容抓取到本地;(3)链接分析器它是一个高效率的html语言解析器,它读入html流,根据html标准分析,提取所有的链接,然后根据这些链接更新链接管理器内的链接;所有的链接分析器并行工作,可以随网页抓取的速度动态调整负载,实现高效率网页分析;再把分析过的网页内容存入海量存贮系统内,以备后续的网页索引系统使用。B)、海量存储子系统它是一个分布式的,具有良好可伸缩性的,高效率的网络文件系统,它特别针对搜索引擎的存储特性所设计,采用压缩文件集存储的方式,利用块索引节点服务器加数据节点服务器的方法,把海量信息以文件集为单位,均匀的分布在各个数据节点上,同时每个文件集都同时保存在2个以上的数据节点中,提供有效的数据备份能力;在文件提取时,文件使用端首先从块索引节点上查询到相应的文件所在的目标数据节点服务器,然后从目标数据节点服务器中本文档来自技高网...

【技术保护点】
一种基于网站自动生成和搜索引擎的信息推送系统,其特征在于:它包括:计算机或移动设备通过互联网及路由器与模板式网站自动生成系统、专业搜索引擎系统及智能信息推送系统相联接;其中,模板式网站自动生成系统,它包括:用户信息管理子系统、网页模板维护子系统、网站自动生成子系统、网站管理子系统、搜索竞价排名系统;专业搜索引擎系统,它包括:网页收集系统、海量存储系统、网页索引系统、索引检索系统。

【技术特征摘要】
1.一种基于网站自动生成和搜索引擎的信息推送系统,其特征在于它包括计算机或移动设备通过互联网及路由器与模板式网站自动生成系统、专业搜索引擎系统及智能信息推送系统相联接;其中,模板式网站自动生成系统,它包括用户信息管理子系统、网页模板维护子系统、网站自动生成子系统、网站管理子系统、搜索竞价排名系统;专业搜索引擎系统,它包括网页收集系统、海量存储系统、网页索引系统、索引检索系统。2.根据权利要求1所述的基于网站自动生成和搜索引擎的信息推送系统,其特征在于A)、所述的用户信息管理子系统负责收集用户信息;用户自管理功能;用户可以凭用户名密码登录到管理界面中增加,修改或删除用户信息;B)、所述的网页模板维护子系统它设有不同的网站设计模板,包括不同的行业;并且每一个模板设有搜索功能框;C)、所述的网站自动生成子系统它包括1)、用户注册,然后进入网站自动生成向导系统;2)、用户根据其需求选择网站模板;3)、用户选择网站栏目链接选;4)、用户输入网页信息5)、如果用户选择了产品展示,则上传产品图片及输入关于产品的说明文字;6)、网站发布D)、所述的网站管理子系统用户可随时到管理界面中管理网站,包括在线修改网页内容,随时发布浏览。3.根据权利要求2所述的基于网站自动生成和搜索引擎的信息推送系统,其特征在于所述的网站管理子系统,它还包括;域名管理或邮箱管理。4.根据权利要求1或2所述的基于网站自动生成和搜索引擎的信息推送系统,其特征在于所述的网站自动生成系统,它还包括搜索竞价排名系统,可对某些关键词进行竞价,使用户网站在相应搜索结果中排名靠前。5.根据权利要求1或2所述的基于网站自动生成和搜索引擎的信息推送系统,其特征在于所述的网站自动生成系统,它还包括A)、客户留言允许网站的访问者输入留言和对公司服务与所销售产品的咨询,网站管理员可登录到管理界面中查询、管理留言;其中包括回复留言和将留言显示在网页上;B)、人才招聘发布和随时更新招聘信息;网站管理员登录到管理界面中查看应聘人员简历;在所述的管理系统中查询、浏览、响应所发布招聘职位的应聘简历,并与应聘人员取得联系。6.根据权利要求1所述的基于网站自动生成和搜索引擎的信息推送系统,其特征在于所述的网页收集系统,它是一个并行工作的爬虫系统,从互联网中并行高速地抓取网页,得到网页内容后由并行网页分析器对其进行内容分析,提取新的网页链接,存入链接管理器以备抓取所用;经过一段时间的收集后,子系统内就会收集并维护一份互联网全部网页的地址;包括A)、链接管理器它是网页收集系统的处理起点,初始时,网页链接器内需要注入一个初始的链接集合,然后根据这些初始链接指挥具体的网页抓取器进行爬网,同时链接管理器接收链接分析器的输出结果;B)网页抓取器链接管理器根据平衡、高效的原则把所有已知链接分割成数个链接子集,每个链接子集交给一个网页抓取器,多个网页抓取器并行工作,把各自的链接集合内的网页内容抓取回来,存放在本地的网页池内,供后续的链接分析器工作之用。网页抓取器的工作原理于网页浏览器相似,它针对不同协议的链接类型,采取不同协议模块,利用从网页链接管理器中所提取的链接相关信息,处理各种复杂的情况,把网页内容抓取到本地;C)链接分析器它是一个高效率的html语言解析器,它读入html流,根据html标准分析,提取所有的链接,然后根据这些链接更新链接管理器内的链接;所有的链接分析器并行工作,可以随网页抓取的速度动态调整负载,实现高效率网页分析;再把分析过的网页内容存入海量存贮系统内,以备后续的网页索引系统使用。7.根据权利要求1所述的基于网站自动生成和搜索引擎的信息推送系统,其特征在于所述的海量存储系统它采用压缩文件集存储的方式,利用块索引节点服务器加数据节点服务器的方法,把海量信息以文件集为单位,均匀的分布在各个数据节点上,同时每个文件集都同时保存在至少2个以上的数据节点中,提供有效的数据备份能力;在文件提取时,文件使用端首先从块索引节点上查询到相应的文件所在的目标数据节点服务器,然后从目标数据节点服务器中直接提取文件,实现了海量存储的高效率,高可用性;包括A)、块索引节点服务器在海量存储系统中,文件被压缩到文件集中,再以32M为一块来进行存储;由块索引节点服务器来维护所有数据节点和所有数据快的对应数据,同时,服务器还动态的维护一个可用服务器列表,当有文件需要存储时,它首先找到一个在线的有空间的数据节点,然后将数据块写入,同时记录数据块的位置信息,当有三个以上的数据节点可用时,块索引节点还负责在把块数据的2份备份数据块复制到另外的2个数据节点上,实现数据的冗余保护;当客户端需要提取数据块时,服务器先查找该数据块存放在哪一台在线服务器中,然后把节点号返回给客户,由客户端直接与节点通讯,取得目标数据块;B)、数据节点服务器它是海量存储系统的实际数据存放服务器,它建立在普通的Linux文件系统之上;以文件形式存放32M的块数据;当数据节点服务器启动后,...

【专利技术属性】
技术研发人员:张天山
申请(专利权)人:张天山
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1