一种信息处理方法及装置制造方法及图纸

技术编号：13183736 阅读：29 留言：0更新日期：2016-05-11 15:18

本发明专利技术公开了一种信息处理方法，所述方法包括：获取多个来自于不同种类业务的且具有预设的第一数据格式的第一业务数据；将每一种类的所述业务的第一业务数据生成待执行任务，并将所述待执行任务添加到任务队列中；从所述任务队列中获取所述待执行任务进行处理，得到对应的顺排数据或倒排数据。本发明专利技术同时还公开了一种信息处理装置。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及电子技术，尤其涉及一种信息处理方法及装置。
技术介绍
搜索引擎(Search Engine)是一种基于web平台的网络查找工具。因此,关于搜索引擎的概念可从不同的角度来理解。从信息组织的角度看，搜索引擎是一种网络信息资源的二次组织工具，它是将分布在不同网络服务器上的大量信息重新归类组织成易于查询的形式。从信息检索的角度看，搜索引擎是一种用以查询互联网中各类信息资源的在线检索平台，并以web网页的方式组织和呈现检索结果。但是对于开发者来说，搜索引擎是以Web相关技术为基础进行抓取与采集网页上的网络信息资源，建立索引数据库，然后依据用户的查找需求检索网络信息并将结果显示给用户，是为用户提供在线检索服务的web查找系统。搜索引擎可以按搜索内容、检索机制等进行划分，按搜索内容划分实际上就是内容归并法，按搜索内容划分的方法是指基于搜索引擎所搜集信息的内容状况(如覆盖程度、所属专业或学科等)，将现有的搜索引擎划分为水平搜索引擎和垂直搜索引擎。其中，垂直搜索引擎是针对某一个行业或领域的专业搜索引擎，是对网页库中的某类专门的信息进行一次整合，定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。目前通常有两种搜集信息的策略:I)第一种策略,顺从一个起始统一资源定位器(URL, Uniform Resource Locator)集合开始，顺着这些URL中的链接以宽度优先、深度优先或启发式方式等循环地在互联网中发现新的信息。这些起始URL可以是任意的URL，也可以是一些非常流行、包含很多链接的站点。2)第二种策略,将Web空间按照域名、网际协议(...

【技术保护点】
一种信息处理方法，其特征在于，所述方法包括：获取多个来自于不同种类业务的且具有预设的第一数据格式的第一业务数据；将每一种类的所述业务的第一业务数据生成待执行任务，并将所述待执行任务添加到任务队列中；从所述任务队列中获取所述待执行任务进行处理，得到对应的顺排数据或倒排数据。

【技术特征摘要】

【专利技术属性】
技术研发人员：卜立军，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人