【技术实现步骤摘要】
本专利技术专利涉及一种信息领域的数据查询方法,尤其涉及一种用于利用搜索引擎 来提供结构化查询的方法,其利用通用的搜索引擎来进行结构化数据服务,使得结构化应 用开发对非结构化数据进行挖掘成为可能。
技术介绍
一般来说,搜索引擎提供非结构化文本的查询服务,数据库引擎提供结构化数据 的查询服务。因此结构化应用和利用数据库实现的数据挖掘过程难以拓展到非结构化数据 上。比如搜索引擎对一个公开站点进行索引后,如果试图利用结构化数据分析方法来对网 站的注册用户行为进行分析,通常来说是不太可能的。比如BBS、博客和微博的顶贴人分析, 哪些是假冒的明星粉丝,哪些人是托,对于一些商业化公司是有用的,特别是广告公司。目 前缺乏有效的手段来进行来进行跨越站点的综合分析,一般是针对特定网站进行设计分析 程序。如果能够用搜索引擎来提供结构化查询的方法,很多标准的结构化分析程序将可以 派上用场。
技术实现思路
利用搜索引擎将网页等文本信息进行结构化解析,如果需要高速访问就按照数据 库的方式建索引,然后利用数据库访问中间件来模拟数据库引擎的动作。结构化应用程序 通过访问数据库访问中间件驱动搜索引擎 ...
【技术保护点】
一种利用搜索引擎来提供结构化查询的方法,其特征在于:1)通过对热门的网络应用各类属性进行整理成通用的超集;2)将这些涉及到的页面信息进行结构化提取后入数据库,同时可以建立索引以加快检索速度;3)搜索引擎通过API对外提供SQL驱动的结构化数据访问。
【技术特征摘要】
【专利技术属性】
技术研发人员:汪洋,凌世播,彭艳兵,廖闻剑,
申请(专利权)人:南京烽火星空通信发展有限公司,
类型:发明
国别省市:84
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。