当前位置: 首页 > 专利查询>孟小峰专利>正文

一种智能Web查询接口系统及其方法技术方案

技术编号:2827964 阅读:194 留言:0更新日期:2012-04-11 18:40
一种智能查询接口系统及其方法,其中该系统包括:领域知识库,用于存储每个候选领域的领域模型;智能查询接口,用户在该智能查询接口上填写查询条件单元并将用户的每个查询分解为一组查询条件单元;领域匹配模块,用于根据存储在领域知识库中的信息计算出用户查询与每个候选领域的匹配度,并选出最相关的领域提供给用户参考;以及查询转换模块,用于建立用户查询条件单元与查询接口属性的对应关系,生成最后的查询并送往相应领域的复杂集成接口。

【技术实现步骤摘要】

本专利技术涉及Web数据管理领域,特别是涉及一种智能Web查询接口系 纟充及方法。
技术介绍
随着World Wide Web的不断发展,Web上的在线翁:据库越来越多, 尤其是在网上购物、工作招聘、房屋租赁等领域。这些Web数据库中存 储的信息与浅层蚋页信息相比,专业性强,因而更具有价值;然而,因 为它们并不是以静态网页的方式呈现在用户面前的,因此不能有效地由 传统的搜索引擎(Google、 Baidu等)通过静态链接直接得到。 一般的, 网站将所有信息都存储在后台数据库中,并向前端用户提供可提交查询 的表单,称为查询接口。用户可以通过在网站提供的查询页面上输入查 询条件,向后台服务器提交查询,底层数据库会将查询结果以结果页面 的形式返回给用户。而在这样的查询过程中,用户每次只能向特定一个数据库提交查询, 想要获得更为全面的资源就只能向不同Web数据库多次提交查询,十分 地不便。Web数据库集成系统解决了此问题。它为用户提供了 一个全局的访问 入口,即复杂集成接口,复杂集成接口具有更强的查询能力,可以通过 它一次查询访问多个Web数据库,并将得到的信息集成起来,从而为用 户提供最全面的信息来源。复杂集成接口集成了其相关领域Web数据库查询接口上的所有属性 和属性值,支持的查询语义丰富。但相对地,由于追求属性及选项的全 面性,使得查询接口变得越来越复杂,不易使用。复杂集成接口的主要缺点是1. 一个复杂集成接口只能局限于一个特定领域。目前的集成方法都 是试图集成单一领域中的查询接口 ,不同的领域有不同的复杂集成接 口 ,用户无法通过一个统一的集成接口访问到多个领域。2. 复杂集成接口单一属性上不支持值的或逻辑。用户需要时, 只能通过多次填写复杂集成接口完成。3. 复杂集成接口包含过多可填写的属性。接口上多达几十种的属性 让用户很难快速定位到自己想要填写的属性,从用户体验的角度来说这 是非常不好的设计。4. 复杂集成接口上部分属性的候选值过多。如在找工作领域,像职 业类别、工作地区、行业类别等属性的候选值往往上百。另一方面有时 候选值的粒度不同,值的含义接近,界限模糊,使用户选择起来非常不 便。由于以上缺点,用户无法通过一个查询接口对不同领域进行查找,因 此目前的集成系统,例如一个电子商务网站只能采用在不同领域使用各 自的高级查询接口,通过网站的购物目录,用户才可以链接到不同查询 接口网页。然而一个用户可能一次想要查询多种产品,而这些产品往往 不属于一个领域,这种情况下,用户不得不多次往返与商品目录网页与 查询接口网页,并且对与不同的查询接口都要经历一个适应的过程,造 成极大的不便,降低用户对网站的兴趣。随着网站规模的扩大,购物的 种类越来越多,要求用户遴选出需要的领域,再进入特定的复杂查询接 口提交查询,是非常不便的。由此可见,目前的复杂集成接口的用户友好度是需要研究和改善的。 集成系统需要一种更加简洁和便利的查询方式,使得用户不再需要花费 额外的时间考虑查询的领域或者熟悉一个冗长的表单。目前大多凄t网站都提供了两种查询方式,即快速查询(quick search) 与高级查询(advance search),分别提供了关键字形式与结构化形式的 查询,兼顾了不同用户的需求。然而,作为结构化查询的极端,复杂集 成接口由于过于庞大而造成了用户的不便,急需一种不减弱集成系统查询能力的简化的模式。
技术实现思路
为了解决上述传统问题,因此本专利技术的一个目的就是提出了一种智能 Web查询4妄口系统及其方法。在本专利技术的一个方面中, 一种智能Web查询,接口系统包括领域知识库,用于存储每个候选领域的领域模型;智能查询接口,用户在该智能 查询接口上填写查询条件单元并将用户的每个查询分解为一组查询条件 单元;领域匹配模块,用于根据存储在领域知识库中的信息计算出用户 查询与每个候选领域的匹配度,并选出最相关的领域提供给用户参考; 以及查询转换;漠块,用于建立用户查询条件单元与查询接口属性的对应 关系,生成最后的查询并送往相应领域的复杂集成^口。在本专利技术的一个方面中, 一种用在智能Web查询接口系统上的方法, 该智能Web查询接口系统包括用于存储每个候选领域模型的领域知识库、 智能Web查询接口、领域匹配模块、查询转换模块,其特征在于,该方 法包括步骤接口输入步骤,用户在智能Web查询>|妄口上填写查询条件 单元并将用户的每个查询分解为一组查询条件单元;领域匹配步骤,用 于根据存储在领域知识库中的信息计算出用户查询与每个候选领域的匹 配度,并选出最相关的领域提供给用户参考;以及查询转换步骤,用于 建立用户查询条件单元与查询接口属性的对应关系,生成最后的查询并 送往相应领域的复杂集成接口 。根据本专利技术的方面,其中查询条件单元包含的是在同 一属性上的 一个 或多个条件值,每个查询条件单元内部都是或的关系。根据本专利技术的方面,其中领域匹配模块进一步包括分解模块,用于 分解用户查询; 一次过滤模块,当用户查询包含领域信息时,利用CT中 的词汇对查询进行一次过滤,预先去除与查询毫不相干的那些领域;过 滤领域模块,当预先确定了用户输入的某个词是一个特殊的属性名称时, 系统将自动将这个词尾随的符合该属性数据类型的词看作用户在这个属 性上的条件值,并将二者看作一个统一的整体;计算模块,用于计算相 似度;排序模块,用于根据领域与查询的匹配度而对所有集成系统中的 候选领域进行由高至低的排序;返回模块,用于返回其中匹配度最高的k 个领域。根据本专利技术的方面,其中查询转换模块进一步包括:计算匹配度模块, 用于初始化矩阵,计算每一个单元匹配的匹配度;分裂模块,用于按数 据类型分裂匹配度矩阵;行优化模块,用于进行行优化;计算可信度模 块,用于计算候选查询转换解的可信度;排序模块,用于对所计算的可 信度按照由大至小的顺序排序;获得模块,用于对排好序的每一个候选查询转换解,如果它的可信度大于预先设定的阅值e ,则输出并获得TopK解。根据本专利技术的方面,其中分裂模块将初始的匹配度矩阵按照数据类型 分裂,具有相同数据类型的关键词单元和属性形成子矩阵,并在各个子 矩阵上形成候选的单元匹配集合。根据本专利技术的方面,其中行优化分为唯一值优化和最优值优化。根据本专利技术的方面,其中唯一值优化是如果匹配度矩阵中存在一行, 只有一个大于0的匹配度值,那么这个单元所对应的匹配^皮确定,即最 终的查询转换解中都应该包含这个匹配,并将这个单元所在的行从匹配 度矩阵中移除,再重新扫描,如果还有符合行优化条件的行,则再次确 定相应的单元,并移除其所在的行列,直到不再出现满足条件的行为止。根据本专利技术的方面,其中最优值优化是矩阵上如果每行都有多于一 个大于零的匹配度值,那么考虑最优值优化,即在行中是否存在唯一的 DM值为1的单元,因为DM值为l,表示在这个查询条件单元在这个属性 的词典中准确地出现,那么这个查询条件单元与这个属性的匹配可以被 确认为最佳匹配,那么它也可以被预先确定下来。附图说明结合随后的附图,从下面的详细说明中可显而易见的得出本专利技术的上 述及其他目的、特征及优点。在附图中图1给出了根据本专利技术的智能Web查询接口系统的整体框架;图2给出了根据本专利技术的领域模型建立过程;图本文档来自技高网
...

【技术保护点】
一种智能查询接口系统,包括:领域知识库,用于存储每个候选领域;智能查询接口,用户在该智能查询接口上填写查询条件单元并将用户的每个查询分解为一组查询条件单元;领域匹配模块,用于根据存储在领域知识库中的信息计算出用户查询与每个候选领域的匹配度,并选出最相关的领域提供给用户参考;以及查询转换模块,用于建立用户查询条件单元与查询接口属性的对应关系,生成最后的查询并送往相应领域的复杂集成接口。

【技术特征摘要】
1、一种智能查询接口系统,包括领域知识库,用于存储每个候选领域;智能查询接口,用户在该智能查询接口上填写查询条件单元并将用户的每个查询分解为一组查询条件单元;领域匹配模块,用于根据存储在领域知识库中的信息计算出用户查询与每个候选领域的匹配度,并选出最相关的领域提供给用户参考;以及查询转换模块,用于建立用户查询条件单元与查询接口属性的对应关系,生成最后的查询并送往相应领域的复杂集成接口。2、 根据权利要求1的智能查询接口系统,其中查询条件单元包含的是 在同 一属性上的一个或多个条件值,每个查询条件单元内部都是或的关系。3、 根据权利要求1的智能查询接口系统,其中领域匹配模块进一步包 括分解模块,用于分解用户查询;一次过滤模块,当用户查询包含领域信息时,利用CT中的词汇对查 询进行一次过滤,预先去除与查询毫不相干的那些领域; 过滤领域模块,当预先确定了用户输入的某个词是一个特殊的属性 名称时,系统将自动将这个词尾随的符合该属性数据类型的词看作 用户在这个属性上的条件值,并将二者看作一个统一的整体; 计算模块,用于计算相似度;排序模块,用于根据领域与查询的匹配度而对所有集成系统中的候选领域进行由高至低的排序;返回模块,用于返回其中匹配度最高的k个领域。4、 根据权利要求1的智能查询接口系统,其中查询转换模块进一步包 括计算匹配度模块,用于初始化矩阵,计算每一个单元匹配的匹配度; 分裂模块,用于按数据类型分裂匹配度矩阵; 行优化模块,用于进行行优化;计算可信度模块,用于计算候选查询转换解的可信度; 排序;f莫块,用于对所计算的可信度^^安照由大至小的顺序排序; 获得模块,用于对排好序的每一个候选查询转换解,如果它的可信 度大于预先设定的阈值e,则输出并获得TopK解。5 、 根据权利要求1的智能查询接口系统,其中分裂模块将初始的匹配 度矩阵按照数据类型分裂,具有相同数据类型的关键词单元和属性 形成子矩阵,并在各个子矩阵上形成候选的单元匹配集合。6、 一种用在智能查...

【专利技术属性】
技术研发人员:孟小峰李忺
申请(专利权)人:孟小峰
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1