用于信息检索系统的搜索引擎技术方案

技术编号:14620513 阅读:131 留言:0更新日期:2017-02-10 12:17
搜索引擎执行非结构化搜索项的语义分析,以生成关系数据库查询。通过理解语义,搜索引擎更有效地识别和预测用户正在搜索什么信息且提供更深入的用户辅助。该搜索引擎使用不同的排名方案来识别哪些数据最可能与搜索项相关联且提供行级数据安全和对象级数据安全。该搜索引擎可以识别引起歧义的搜索请求,且允许用户选择创建数据之间的不同映射的不同结合路径。该搜索引擎可以生成含有所选择的映射的工作表。

【技术实现步骤摘要】
【国外来华专利技术】本申请要求享有2013年7月17日提交的标题为InformationRetrievalSystem、序列号为13/944,491的美国专利申请以及2014年4月14日提交的标题为SearchEngineforInformationRetrievalSystem、序列号为14/252,553的美国专利申请的优先权,所述两个美国专利申请都以引用的方式整体纳入本文。
技术介绍
企业需要访问特定商业情报(BI)信息。商业情报(BI)是可以将原数据变换成对商业目的有意义且有用的信息的一套理论、方法论、处理、架构以及技术。BI可以操纵大量信息以帮助识别和开发新的机会。利用新的机会和实施有效的策略可以提供竞争市场优势和长期稳定性。商业情报软件工具试图使将位于关系数据库中的原数据转化成商业决策人可以使用的有意义的信息的处理自动化。然而,新的报告的创建常常是复杂的且涉及若干个信息技术(IT)专家。商业用户首先可能需要填写一个描述在BI报告中提供什么数据的表单。该表单被带给信息技术(IT)专家,信息技术(IT)专家生成正确的关系数据库管理系统(RDBMS)查询且然后从查询结果创建报告。商业用户指明检索什么数据且然后从IT专家取回最终报告的过程常常可能花费若干周时间。当需要处理大容量的数据时,现有数据库解决方案可能不足够快到提供交互式商业用户体验。互联网搜索引擎被设计成搜索整个文档且帮助用户以公式表达问题。然而,互联网搜索引擎没有意识到存在于典型的关系数据库中的关系。互联网搜索查询仅执行简单的字符串匹配且不具有对结构化数据执行搜索以及关联/聚集/过滤搜索结果的智能。附图说明图1描绘一个示例信息检索系统。图2描绘用于信息检索系统的一个示例处理流程。图3描绘如何将数据列结合在数据库系统中的一个实施例。图4描绘用于从特设用户输入生成结构化搜索指令的一个示例过程。图5A-图5C描绘录入到搜索引擎内的示例输入。图6A-图6C描绘通过搜索引擎执行的示例自动完成和解释。图7A-图7B描绘通过搜索引擎生成的示例出错消息。图8描绘用于对令牌(token)排名和显示的一个示例过程。图9描绘具有不同令牌加权的示例索引。图10描绘用于对令牌排名的另一个示例过程。图11描绘一个示例状态机。图12A-图12C描绘基于通过图11中的状态机识别的状态显示的示例电子页面。图13描绘被搜索引擎使用的一个示例索引。图14描绘用于对令牌排名的一个示例索引。图15描绘一个示例优先级队列。图16描绘示例令牌安全位掩码。图17描绘具有安全位掩码的一个示例索引。图18描绘被信息检索系统使用的一个示例索引结构。图19描绘一个示例分布式索引结构。图20描绘信息检索系统中的一个示例表格映射。图21描绘一个示例用户可选择的表格映射。图22描绘用于第一搜索项的一个用户可选择的表格映射。图23描绘用于第二搜索项的一个替代用户可选择的表格映射。图24描绘用于第三搜索项的另一个替代用户可选择的表格映射。图25描绘用于一个用户可选择的表格映射的一个示例排名方案。图26描绘用于将不同表格动态地链接在一起的一个方案。图27和图28描绘用于生成一个工作表表格的一个方案。图29描绘用于处理公式化搜索查询的一个示例方案。图30描绘用于实施信息检索系统的一个示例计算设备。具体实施方式综述搜索引擎将非结构化特设搜索查询转换成从结构化关系数据库检索数据的搜索指令。搜索引擎允许多数用户通过仅仅键入几个字来表达搜索要求。基于位于关系数据库中以及任何其他结构化数据源或非结构化数据源中的内容、属性、度量以及其他元数据生成令牌。搜索引擎响应于用户输入来识别和显示令牌。令牌可以包括任何字、短语、字符组、值、符号等或其任何组合。搜索引擎使用令牌以通过搜索项的选择来引导用户,所述搜索项之后用于生成结构化查询指令。结构化查询指令然后用于检索数据库系统中的数据。搜索引擎可以确定和/或预测什么令牌和/或数据与用户输入相关联。例如,搜索引擎可以在用户完成录入搜索项或完成搜索查询之前提供建议和显示数据。所述建议帮助将用户引导到数据库系统中当前存在的相关数据。检索系统可以使用基于排名的方案以预测用户输入和取出对应的结果。例如,搜索引擎可以基于仅几个搜索字符来预测用户正在寻找销售数据。搜索引擎然后可以建议用于访问不同类型的销售数据的搜索项且可以启动初步搜索以检索和显示不同销售区域的销售数据。初步搜索可以显示用户最初正在搜索的精确信息。在其他情况下,初步搜索可以显示用户不知道存在的、用户通常不会请求的、或帮助用户定位正确信息的其他有帮助的信息。搜索引擎可以解决搜索输入和可用数据之间的歧义。例如,用户可以录入输入REVENUEBYYEAR。交易表格可以包括基于订单日期和发货日期的收入数据。搜索引擎可以询问用户是否应基于订单日期或发货日期计算收入?搜索引擎还可以提供如何对特定数据执行操作以生成结果的解释。搜索引擎还可以使用安全方案来约束不同用户可以查看什么数据。搜索引擎还可以允许用户选择搜索项和不同表格中的列之间的映射。搜索引擎可以生成含有所选择的映射的工作表表格。搜索引擎还可以对不同用户所选择的表格映射中的数据执行用户可定义的公式化操作。图1描绘一个示例信息检索系统100(检索系统)。信息检索系统100可以包括一批本地的和/或基于云的计算设备和存储设备,诸如,服务器、数据库系统和/或任何其他计算逻辑。检索系统100内的不同的计算设备和数据库系统可以经由一个或多个总线或网络耦合在一起。所述总线和网络可以包括局域网络(LAN)、广域网络(WAN)、光纤信道网络、因特网络等或其任何组合。用户可以使用计算设备114访问检索系统100。计算设备114可以包括个人计算机、计算机终端、移动设备、智能手机、电子笔记本等或其任何组合。关系数据库系统106可以包括一个或多个结构化关系数据库和/或非结构化数据库,诸如,存储一个企业的商业情报(BI)信息的任何数据库系统。BI信息可以包括销售数据、收入数据、利润数据、税收数据等或其任何组合。在一个实施例中,数据库系统106可以包括动态随机存取存储器(DRAM)、闪速存储器、盘式存储器或具有相对快速数据存取的任何其他类型的数据存储介质。在一个实施例中,数据库系统106中的一些数据以列本文档来自技高网...

【技术保护点】
一种方法,包括:通过一个计算设备识别一个关系数据库的特性;通过所述计算设备从所述关系数据库的特性生成令牌;通过所述计算设备接收含有一个搜索项的一个搜索请求;通过所述计算设备识别与所述搜索项相关联的一组令牌;通过所述计算设备基于与所述搜索项相关联的该组令牌生成一个结构化查询;以及通过所述计算设备使用所述结构化查询来检索所述关系数据库中的数据。

【技术特征摘要】
【国外来华专利技术】2013.07.17 US 13/944,491;2014.04.14 US 14/252,5531.一种方法,包括:
通过一个计算设备识别一个关系数据库的特性;
通过所述计算设备从所述关系数据库的特性生成令牌;
通过所述计算设备接收含有一个搜索项的一个搜索请求;
通过所述计算设备识别与所述搜索项相关联的一组令牌;
通过所述计算设备基于与所述搜索项相关联的该组令牌生成一个
结构化查询;以及
通过所述计算设备使用所述结构化查询来检索所述关系数据库中
的数据。
2.根据权利要求1所述的方法,还包括:
识别用于所述搜索项的第一组局部字符;
识别与所述第一组局部字符相关联的令牌;以及
显示与所述第一组局部字符相关联的令牌。
3.根据权利要求2所述的方法,还包括基于与所述第一组局部字
符相关联的令牌生成所述结构化查询。
4.根据权利要求3所述的方法,还包括:
识别用于所述搜索项的第二组局部字符;
识别与所述第二组局部字符相关联的令牌;
显示与所述第二组局部字符相关联的令牌;
基于与所述第二组局部字符相关联的令牌生成一个附加的结构化
查询;以及
显示基于所述附加的结构化查询从所述关系数据库检索到的数据。
5.根据权利要求1所述的方法,还包括:
按照属性、度量或值将所述令牌分类;
基于用于匹配所述搜索项的令牌的属性、度量或值来识别所述搜索
请求的状态;以及
基于所述搜索请求的状态来显示所述令牌和启动结构化搜索查询。
6.根据权利要求1所述的方法,还包括:
识别与所述令牌相关联的表格;
识别所述表格的维度;
基于相关联的表格的维度来对所述令牌排名;以及
基于所述排名来显示所述令牌。
7.根据权利要求6所述的方法,还包括基于与所述令牌相关联的
表格的维度和使用率对所述令牌排名。
8.根据权利要求7所述的方法,还包括:
使与具有较小维度的表格相关联的令牌的排名高于与具有较大维
度的表格相关联的令牌的排名;以及
使与具有高使用率的表格相关联的令牌的排名高于与具有低使用
率的表格相关联的令牌的排名。
9.根据权利要求1所述的方法,还包括:
接收所述搜索请求的一部分作为一个非结构化输入;
将所述搜索请求的所述部分与所述令牌比较;以及
建议所述令牌中的一些用于替换所述搜索请求的所述部分。
10.根据权利要求9所述的方法,还包括:
检测对所述令牌中的一个的选择;
用所述令牌中的所选择的一个令牌替换所述搜索请求的所述部分;
以及
基于所述令牌中的所选择的一个令牌生成所述结构化查询。
11.一种装置,包括:
一个内部存储器关系数据库系统;以及
一个处理系统,被配置为:
识别所述数据库系统中的内容;
基于所述数据库系统中的内容生成令牌;以及
使用所述令牌来将非结构化用户输入与所述数据库系统中的内容
相关联。
12.根据权利要求11所述的装置,其中该处理系统还被配置为使
用所述令牌预测所述数据库系统的哪些列与所述用户输入相关联。
13.根据权利要求11所述的装置,其中所述处理系统还被配置为:
识别与所述用户输入相关联的令牌;
基于与所述令牌相关联的内容的使用率和维度对所述令牌排名。
14.根据权利要求11所述的装置,其中所述处理系统还被配置为:
操作一个搜索引擎,所述搜索引擎被配置为基于与所述用户输入相
关联的令牌生成一个搜索对象;以及
操作一个商业情报服务器,所述商业情报服务器被配置为响应于所
述搜索对象来生成结构化搜索指令,以用于检索来自所述数据库系统的
内容。
15.根据权利要求14所述的装置,其中:
所述数据库系统包括分布在所述处理系统的不同计算设备之上的
多个数据库处理;以及
所述数据库处理被配置为处理用于所述内容的不同部分的结构化
搜索指令。
16.根据权利要求15所述的装置,其中所述数据库处理被配置为:
基于所述结构化搜索指令结合所述内容的列;
基于所述结构化搜索指令对结合的列中的内容进行操作;
将所述操作的结果发送到所述商业情报服务器;以及
缓存所述结合的列。
17.根据权利要求11所述的装置,其中所述处理系统还被配置为:
基于所述令牌形成一个结构化查询;
将所述结构化查询发送到所述数据库系统;
响应于所述结构化查询从所述数据库系统接收回所述内容;
识别含有所述内容的列的维度;以及
基于所述列的维度以不同格式显示所述内容。
18.根据权利要求17所述的装置,其中所述处理系统还被配置为:
识别所述列...

【专利技术属性】
技术研发人员:A·普拉卡什A·辛格P·S·德什沃尔J·杜塔S·古普塔V·K·加内桑A·赖S·阿格拉沃尔V·那那瓦提S·A·基什S·乔汉S·谢卡尔
申请(专利权)人:索特斯波特有限公司
类型:发明
国别省市:美国;US

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1