一种即席查询的方法、装置及服务器制造方法及图纸

技术编号:19177324 阅读:17 留言:0更新日期:2018-10-17 00:21
本申请提供了一种即席查询的方法、装置及服务器,增加了逻辑模型索引文档,对查询到的逻辑模型索引文档进行打分,使得业务用户看到的逻辑模型查询结果是具有分数值的逻辑模型索引文档,从而方便业务用户的逻辑模型识别和选择,提高了即席查询的效率。本申请实施例方法包括:获取业务用户输入的检索词;根据检索词查询索引库,确定逻辑模型索引文档集合,逻辑模型索引文档集合包括至少一个逻辑模型索引文档,索引库包括至少一个逻辑模型索引文档的文档标识、文档字段的分词结构信息及评分权重信息;根据逻辑模型索引文档打分公式及评分权重信息,对逻辑模型索引文档集合中每一个逻辑模型索引文档进行打分,得到逻辑模型查询结果。

An instant query method, device and server

This application provides a method, device and server for impromptu query, which adds a logical model index document and scores the queried logical model index documents, so that the logical model query results that business users see are logical model index documents with score value, thus facilitating the logical model of business users. Recognition and selection improve the efficiency of instant query. The embodiment of the present application includes: obtaining a search term input by a business user; searching an index library for a search term to determine a set of logical model indexed documents, including at least one logical model indexed document, and an index library including a document identification and a document word of at least one logical model indexed document. According to the scoring formula and scoring weight information of logical model index documents, each logical model index document in the logical model index document set is scored, and the logical model query results are obtained.

【技术实现步骤摘要】
一种即席查询的方法、装置及服务器
本申请涉及计算机领域,尤其涉及一种即席查询的方法、装置及服务器。
技术介绍
企业中业务分析人员经常面对各种临时性的数据查询的需求,这些临时性的数据查询的需求特点是:已有的报表中无法满足该查询需求;需要的数据通常来自数据仓库中多张表;分析操作一般比较简单,例如过滤、汇总和排序等。基于这些查询需求,企业在建设数据仓库的时候,通常会提供两套即席查询工具,分别是语义建模工具和查询设计工具。语义建模工具供IT人员使用,IT人员将数据仓库中的物理表建模为逻辑模型,物理表是一系列二维数组的集合,用于代表数据仓库中存储的数据对象。逻辑模型映射到一个或多个物理表,并指定了逻辑模型中的列映射到物理表中列的方式。查询设计工具供业务用户使用,业务用户通过该工具从众多的逻辑模型中挑选一到多个,然后挑选逻辑模型中特定字段来构造查询。一个简单的查询设计工具提供如下功能:逻辑模型查询、逻辑模型关联设置及输出列设置。自助查询的结果为二维数组的结构,有多个输出列,输出列设置提供从逻辑模型中挑选特定字段映射为查询结果列的功能。为满足业务用户灵活的自助查询的需求,IT人员通常会批量开发非常多的逻辑模型,业务用户很难通过一个个浏览的方式获取逻辑模型。为了方便业务用户获取逻辑模型,一种现有的即席查询的方法为:一、IT人员利用语义建模工具将数据仓库中的物理表建模为逻辑模型的时候,保存逻辑模型和逻辑模型字段的信息,并且为“逻辑模型”表和“逻辑模型字段”表分别建立独立的索引;二、基于以上索引,查询设计工具接收业务用户输入的检索词;三、根据检索词构造检索的结构化查询语言(StructuredQueryLanguage,SQL)语句;四、获取返回的符合检索词的逻辑模型名或逻辑模型字段名,以列表方式展示给业务用户;五、业务用户拖动搜索到的逻辑模型到设计区域,将该逻辑模型中的某个逻辑字段设置为查询结果的输出列。但是,现有的即席查询方法的查询结果是将所有匹配检索词的逻辑字段和逻辑模型显示出来,需要业务用户一一识别显示的字段或者逻辑模型,从而选择适合的逻辑模型,在显示的字段或者逻辑模型较多时,业务用户进行识别和选择的工作量和耗时较大,影响了即席查询的效率。
技术实现思路
本申请提供了一种即席查询的方法、装置及服务器,增加了逻辑模型索引文档,对查询到的逻辑模型索引文档集合中每一个逻辑模型索引文档进行打分,使得业务用户看到的逻辑模型查询结果是具有分数值的至少一个逻辑模型索引文档,从而方便业务用户的逻辑模型识别和选择,提高了即席查询的效率。本申请第一方面提供一种即席查询的方法,包括:获取业务用户输入的检索词;根据所述检索词查询索引库,确定逻辑模型索引文档集合,所述逻辑模型索引文档集合包括至少一个逻辑模型索引文档,所述索引库包括所述至少一个逻辑模型索引文档的文档标识、文档字段的分词结构信息及评分权重信息,所述分词结构信息包括对应文档字段的字段数据的分词结构,所述评分权重信息包括对应文档字段的评分权重值,所述逻辑模型索引文档中至少一个文档字段的分词结构信息中包含所述检索词,一个逻辑模型索引文档对应一个逻辑模型的索引信息;根据逻辑模型索引文档打分公式及所述评分权重信息,对所述逻辑模型索引文档集合中每一个逻辑模型索引文档进行打分,得到逻辑模型查询结果。在业务用户使用即席查询系统进行即席查询之前,技术人员已经在系统中建立好索引库,索引库中包括至少一个逻辑模型索引文档的文档标识、每个逻辑模型索引文档的文档字段的分词结构信息及评分权重信息,分词结构信息包括对应文档字段的字段数据的分词结构,评分权重信息包括对应文档字段的评分权重值,并且逻辑模型索引文档对应一个逻辑模型的索引信息。当业务用户在用户界面(UI,UserInterface)输入检索词后,获取业务用户输入的检索词,根据检索词查询索引库,如果检索词出现在某个逻辑模型索引文档的一个或多个文档字段的分词结构信息中,就表明该逻辑模型索引文档是符合查询要求的,遍历索引库中所有的逻辑模型索引文档,确定出包括至少一个符合本次查询要求的逻辑模型索引文档的逻辑模型索引文档集合,预先设置好了逻辑模型索引文档打分公式,根据逻辑模型索引文档打分公式和评分权重信息可以实现逻辑模型索引文档集合中每一个逻辑模型索引文档的打分,对查询到的逻辑模型索引文档集合中每一个逻辑模型索引文档进行打分后,得到的逻辑模型查询结果是具有分数值的逻辑模型索引文档,使得逻辑模型索引文档存在多个时,业务用户可以直观的看到每个逻辑模型索引文档及其分数值,由于一个逻辑模型索引文档对应一个逻辑模型的索引信息,那么业务用户根据逻辑模型查询结果中的逻辑模型索引文档的分数值可以快速选择出需求的逻辑模型,与现有技术相比,业务用户可以按照逻辑模型查询结果快速的选择逻辑模型,减少了业务用户识别和选择逻辑模型的工作量和耗时,提高了即席查询的效率。结合本申请第一方面,本申请第一方面第一实施方式中,所述获取业务用户输入的检索词之前,还包括:创建索引文档,设置所述索引文档的文档标识及文档字段的配置信息,所述索引文档包括逻辑模型索引文档和关联关系索引文档,所述逻辑模型索引文档对应一个逻辑模型的索引信息,所述关联关系索引文档对应一个逻辑模型关联关系的索引信息,所述配置信息包括数据来源信息、分词处理信息及评分权重信息,所述数据来源信息对应逻辑模型的逻辑模型信息和逻辑模型字段信息,或所述数据来源信息对应逻辑模型关联关系的关联关系数据,所述评分权重信息表示对应文档字段的评分权重值;根据所述数据来源信息从逻辑模型存储库中获取所述索引文档中文档字段的字段数据;根据所述分词处理信息判断是否对所述字段数据进行文本分词处理;若是,则对所述字段数据进行文本分词处理,得到分词结构信息,将所述分词结构信息与所述文档标识键值对存储至索引库中;若否,则将所述字段数据存储至索引库中。在获取业务用户输入的检索词进行即席查询之前,需要在索引库中先创建索引文档,设置索引文档的文档标识及文档字段的配置信息,索引文档包括逻辑模型索引文档和关联关系索引文档,逻辑模型索引文档对应一个逻辑模型的索引信息,关联关系索引文档对应一个逻辑模型关联关系的索引信息,文档字段的配置信息包括数据来源信息、分词处理信息及评分权重信息,数据来源信息对应逻辑模型的逻辑模型信息和逻辑模型字段信息,或者数据来源信息对应逻辑模型关联关系的关联关系数据,评分权重信息表示对应文档字段的评分权重值,评分权重值的具体数值是按照文档字段的重要程度所预先设置的,如果索引文档的文档字段的数据来源信息对应的是逻辑模型的逻辑模型信息和逻辑模型字段信息,则索引文档为逻辑模型索引文档;如果索引文档的文档字段的数据来源信息对应的是逻辑模型关联关系的关联关系数据,则索引文档为关联关系索引文档。而逻辑模型的逻辑模型信息和逻辑模型字段信息以及逻辑模型关联关系的关联关系数据是存储在逻辑模型存储库中的,那么根据数据来源信息可以从逻辑模型存储库中获取索引文档中文档字段的字段数据,再根据文档字段的分词处理信息判断是否对字段数据进行文本分词处理,如果是,则使用分词器对字段数据进行文本分词处理,得到分词结构信息,并将分词结构信息与文档标识构造为键值对,以键值对存储的方式将分本文档来自技高网
...

【技术保护点】
1.一种即席查询的方法,其特征在于,包括:获取业务用户输入的检索词;根据所述检索词查询索引库,确定逻辑模型索引文档集合,所述逻辑模型索引文档集合包括至少一个逻辑模型索引文档,所述索引库包括所述至少一个逻辑模型索引文档的文档标识、文档字段的分词结构信息及评分权重信息,所述分词结构信息对应所述文档字段的字段数据的分词结构,所述评分权重信息对应所述文档字段的评分权重值,所述逻辑模型索引文档中至少一个文档字段的分词结构信息中包含所述检索词,一个逻辑模型索引文档对应一个逻辑模型的索引信息;根据逻辑模型索引文档打分公式及所述评分权重信息,对所述逻辑模型索引文档集合中每一个逻辑模型索引文档进行打分,得到逻辑模型查询结果。

【技术特征摘要】
1.一种即席查询的方法,其特征在于,包括:获取业务用户输入的检索词;根据所述检索词查询索引库,确定逻辑模型索引文档集合,所述逻辑模型索引文档集合包括至少一个逻辑模型索引文档,所述索引库包括所述至少一个逻辑模型索引文档的文档标识、文档字段的分词结构信息及评分权重信息,所述分词结构信息对应所述文档字段的字段数据的分词结构,所述评分权重信息对应所述文档字段的评分权重值,所述逻辑模型索引文档中至少一个文档字段的分词结构信息中包含所述检索词,一个逻辑模型索引文档对应一个逻辑模型的索引信息;根据逻辑模型索引文档打分公式及所述评分权重信息,对所述逻辑模型索引文档集合中每一个逻辑模型索引文档进行打分,得到逻辑模型查询结果。2.根据权利要求1所述的方法,其特征在于,所述获取业务用户输入的检索词之前,还包括:创建索引文档,设置所述索引文档的文档标识及文档字段的配置信息,所述索引文档包括逻辑模型索引文档和关联关系索引文档,所述逻辑模型索引文档对应一个逻辑模型的索引信息,所述关联关系索引文档对应一个逻辑模型关联关系的索引信息,所述配置信息包括数据来源信息、分词处理信息及评分权重信息,所述数据来源信息对应逻辑模型的逻辑模型信息和逻辑模型字段信息,或所述数据来源信息对应逻辑模型关联关系的关联关系数据,所述评分权重信息表示对应文档字段的评分权重值;根据所述数据来源信息从逻辑模型存储库中获取所述索引文档中文档字段的字段数据;根据所述分词处理信息判断是否对所述字段数据进行文本分词处理;若是,则对所述字段数据进行文本分词处理,得到分词结构信息,将所述分词结构信息与所述文档标识键值对存储至索引库中;若否,则将所述字段数据存储至索引库中。3.根据权利要求2所述的方法,其特征在于,所述根据所述检索词查询索引库,确定逻辑模型索引文档集合,包括:对所述检索词进行分词处理,得到关键词;根据预置查询语句规则和所述关键词生成逻辑模型查询语句,所述逻辑模型查询语句包括预置模型索引查询字段,所述逻辑模型查询语句用于查询逻辑模型索引文档,所述预置模型索引查询字段为所述逻辑模型索引文档的文档字段;根据所述逻辑模型查询语句查询索引库,确定逻辑模型索引文档集合,所述逻辑模型索引文档集合包括至少一个逻辑模型索引文档。4.根据权利要求3所述的方法,其特征在于,当所述关键词的数量大于一个且多个关键词之间为和的关系时,所述方法还包括:根据预置查询语句规则和所述关键词生成关联关系查询语句,所述关联关系查询语句包括预置关联关系索引查询字段,所述关联关系查询语句用于查询关联关系索引文档,所述预置关联关系索引查询字段对应所述关联关系索引文档的源模型字段和目标模型字段;根据所述关联关系查询语句查询索引库,确定关联关系索引文档集合,所述关联关系索引文档集合包括至少一个关联关系索引文档;根据关联关系索引文档打分公式及所述评分权重信息,对所述关联关系索引文档集合中每一个关联关系索引文档进行打分,得到关联关系查询结果。5.根据权利要求4所述的方法,其特征在于,所述根据所述逻辑模型查询语句查询索引库,确定逻辑模型索引文档集合,包括:根据所述逻辑模型查询语句中的预置模型索引查询字段,从索引库的所有逻辑模型索引文档中获取对应所述预置模型索引查询字段的文档字段的分词结构信息;根据所述分词结构信息判断对应的文档字段是否包含所述关键词;若包含,则根据所述分词结构信息确定对应键值对的至少一个文档标识,根据所述至少一个文档标识确定对应的至少一个逻辑模型索引文档,根据所述至少一个逻辑模型索引文档得到逻辑模型索引文档集合;若不包含,则判断所述所有逻辑模型索引文档中对应所述预置模型索引查询字段的其他文档字段的分词结构信息是否包含所述关键词。6.根据权利要求5所述的方法,其特征在于,所述根据逻辑模型索引文档打分公式及所述评分权重信息,对所述逻辑模型索引文档集合中每一个逻辑模型索引文档进行打分,得到逻辑模型查询结果,包括:获取所述逻辑模型索引文档集合中每一个逻辑模型索引文档的所述预置模型索引查询字段对应的文档字段中所述关键词的出现次数;根据所述评分权重信息确定所述逻辑模型索引文档集合中每一个逻辑模型索引文档的每个文档字段的评分权重值;将所述出现次数和所述评分权重值代入逻辑模型索引文档打分公式其中,d表示逻辑模型索引文档,f表示所述逻辑模型索引文档d的文档字段,t表示关键词,tf(tinf)=sqrt(frequency)表示关键词t在文档字段f中的出现次数frequency的平方根,weight(f)表示所述文档字段f的评分权重值,weight(f)*tf(tinf)表示所述关键词t的tf值与所述文档字段f的评分权重值的乘积,Σfindweight(f)*tf(tinf)表示所述关键词在所述逻辑模型索引文档d中的总值,x表示所述逻辑模型索引文档d的使用次数字段,v(x)表示所述逻辑模型索引文档d的使用次数的数字值,score(tind)表示所述逻辑模型索引文档d的分数值;计算得到所述逻辑模型索引文档集合中每一个逻辑模型索引文档的分数值,将所述逻辑模型索引文档集合及所述分数值作为逻辑模型查询结果。7.根据权利要求4所述的方法,其特征在于,所述根据所述关联关系查询语句查询索引库,确定关联关系索引文档集合,包括:根据所述关联关系查询语句中的预置关联关系索引查询字段,从索引库的所有关联关系索引文档中获取对应所述预置关联关系索引查询字段的文档字段的分词结构信息;判断所述分词结构信息中是否包含所述关键词;若包含,则根据所述分词结构信息确定对应键值对的至少一个文档标识,根据所述至少一个文档标识确定对应的至少一个关联关系索引文档,根据所述至少一个关联关系索引文档得到关联关系索引文档集合;若不包含,则判断所述所有关联关系索引文档中对应所述预置关联关系索引查询字段的其他文档字段的分词结构信息是否包含所述关键词。8.根据权利要求7所述的方法,其特征在于,所述根据关联关系索引文档打分公式及所述评分权重信息,对所述关联关系索引文档集合中每一个关联关系索引文档进行打分,得到关联关系查询结果,包括:分别获取所述关联关系索引文档集合中每一个关联关系索引文档的所述预置关联关系索引查询字段对应的源模型字段和目标模型字段中所述关键词的出现次数;根据所述评分权重信息确定所述源模型字段和所述目标模型字段的评分权重值;将所述源模型字段中所述关键词的出现次数、所述目标模型字段中所述关键词的出现次数、所述源模型字段的评分权重值和所述目标模型字段的评分权重值代入关联关系索引文档打分公式score(tind)=weight(y1)*tf(tiny1)+weight(y2)*tf(tiny2)进行计算,其中,y1表示源模型字段,y2表示目标模型字段,weight(y1)表示所述源模型字段y1的评分权重值,weight(y2)表示所述目标模型字段y2的评分权重值,tf(tiny1)=sqrt(frequency1)表示关键词t在源模型字段y1中的出现次数frequency1的平方根,tf(tiny2)=sqrt(frequency2)表示关键词t在源模型字段y2中的出现次数frequency2的平方根,score(tind)表示所述关联关系索引文档d的分数值;得到所述关联关系索引文档集合中每一个关联关系索引文档的分数值,将所述关联关系索引文档集合及所述分数值作为关联关系查询结果。9.根据权利要求2至8中任一项所述的方法,其特征在于,所述创建索引文档,设置所述索引文档的文档标识及文档字段的配置信息之前,还包括:获取数据仓库中的物理表;根据所述物理表创建逻辑模型,并将所述逻辑模型保存至逻辑模型存储库中,所述逻辑模型包括逻辑模型信息和逻辑模型字段信息,所述逻辑模型信息的字段包括逻辑模型标识、物理表名、逻辑模型名、业务描述、使用次数、模型更新时间及数据更新时间,所述逻辑模型字段信息的字段包括物理字段名、逻辑字段名及业务描述;通过频繁集挖掘方式获取逻辑模型关联关系的关联关系数据,并将所述关联关系数据保存至逻辑模型存储库中,所述关联关系数据包括关联关系哈希HASH值、源逻辑模型标识、目标逻辑模型标识及关联路径信息。10.一种即席查询的装置,其特征在于,包括:获取模块,用于获取业务用户输入的检索词;查询模块,用于根据所述检索词查询索引库,确定逻辑模型索引文档集合,所述逻辑模型索引文档集合包括至少一个逻辑模型索引文档,所述索引库包括所述至少一个逻辑模型索引文档的文档标识、文档字段的分词结构信息及评分权重信息,所述分词结构信息对应所述文档字段的字段数据的分词结构的分词结构,所述评分权重信息对应所述文档字段的评分权重值,所述逻辑模型索引文档中至少一个文档字段的分词结构信息中包含所述检索词,一个逻辑模型索引文档对应一个逻辑模型的索引信息;打分模块,用于根据逻辑模型索引文档打分公式及所述评分权重信息,对所述逻辑模型索引文档集合中每一个逻辑模型索引文档进行打分,得到逻辑模型查询结果。11.根据权利要...

【专利技术属性】
技术研发人员:王斌刘衍初
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1