This application provides a method, device and server for impromptu query, which adds a logical model index document and scores the queried logical model index documents, so that the logical model query results that business users see are logical model index documents with score value, thus facilitating the logical model of business users. Recognition and selection improve the efficiency of instant query. The embodiment of the present application includes: obtaining a search term input by a business user; searching an index library for a search term to determine a set of logical model indexed documents, including at least one logical model indexed document, and an index library including a document identification and a document word of at least one logical model indexed document. According to the scoring formula and scoring weight information of logical model index documents, each logical model index document in the logical model index document set is scored, and the logical model query results are obtained.
【技术实现步骤摘要】
一种即席查询的方法、装置及服务器
本申请涉及计算机领域,尤其涉及一种即席查询的方法、装置及服务器。
技术介绍
企业中业务分析人员经常面对各种临时性的数据查询的需求,这些临时性的数据查询的需求特点是:已有的报表中无法满足该查询需求;需要的数据通常来自数据仓库中多张表;分析操作一般比较简单,例如过滤、汇总和排序等。基于这些查询需求,企业在建设数据仓库的时候,通常会提供两套即席查询工具,分别是语义建模工具和查询设计工具。语义建模工具供IT人员使用,IT人员将数据仓库中的物理表建模为逻辑模型,物理表是一系列二维数组的集合,用于代表数据仓库中存储的数据对象。逻辑模型映射到一个或多个物理表,并指定了逻辑模型中的列映射到物理表中列的方式。查询设计工具供业务用户使用,业务用户通过该工具从众多的逻辑模型中挑选一到多个,然后挑选逻辑模型中特定字段来构造查询。一个简单的查询设计工具提供如下功能:逻辑模型查询、逻辑模型关联设置及输出列设置。自助查询的结果为二维数组的结构,有多个输出列,输出列设置提供从逻辑模型中挑选特定字段映射为查询结果列的功能。为满足业务用户灵活的自助查询的需求,IT人员通常会批量开发非常多的逻辑模型,业务用户很难通过一个个浏览的方式获取逻辑模型。为了方便业务用户获取逻辑模型,一种现有的即席查询的方法为:一、IT人员利用语义建模工具将数据仓库中的物理表建模为逻辑模型的时候,保存逻辑模型和逻辑模型字段的信息,并且为“逻辑模型”表和“逻辑模型字段”表分别建立独立的索引;二、基于以上索引,查询设计工具接收业务用户输入的检索词;三、根据检索词构造检索的结构化查询语言(S ...
【技术保护点】
1.一种即席查询的方法,其特征在于,包括:获取业务用户输入的检索词;根据所述检索词查询索引库,确定逻辑模型索引文档集合,所述逻辑模型索引文档集合包括至少一个逻辑模型索引文档,所述索引库包括所述至少一个逻辑模型索引文档的文档标识、文档字段的分词结构信息及评分权重信息,所述分词结构信息对应所述文档字段的字段数据的分词结构,所述评分权重信息对应所述文档字段的评分权重值,所述逻辑模型索引文档中至少一个文档字段的分词结构信息中包含所述检索词,一个逻辑模型索引文档对应一个逻辑模型的索引信息;根据逻辑模型索引文档打分公式及所述评分权重信息,对所述逻辑模型索引文档集合中每一个逻辑模型索引文档进行打分,得到逻辑模型查询结果。
【技术特征摘要】
1.一种即席查询的方法,其特征在于,包括:获取业务用户输入的检索词;根据所述检索词查询索引库,确定逻辑模型索引文档集合,所述逻辑模型索引文档集合包括至少一个逻辑模型索引文档,所述索引库包括所述至少一个逻辑模型索引文档的文档标识、文档字段的分词结构信息及评分权重信息,所述分词结构信息对应所述文档字段的字段数据的分词结构,所述评分权重信息对应所述文档字段的评分权重值,所述逻辑模型索引文档中至少一个文档字段的分词结构信息中包含所述检索词,一个逻辑模型索引文档对应一个逻辑模型的索引信息;根据逻辑模型索引文档打分公式及所述评分权重信息,对所述逻辑模型索引文档集合中每一个逻辑模型索引文档进行打分,得到逻辑模型查询结果。2.根据权利要求1所述的方法,其特征在于,所述获取业务用户输入的检索词之前,还包括:创建索引文档,设置所述索引文档的文档标识及文档字段的配置信息,所述索引文档包括逻辑模型索引文档和关联关系索引文档,所述逻辑模型索引文档对应一个逻辑模型的索引信息,所述关联关系索引文档对应一个逻辑模型关联关系的索引信息,所述配置信息包括数据来源信息、分词处理信息及评分权重信息,所述数据来源信息对应逻辑模型的逻辑模型信息和逻辑模型字段信息,或所述数据来源信息对应逻辑模型关联关系的关联关系数据,所述评分权重信息表示对应文档字段的评分权重值;根据所述数据来源信息从逻辑模型存储库中获取所述索引文档中文档字段的字段数据;根据所述分词处理信息判断是否对所述字段数据进行文本分词处理;若是,则对所述字段数据进行文本分词处理,得到分词结构信息,将所述分词结构信息与所述文档标识键值对存储至索引库中;若否,则将所述字段数据存储至索引库中。3.根据权利要求2所述的方法,其特征在于,所述根据所述检索词查询索引库,确定逻辑模型索引文档集合,包括:对所述检索词进行分词处理,得到关键词;根据预置查询语句规则和所述关键词生成逻辑模型查询语句,所述逻辑模型查询语句包括预置模型索引查询字段,所述逻辑模型查询语句用于查询逻辑模型索引文档,所述预置模型索引查询字段为所述逻辑模型索引文档的文档字段;根据所述逻辑模型查询语句查询索引库,确定逻辑模型索引文档集合,所述逻辑模型索引文档集合包括至少一个逻辑模型索引文档。4.根据权利要求3所述的方法,其特征在于,当所述关键词的数量大于一个且多个关键词之间为和的关系时,所述方法还包括:根据预置查询语句规则和所述关键词生成关联关系查询语句,所述关联关系查询语句包括预置关联关系索引查询字段,所述关联关系查询语句用于查询关联关系索引文档,所述预置关联关系索引查询字段对应所述关联关系索引文档的源模型字段和目标模型字段;根据所述关联关系查询语句查询索引库,确定关联关系索引文档集合,所述关联关系索引文档集合包括至少一个关联关系索引文档;根据关联关系索引文档打分公式及所述评分权重信息,对所述关联关系索引文档集合中每一个关联关系索引文档进行打分,得到关联关系查询结果。5.根据权利要求4所述的方法,其特征在于,所述根据所述逻辑模型查询语句查询索引库,确定逻辑模型索引文档集合,包括:根据所述逻辑模型查询语句中的预置模型索引查询字段,从索引库的所有逻辑模型索引文档中获取对应所述预置模型索引查询字段的文档字段的分词结构信息;根据所述分词结构信息判断对应的文档字段是否包含所述关键词;若包含,则根据所述分词结构信息确定对应键值对的至少一个文档标识,根据所述至少一个文档标识确定对应的至少一个逻辑模型索引文档,根据所述至少一个逻辑模型索引文档得到逻辑模型索引文档集合;若不包含,则判断所述所有逻辑模型索引文档中对应所述预置模型索引查询字段的其他文档字段的分词结构信息是否包含所述关键词。6.根据权利要求5所述的方法,其特征在于,所述根据逻辑模型索引文档打分公式及所述评分权重信息,对所述逻辑模型索引文档集合中每一个逻辑模型索引文档进行打分,得到逻辑模型查询结果,包括:获取所述逻辑模型索引文档集合中每一个逻辑模型索引文档的所述预置模型索引查询字段对应的文档字段中所述关键词的出现次数;根据所述评分权重信息确定所述逻辑模型索引文档集合中每一个逻辑模型索引文档的每个文档字段的评分权重值;将所述出现次数和所述评分权重值代入逻辑模型索引文档打分公式其中,d表示逻辑模型索引文档,f表示所述逻辑模型索引文档d的文档字段,t表示关键词,tf(tinf)=sqrt(frequency)表示关键词t在文档字段f中的出现次数frequency的平方根,weight(f)表示所述文档字段f的评分权重值,weight(f)*tf(tinf)表示所述关键词t的tf值与所述文档字段f的评分权重值的乘积,Σfindweight(f)*tf(tinf)表示所述关键词在所述逻辑模型索引文档d中的总值,x表示所述逻辑模型索引文档d的使用次数字段,v(x)表示所述逻辑模型索引文档d的使用次数的数字值,score(tind)表示所述逻辑模型索引文档d的分数值;计算得到所述逻辑模型索引文档集合中每一个逻辑模型索引文档的分数值,将所述逻辑模型索引文档集合及所述分数值作为逻辑模型查询结果。7.根据权利要求4所述的方法,其特征在于,所述根据所述关联关系查询语句查询索引库,确定关联关系索引文档集合,包括:根据所述关联关系查询语句中的预置关联关系索引查询字段,从索引库的所有关联关系索引文档中获取对应所述预置关联关系索引查询字段的文档字段的分词结构信息;判断所述分词结构信息中是否包含所述关键词;若包含,则根据所述分词结构信息确定对应键值对的至少一个文档标识,根据所述至少一个文档标识确定对应的至少一个关联关系索引文档,根据所述至少一个关联关系索引文档得到关联关系索引文档集合;若不包含,则判断所述所有关联关系索引文档中对应所述预置关联关系索引查询字段的其他文档字段的分词结构信息是否包含所述关键词。8.根据权利要求7所述的方法,其特征在于,所述根据关联关系索引文档打分公式及所述评分权重信息,对所述关联关系索引文档集合中每一个关联关系索引文档进行打分,得到关联关系查询结果,包括:分别获取所述关联关系索引文档集合中每一个关联关系索引文档的所述预置关联关系索引查询字段对应的源模型字段和目标模型字段中所述关键词的出现次数;根据所述评分权重信息确定所述源模型字段和所述目标模型字段的评分权重值;将所述源模型字段中所述关键词的出现次数、所述目标模型字段中所述关键词的出现次数、所述源模型字段的评分权重值和所述目标模型字段的评分权重值代入关联关系索引文档打分公式score(tind)=weight(y1)*tf(tiny1)+weight(y2)*tf(tiny2)进行计算,其中,y1表示源模型字段,y2表示目标模型字段,weight(y1)表示所述源模型字段y1的评分权重值,weight(y2)表示所述目标模型字段y2的评分权重值,tf(tiny1)=sqrt(frequency1)表示关键词t在源模型字段y1中的出现次数frequency1的平方根,tf(tiny2)=sqrt(frequency2)表示关键词t在源模型字段y2中的出现次数frequency2的平方根,score(tind)表示所述关联关系索引文档d的分数值;得到所述关联关系索引文档集合中每一个关联关系索引文档的分数值,将所述关联关系索引文档集合及所述分数值作为关联关系查询结果。9.根据权利要求2至8中任一项所述的方法,其特征在于,所述创建索引文档,设置所述索引文档的文档标识及文档字段的配置信息之前,还包括:获取数据仓库中的物理表;根据所述物理表创建逻辑模型,并将所述逻辑模型保存至逻辑模型存储库中,所述逻辑模型包括逻辑模型信息和逻辑模型字段信息,所述逻辑模型信息的字段包括逻辑模型标识、物理表名、逻辑模型名、业务描述、使用次数、模型更新时间及数据更新时间,所述逻辑模型字段信息的字段包括物理字段名、逻辑字段名及业务描述;通过频繁集挖掘方式获取逻辑模型关联关系的关联关系数据,并将所述关联关系数据保存至逻辑模型存储库中,所述关联关系数据包括关联关系哈希HASH值、源逻辑模型标识、目标逻辑模型标识及关联路径信息。10.一种即席查询的装置,其特征在于,包括:获取模块,用于获取业务用户输入的检索词;查询模块,用于根据所述检索词查询索引库,确定逻辑模型索引文档集合,所述逻辑模型索引文档集合包括至少一个逻辑模型索引文档,所述索引库包括所述至少一个逻辑模型索引文档的文档标识、文档字段的分词结构信息及评分权重信息,所述分词结构信息对应所述文档字段的字段数据的分词结构的分词结构,所述评分权重信息对应所述文档字段的评分权重值,所述逻辑模型索引文档中至少一个文档字段的分词结构信息中包含所述检索词,一个逻辑模型索引文档对应一个逻辑模型的索引信息;打分模块,用于根据逻辑模型索引文档打分公式及所述评分权重信息,对所述逻辑模型索引文档集合中每一个逻辑模型索引文档进行打分,得到逻辑模型查询结果。11.根据权利要...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。