统计方法及装置制造方法及图纸

技术编号:12137542 阅读:95 留言:0更新日期:2015-10-01 15:40
本申请提供一种统计方法及装置。本申请实施例通过获取统计信息,所述统计信息中包括过滤条件、统计字段和至少两个分组字段,进而根据所述统计信息,获得目标对象的统计字段的值和至少两个分组字段的值,以及根据所述至少两个分组字段的值,获得所述每个目标对象的组合字段的值,使得能够根据每个组合字段的值,对所述每个目标对象的统计字段的值进行统计操作,以获得所述每个组合字段的值所对应的统计值,实现了对多个指定域的组合进行统计操作,从而提高了SOLR的统计灵活性。

【技术实现步骤摘要】
【专利说明】统计方法及装置
本申请涉及统计技术,尤其涉及一种统计方法及装置。 【
技术介绍
】 S0LR是一个开源的搜索引擎,不仅提供了比Lucene更好的全文搜索服务,还可W 作为海量数据的统计工具。S0LR的底层数据结构,仍然是Lucene的列式文件存储,各个列 值在文件中是W数组或链表的形式存在。S0LR的统计组件(StatsComponent)可W分别对 该些文件的多个指定域即分组,进行统计操作。 然而,S0LR的统计组件只能对每个指定域单独的进行统计操作,无法对多个指定 域的组合进行统计操作,从而导致了S0LR的统计灵活性的降低。 【
技术实现思路
】 本申请的多个方面提供一种统计方法及装置,用W提高S0LR的统计灵活性。 本申请的一方面,提供一种统计方法,应用于S0LR中,包括: 获取统计信息,所述统计信息中包括过滤条件、统计字段和至少两个分组字段; 根据所述统计信息,获得目标对象的统计字段的值和至少两个分组字段的值; 根据所述至少两个分组字段的值,获得所述每个目标对象的组合字段的值; 根据每个组合字段的值,对所述每个目标对象的统计字段的值进行统计操作,W 获得所述每个组合字段的值所对应的统计值。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所 述统计信息,获得目标对象的统计字段的值和至少两个分组字段的值,包括: 根据所述过滤条件,执行查询流程,W获得所述目标对象;其中,所述查询流程包 括过滤操作; 根据所述统计字段和所述至少两个分组字段,获得所述目标对象的统计字段的值 和至少两个分组字段的值。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述查询流 程还包括评分操作和排序操作。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述统计信 息中还包括所述统计操作的操作标识;所述根据每个组合字段的值,对所述每个目标对象 的统计字段的值进行统计操作,W获得所述每个组合字段的值所对应的统计值,包括: 根据每个组合字段的值和所述操作标识,对所述每个目标对象的统计字段的值进 行所述统计操作,W获得所述每个组合字段的值所对应的统计值。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据每 个组合字段的值,对所述每个目标对象的统计字段的值进行统计操作,W获得所述每个组 合字段的值所对应的统计值之后,还包括: 根据所述每个组合字段的值,获得所述至少两个分组字段的值。[001引如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据每 个组合字段的值,对所述每个目标对象的统计字段的值进行统计操作,W获得所述每个组 合字段的值所对应的统计值之后,还包括: 对每个统计值进行所述统计操作,获得统计汇总值。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据每 个组合字段的值,对所述每个目标对象的统计字段的值进行统计操作,W获得所述每个组 合字段的值所对应的统计值之后,还包括: 将所述统计信息、所述每个组合字段的值、W及所述每个组合字段的值所对应的 统计值,存储在缓存中。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式, 所述获取统计信息,所述统计信息中包括过滤条件、统计字段和至少两个分组字 段之后,还包括: 根据所述统计信息,在所述缓存中进行查找,W获得所存储的所述每个组合字段 的值、W及所述每个组合字段的值所对应的统计值; 所述根据所述统计信息,获得目标对象的统计字段的值和至少两个分组字段的 值,包括: 若没有获得所述缓存中所存储的所述每个组合字段的值、W及所述每个组合字段 的值所对应的统计值,根据所述统计信息,获得目标对象的统计字段的值和至少两个分组 字段的值。 本申请的一方面,提供一种统计装置,应用于S0LR中,包括: 获取单元,用于获取统计信息,所述统计信息中包括过滤条件、统计字段和至少两 个分组字段; 维度分析单元,用于根据所述统计信息,获得目标对象的统计字段的值和至少两 个分组字段的值; 维度变换单元,用于根据所述至少两个分组字段的值,获得所述每个目标对象的 组合字段的值; 统计单元,用于根据每个组合字段的值,对所述每个目标对象的统计字段的值进 行统计操作,W获得所述每个组合字段的值所对应的统计值。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述维度分 析单元,具体用于 根据所述过滤条件,执行查询流程,W获得所述目标对象;其中,所述查询流程包 括过滤操作;W及 根据所述统计字段和所述至少两个分组字段,获得所述目标对象的统计字段的值 和至少两个分组字段的值。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述查询流 程还包括评分操作和排序操作。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述统计信 息中还包括所述统计操作的操作标识;所述统计单元,具体用于 根据每个组合字段的值和所述操作标识,对所述每个目标对象的统计字段的值进 行所述统计操作,w获得所述每个组合字段的值所对应的统计值。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述维度变 换单元,还用于 根据所述每个组合字段的值,获得所述至少两个分组字段的值。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述统计单 元,还用于 对每个统计值进行所述统计操作,获得统计汇总值。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还 包括缓存单元,用于 将所述统计信息、所述每个组合字段的值、W及所述每个组合字段的值所对应的 统计值,存储在缓存中。 如上所述的方面和任一可能的实现方式,进一步提供一种实现方式, 所述获取单元,还用于 根据所述统计信息,在所述缓存中进行查找,W获得所存储的所述每个组合字段 的值、W及所述每个组合字段的值所对应的统计值; 所述维度分析单元,具体用于 若所述获取单元没有获得所述缓存中所存储的所述每个组合字段的值、W及所述 每个组合字段的值所对应的统计值,根据所述统计信息,获得目标对象的统计字段的值和 至少两个分组字段的值。 由上述技术方案可知,本申请实施例通过获取统计信息,所述统计信息中包括过 滤条件、统计字段和至少两个分组字段,进而根据所述统计信息,获得目标对象的统计字段 的值和至少两个分组字段的值,W及根据所述至少两个分组字段的值,获得所述每个目标 对象的组合字段的值,使得能够根据每个组合字段的值,对所述每个目标对象的统计字段 的值进行统计操作,W获得所述每个组合字段的值所对应的统计值,实现了对多个指定域 的组合进行统计操作,从而提高了 S0LR的统计灵活性。另外,采用本申请提供的技术方案,由于简化了查询流程中所包括的操作,即查询 操作中只包括过滤操作,而不包括评分操作和排序操作,因此,能够有效提供S0LR的统计 效率,降低S0LR的统计性能消耗。另外,采用本申请提供的技术方案,由于直接对每个组合字段的值所对应的统计 值进行统计操作,获得本次统计的统计汇总值,而不再反复对每个目标对象的统计字段的 值执行统计操作,获得本次统计的统计汇总值,因此,能够有效提供S0LR的统计效率,降低 S0LR的统计性能本文档来自技高网...

【技术保护点】
一种统计方法,应用于SOLR中,其特征在于,包括:获取统计信息,所述统计信息中包括过滤条件、统计字段和至少两个分组字段;根据所述统计信息,获得目标对象的统计字段的值和至少两个分组字段的值;根据所述至少两个分组字段的值,获得所述每个目标对象的组合字段的值;根据每个组合字段的值,对所述每个目标对象的统计字段的值进行统计操作,以获得所述每个组合字段的值所对应的统计值。

【技术特征摘要】

【专利技术属性】
技术研发人员:熊水林
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1