一种查询语句公共部分的提取方法及装置制造方法及图纸

技术编号：11200970 阅读：96 留言：0更新日期：2015-03-26 08:32

一种查询语句公共部分的提取方法及装置；所述方法包括：将查询语句划分为一个或多个查询层次，一个查询层次为进行一次查询操作的查询子句；分别根据各所述查询层次中查询对象的过滤特征和流向特征抽象出各所述查询层次的特征向量；采用预定算法分别对各所述查询层次的所述特征向量进行计算，得到各所述查询层次的特征值；统计各所述特征值的重复次数，选取重复次数符合预定条件的所述特征值作为公共部分。本申请能给有效检测不定时增长的海量查询语句中的公共部分。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】一种查询语句公共部分的提取方法及装置；所述方法包括：将查询语句划分为一个或多个查询层次，一个查询层次为进行一次查询操作的查询子句；分别根据各所述查询层次中查询对象的过滤特征和流向特征抽象出各所述查询层次的特征向量；采用预定算法分别对各所述查询层次的所述特征向量进行计算，得到各所述查询层次的特征值；统计各所述特征值的重复次数，选取重复次数符合预定条件的所述特征值作为公共部分。本申请能给有效检测不定时增长的海量查询语句中的公共部分。【专利说明】一种查询语句公共部分的提取方法及装置
本专利技术涉及网络领域，尤其涉及一种查询语句公共部分的提取方法及装置。
技术介绍
近年来由于互联网、云计算、移动和物联网的迅猛发展，大数据技术（Big Data)逐渐成为学术界和工业界共同关注的研究热点。几乎无所不在的移动设备、RFID、无线传感器等每分每秒都在产生数据，而数以亿计的互联网服务也时时刻刻在产生巨量的交互信息。因之而生的业务需求和竞争压力对数据处理的实时性、有效性提出了更高的要求。当今越来越多的互联网公司采用大集群来进行海量数据分析。这些任务通常被写成类SQL (Structured Query Language,结构化查询语言)的语句，并通过类Hive (-种数据仓库工具）的数据分析工具翻译为MapReduce (-种编程模型）作业，最终被分布式集群处理和执行。由于业务需要，诸多公司通常维护一批数量巨大、结构复杂、运行耗时的类SQL 查询语句来完成大数据分析任务从而生成例行报表。这个集合是参数化（paramet...
一种查询语句公共部分的提取方法及装置

【技术保护点】
一种查询语句公共部分的提取方法，包括：将查询语句划分为一个或多个查询层次，一个查询层次为进行一次查询操作的查询子句；分别根据各所述查询层次中查询对象的过滤特征和流向特征抽象出各所述查询层次的特征向量；采用预定算法分别对各所述查询层次的所述特征向量进行计算，得到各所述查询层次的特征值；统计各所述特征值的重复次数，选取重复次数符合预定条件的所述特征值作为公共部分。

【技术特征摘要】

【专利技术属性】
技术研发人员：葛星，徐常亮，傅跃兵，姚斌，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人