一种预编译函数缓存引擎的大数据处理方法技术

技术编号：21115349 阅读：22 留言：0更新日期：2019-05-16 08:52

本发明专利技术实施例公开了一种预编译函数缓存引擎的大数据处理方法，所述方法包括：引擎缓存大小及优化策略设置；根据用户需求生成表达式树；遍历所述表达式树，生成该表达式树的特征字符串，同时提取常量节点数据并缓存；生成所述特征字符串的唯一值；根据所述唯一值查找缓存中是否存储有预编译的即时编译函数；若不存在，则生成即时编译函数并缓存；将所述常量节点数据代入所述即时编译函数进行处理，在高并发单点查询的场景下对海量数据处理的延迟时间在毫秒级别，大大加快了大数据处理速度，有效的利用了CPU和内存资源，减轻了分布式OLAP或OLTP数据库的查询负载，满足高性能大数据处理需求。

A Large Data Processing Method for Pre-compiled Function Caching Engine

全部详细技术资料下载

【技术实现步骤摘要】
一种预编译函数缓存引擎的大数据处理方法
本专利技术实施例涉及计算机算法
，具体涉及一种预编译函数缓存引擎的大数据处理方法。
技术介绍
云计算大数据时代，随着企业业务日益增加与复杂，产生的数据量也越来越庞大，如何在海量数据高并发场景下快速检索出想要的数据，对分布式数据库也有了更高的需求。某些用户的业务场景是海量数据，当碰到相同表达式，只是常量不同情况下如何能够获取更高的性能，例如银行用户查帐期，输出条件都相同，但只换用户号码，在传统的数据库软件每一次都会下发相同SQL(结构化查询语言)，并且每次都会重复进行，存储资源、内存资源、计算资源等的调度，导致资源重复申请与释放，造成查询时间瓶颈。目前比较流行的分布式大数据，高性能的计算框架有如下:(1)基于Hadoop的MapReduce并行计算框架。MapReduce作业可以将数据集分割为Map(映射)函数并行处理的数据块，框架对Map过程产生的数据进行排序，然后作为reduce(归约)函数的数据输入，通常作业的的输出和输入数据保存在一个分布式文件系统(HDFS)。(2)基于LLVM(底层虚拟机即时编译技术，LowLevelVirtualMachineJust-in-timecompilation)的高性能内存计算框架。根据用户的需求生成表达式树，根据表达式树生成即时编译函数，即时编译函数只包含了和本次处理工作有关的指令，大大减少了指令的数量来提高性能。而现有的计算模型存在以下缺点：MR(MapReduce)计算模型会把任务的中间结果都落到HDFS上面，然后在从HDFS上面把数据读取出来再进行运算，所以其时延...

【技术保护点】
1.一种预编译函数缓存引擎的大数据处理方法，其特征在于，所述方法包括：引擎缓存大小及优化策略设置；根据用户需求生成表达式树；遍历所述表达式树，生成该表达式树的特征字符串，同时提取常量节点数据并缓存；生成所述特征字符串的唯一值；根据所述唯一值查找缓存中是否存储有预编译的即时编译函数；若不存在，则生成即时编译函数并缓存；将所述常量节点数据代入所述即时编译函数进行处理。

【技术特征摘要】
1.一种预编译函数缓存引擎的大数据处理方法，其特征在于，所述方法包括：引擎缓存大小及优化策略设置；根据用户需求生成表达式树；遍历所述表达式树，生成该表达式树的特征字符串，同时提取常量节点数据并缓存；生成所述特征字符串的唯一值；根据所述唯一值查找缓存中是否存储有预编译的即时编译函数；若不存在，则生成即时编译函数并缓存；将所述常量节点数据代入所述即时编译函数进行处理。2.根据权利要求1所述的一种预编译函数缓存引擎的大数据处理方法，其特征在于，所述引擎缓存大小及优化策略设置包括：预设缓存大小以及将缓存进行分桶。3.根据权利要求2所述的一种预编译函数缓存引擎的大数据处理方法，其特征在于，所述将缓存进行分桶包括：根据用户配置文件预设桶的个数；或者，根据历史数据统计信息直方图中即时编译函数指针的个数预估每个即时编译函数指针所需要的内存FM，根据BucketNum＝M/FM计算出桶的个数，其中，BucketNum为桶的个数，M为缓存的预设大小。4.根据权利要求1所述的一种预编译函数缓存引擎的大数据处理方法，其特征在于，所述生成该表达式树的特征字符串包括：获取所述表达式树的属性信息，将所述属性信息合并生成该表达式树的特征字符串，其中，所述属性信息包括数据类型、数据列宽或者数据索引信息。5.根据权利要求1所述的一种预编译函数缓存引擎的大数据处理方法，其特征在于，所述提取常量节点数据并缓存包括：建立所述常量节点数据的索引，根据所述索引划分缓存空间，并将所述常量节点数据分别存储到与索引对应的缓存空间内。6...

【专利技术属性】
技术研发人员：周伟，余佳阳，季桃桃，周群年，金正皓，
申请(专利权)人：北京东方国信科技股份有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人