【技术实现步骤摘要】
优先权信息本专利申请要求于2014年11月14日提交的编号为3600/MUM/2014的印度专利申请的优先权。
本文中所描述的本公开总体涉及一种数据库管理系统,并且更具体地,涉及用于预测要在成品数据库中执行的查询的消逝响应时间(elapsed response time)的数据库管理系统。
技术介绍
由于大量数据,大数据范式已经引发了应用程序的具有影响力的性能。应用程序的性能已经基于各种参数被评估。便于评估性能的一个关键参数是查询的响应时间。对于结构化数据库应用程序而言,查询的响应时间是针对部署在成品数据库中的大量数据的子集而测试的。普遍认为,有时这样的数据库应用程序中的响应时间可能会随数据量在一定时间内的增加而非线性地增加。响应时间的非线性增加可能反过来会导致对提供给应用程序的用户的性能保证构成侵害。响应时间的该非线性增加是因为被用于测试查询的常规测试技术而产生。常规测试技术包括对大量数据的子集的查询进行测试。因此,为了使用常规测试技术来评估性能,应用程序可能需要各种资源,诸如能够存储数万亿条记录的存储服务器。但是用于评估性能的这种资源部署可能会
导致产生巨大成本。此外,即使资源被布置,针对大量数据的查询的测试可能增加评估时间,且因此延迟应用程序的部署。为了克服上述的缺陷,已经在本领域提出了基于各种统计机器学习的模型,其使用过去的查询创建学习基础,且然后基于最邻近方法预测查询的响应时间。但这样的模型不能随数据量在一定时间内的线性增加而精确预测查询的响应时间。
技术实现思路
在描述本专利技术的系统和方法之前,应理解,本申请不限于所描述的特定系统 ...
【技术保护点】
一种用于预测要在成品数据库中执行的查询的消逝响应时间(ERT)的方法,所述方法包括:由处理器基于通过从开发环境外推统计信息导出的空模式在所述开发环境中创建对应于成品数据库的模拟数据库;由所述处理器基于所述模拟数据库生成所述查询的查询执行计划,其中所述查询执行计划表示要在成品数据库中执行的所述查询的一个或多个子查询,并且其中每个子查询与运算参数相关联;由所述处理器基于所述运算参数将每个子查询分类为至少一种类型的扫描;由所述处理器在存在于所述开发环境中的测试数据库上执行每个子查询以确定对应于每个子查询的输入输出(IO)访问时间,和对应于每个子查询的运算时间,其中所述输入输出访问时间基于所述分类而预测,并且其中所述运算时间基于存在于每个子查询中的一个或多个运算符而预测;以及由所述处理器基于所述输入输出访问时间、所述运算时间和网络时间预测要在所述成品数据库中执行的所述查询的所述消逝响应时间,其中所述网络时间表示通过网络发送在执行每个子查询时检索的数据所需要的时间。
【技术特征摘要】
2014.11.14 IN 3600/MUM/20141.一种用于预测要在成品数据库中执行的查询的消逝响应时间(ERT)的方法,所述方法包括:由处理器基于通过从开发环境外推统计信息导出的空模式在所述开发环境中创建对应于成品数据库的模拟数据库;由所述处理器基于所述模拟数据库生成所述查询的查询执行计划,其中所述查询执行计划表示要在成品数据库中执行的所述查询的一个或多个子查询,并且其中每个子查询与运算参数相关联;由所述处理器基于所述运算参数将每个子查询分类为至少一种类型的扫描;由所述处理器在存在于所述开发环境中的测试数据库上执行每个子查询以确定对应于每个子查询的输入输出(IO)访问时间,和对应于每个子查询的运算时间,其中所述输入输出访问时间基于所述分类而预测,并且其中所述运算时间基于存在于每个子查询中的一个或多个运算符而预测;以及由所述处理器基于所述输入输出访问时间、所述运算时间和网络时间预测要在所述成品数据库中执行的所述查询的所述消逝响应时间,其中所述网络时间表示通过网络发送在执行每个子查询时检索的数据所需要的时间。2.根据权利要求1所述的方法,其中所述统计信息包括表、块、索引块和数据值。3.根据权利要求1所述的方法,其中所述运算参数包括表、访问模式、基数、输出大小、成本,和输入输出成本。4.根据权利要求1所述的方法,其中所述一个或多个运算符包括合计、哈希、嵌套、排序、合并及哈希。5.根据权利要求1所述的方法,所述扫描类型包括全表扫描、主索引扫描、快速索引扫描和非唯一索引扫描。6.根据权利要求1所述的方法,其还包括限定用于在生产环境中执行的所述查询的性能基准值,其中所述性能基准值基于所述消逝响应时间、所述预测的子查询执行时间、输入输出成本、逻辑读取、物理读取、基数和输出大小而限定。7.根据权利要求1所述的方法,其中所述消逝响应时间通过以下步骤而预测:合计对应于每个子查询的所述输入输出访问时间和对应于每个子查询的所述运算时间以确定预测的子查询执行时间;以及合计所述预测的子查询执行时间和所述网络时间以确定所述消逝响应时间。8.一种用于预测要在成品数据库中执行的查询的消逝响应时间(ERT)的系统,所述系统包括:处理器;和存储器,耦接到所述处理器,其中所述处理器执行存储在所述存储器中的多个模块,并且其中所述多个模块包括:db模拟器模块,用于基于通过从开发环境外推统计信息导出的空模式在所述开发环境中创建对应于成品数据库的模拟数据库;执行计划生成模块,用于基于所述模...
【专利技术属性】
技术研发人员:列哈·辛哈尔,
申请(专利权)人:塔塔顾问服务有限公司,
类型:发明
国别省市:印度;IN
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。