一种SparkSQL应用程序的自动化测试方法和装置制造方法及图纸

技术编号：20622178 阅读：33 留言：0更新日期：2019-03-20 14:15

一种SparkSQL应用程序的自动化测试装置涉及信息技术领域，尤其是大数据应用领域。本发明专利技术由测试环境、Jmockit、sqlList记录器、数量对比器、语句对比器组成；测试环境由maven工程配置器、jar包导入器、HDFS环境变量设置器、大数据组件引入器组成；实现本发明专利技术降低了测试难度不需要构造复杂的测试数据，根据SparkSQL应用程序的特点，将对比预期结果数据，转换为对比预期sql语句，降低了测试难度和测试效率；提高了测试效率从第二轮开始的迭代测试可以通过sql语句回放来自动验证程序的正确性，极大的提高了测试效率；提高了测试覆盖率第一轮的代码走读和sql查看可以覆盖整个业务逻辑，后期迭代测试根据sql语句回放，可以准确找到程序业务逻辑更改的地方，保证回归测试的覆盖率。

An Automated Test Method and Device for SparkSQL Applications

全部详细技术资料下载

【技术实现步骤摘要】
一种SparkSQL应用程序的自动化测试方法和装置
本专利技术涉及信息

技术介绍
Spark作为Hadoop生态系统中的分布式计算框架之一，以其计算速度快、功能丰富的特点，成为了大数据应用程序开发的主流框架。其中SparkSQL作为Spark的结构化数据处理模块，更是应用广泛。SparkSQL应用程序的主要特点是通过SQL的执行，实现海量数据分析处理的功能，极大的简化了大数据业务处理程序的编码难度。传统针对SparkSQL应用程序的测试方法主要是黑盒测试。测试人员只能根据需求文档和从程序员口中了解到的功能实现情况说明，构造测试数据，在大数据集群环境中执行待测程序，对程序执行结果进行判断。这种方式存在以下问题：（1）测试难度大。一般在实现大数据业务处理功能的SparkSQL应用程序中，涉及的sql、表的数量都是巨大且复杂的，这就导致测试数据的构造难度比较大，预期结果也很难准确的给出了；（2）测试效率低。在迭代测试当中，由于在每轮测试当中都需要构造大量复杂的测试数据并进行结果校验，每轮的测试周期都会很长；（3）测试覆盖率低。因为对程序内部的业务逻辑和业务sql不了解，构造的测试数据很难覆盖所有测试点。针对现有技术的不足，本专利技术基于sql语句回放，实现SparkSQL应用程序的自动化测试，解决了传统黑盒测试方法测试难度大、效率低、覆盖率低的问题。共有技术：Mock方法是单元测试中常见的一种技术，它的主要作用是模拟一些在应用中不容易构造或者比较复杂的对象，从而把测试与测试边界以外的对象隔离开。mock对象有助于从测试中消除依赖项，使测试更单元化。JM...

【技术保护点】
1.一种SparkSQL应用程序的自动化测试装置，其特征在于由测试环境、Jmockit、sqlList记录器、数量对比器、语句对比器组成；测试环境由maven工程配置器、jar包导入器、HDFS环境变量设置器、大数据组件引入器组成；实现一种SparkSQL应用程序的自动化测试装置的主要步骤包括：1)部署测试环境①由maven工程配置器读取被测应用程序，并判断被测应用程序所需的测试环境的配置类型；②当被测应用程序存在jar包时，通过jar包导入器完成测试环境配置，jar包导入器通过pom.xml的依赖包引入；③当被测应用程序运行于HDFS分布式文件系统时，通过HDFS环境变量设置器完成测试环境配置，HDFS环境变量设置器自动从hadoop官网下载与被测应用程序版本一致的hadoop包，并根据本机的操作系统类型设置hadoop.home.dir属性；④当被测应用程序运行于Spark和Hive的大数据环境时，通过大数据组件引入器完成测试环境配置，大数据组件引入器通过添加pom.xml依赖包来完成测试环境配置；2)对SparkSession.sql(String sqlText)模拟①使用单元...

【技术特征摘要】
1.一种SparkSQL应用程序的自动化测试装置，其特征在于由测试环境、Jmockit、sqlList记录器、数量对比器、语句对比器组成；测试环境由maven工程配置器、jar包导入器、HDFS环境变量设置器、大数据组件引入器组成；实现一种SparkSQL应用程序的自动化测试装置的主要步骤包括：1)部署测试环境①由maven工程配置器读取被测应用程序，并判断被测应用程序所需的测试环境的配置类型；②当被测应用程序存在jar包时，通过jar包导入器完成测试环境配置，jar包导入器通过pom.xml的依赖包引入；③当被测应用程序运行于HDFS分布式文件系统时，通过HDFS环境变量设置器完成测试环境配置，HDFS环境变量设置器自动从hadoop官网下载与被测应用程序版本一致的hadoop包，并根据本机的操作系统类型设置hadoop.home.dir属性；④当被测应用程序运行于Spark和Hive的大数据环境时，通过大数据组件引入器完成测试环境配置，大数据组件引入器通过添加pom.xml依赖包来完成测试环境配置；2)对SparkSession.sql(StringsqlText)模拟①使用单元测试当中的Mock工具Jmockit，对SparkSQLAPI中执行sql语句的方法SparkSession.sql(StringsqlText)进行模拟，使SparkSQL在被测应用程序内部调用SparkSession.sql(StringsqlText)执行sql的同时，返回执行的具体sql语句；②使用sqlList记录器接收并保存被测应用程序执行的sql语句，sqlLi...

【专利技术属性】
技术研发人员：王娜，廖艳云，林飞，古元，毛华阳，华仲锋，
申请(专利权)人：北京亚鸿世纪科技发展有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人