确定涉及大数据分析的随机性应用的正确性的方法和系统技术方案

技术编号：10416974 阅读：139 留言：0更新日期：2014-09-12 09:50

本发明专利技术提供一种确定应用正确性的方法，包括：获取用于所述应用的数据集和参考运行结果；基于所述数据集在所述应用上的实际运行结果与所述参考运行结果的比较，确定所述应用的正确性。通过该方法，使得QA人员能够连接到标准任务工具库，从而采用数据驱动的测试方法作为对现有质量保证架构的补充。

全部详细技术资料下载

【技术实现步骤摘要】
用于确定应用正确性的方法和系统
本专利技术的实施方式一般地涉及质量保证领域，更具体地，涉及一种用于确定应用的正确性的方法和系统。
技术介绍
数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discovery inDatabase, KDD)，是目前人工智能和数据库领域研究的热点问题，所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。随着数据挖掘技术的不断发展，涉及大数据分析(Big Data Analytics)的各种应用不断浮出水面。大数据分析为数据挖掘技术提供了基于诸如分类/集群分析、流送数据挖掘和文本挖掘的能力，因此，如何为涉及大数据分析的各种应用提供质量保证成为推进数据挖掘技术的关键技术之一。对于企业级产品/应用而言，可以通过功能测试和单元测试二者来确保产品/应用的质量。其一般方法是QA(品质保证)人员首先为待测试的功能或代码块设计(输入，输出)对，继而运行程序，并且最终验证实际输出和预期输出的一致性。然而，当应用涉及到与随机性有关的方法时，这一过程可能并不适合用于确定大数据分析中的一些复杂的应用的质量(正确性)确定。这是因为向算法馈送某些特定的输入时，并不存在确定的输出，相反，而是存在多个有可能但无法枚举的近似的输出。QA人员面临的问题可能包括:(I)如何生成大型的用于测试的数据；(2)如何定义/计算预期输出；以及(3)如何度量/定义成功。
技术实现思路
为了解决现有技术中存在的上述问题，本说明书提出如下方案。根据本专利技术的一个方面，提出一种确定应用正确性的方...

【技术保护点】
一种确定应用正确性的方法，包括：获取用于所述应用的数据集和参考运行结果；以及基于所述数据集在所述应用上的实际运行结果与所述参考运行结果的比较，确定所述应用的正确性。

【技术特征摘要】
1.一种确定应用正确性的方法，包括: 获取用于所述应用的数据集和参考运行结果；以及基于所述数据集在所述应用上的实际运行结果与所述参考运行结果的比较，确定所述应用的正确性。2.根据权利要求1所述的方法，其中，所述参考运行结果包括所述数据集在与所述应用针对相同问题的另一应用上的运行结果。3.根据权利要求1所述的方法,其中,所述数据集包括真实数据集。4.根据权利要求1所述的方法，其中，所述数据集和所述参考运行结果从公共平台中获得。5.根据权利要求1所述的方法，其中，所述应用包括与随机性有关的应用。6.根据权利要求1所述的方法，其中，所述比较以图形化方式输出。7.一种确定应用正...

【专利技术属性】
技术研发人员：周宝曜，陈弢，王天青，陶隽，向东，曹逾，
申请(专利权)人：伊姆西公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人