数据校验方法和装置制造方法及图纸

技术编号:14965932 阅读:138 留言:0更新日期:2017-04-02 20:34
本发明专利技术提出一种数据校验方法和装置,其中,该数据校验方法,包括以下步骤:接收用户输入的数据,并获取用户输入的数据的业务类型;根据业务类型选择对应的预测算法,其中,预测算法是根据业务类型的历史输入数据训练得到的;根据预测算法预测业务类型对应的输入区间;判断用户输入的数据是否在输入区间之中;如果不在输入区间之中,则确定用户输入的数据异常。本发明专利技术的数据校验方法,能够加强不同应用场景下对用户输入的数据的合法性的检查,减少因为输入过程中误操作导致的一些错误,提高数据校验的精度,提高输入数据的可靠性,减少较少通过人工进行异常数据检查的工作量。

【技术实现步骤摘要】

本专利技术涉及数据处理
,特别涉及一种数据校验方法和装置
技术介绍
在一些数据处理系统中需要对用户输入的数据进行校验,以避免因用户输入错误的数据影响后续数据处理。例如,对于大数据应用来说,数据的采集是系统不可缺少的组成部分。例如,在大数据分析系统中,数据的采集位于系统的最前端,也是后续分析和展示的基础。因此,数据的有效性直接关系到后续的分析和处理。然而,对于数据采集系统来说,如何确定用户的输入数据或者采集数据是否正确,十分困难。目前大多系统只是对采集数据做一个非常粗范的有效性检查,例如,对数据格式(如只能输入数字或者小数格式),或者对数据取值范围进行限定。但是,对于一些采集指标,比如:经济指标等,由于季节因素或者其他因素等,指标取值波动变化较大。如果对指标的取值范围定义过小,会引起误报,如果取值范围定义过大,又会因范围过大导致无法准确检测到用户输入的错误数据。特别是在指标多、需要用户手动输入数据的情况,输入数据的准确性更加难以保证。因此,如何对用户输入的数据进行一个有效性的校验,是一个有待解决的难题。
技术实现思路
本专利技术旨在至少在一定程度上解决上述技术问题。为此,本专利技术的第一个目的在于提出一种数据校验方法,能够提高数据校验的精度,提高输入数据的可靠性。本专利技术的第二个目的在于提出一种数据校验装置。为达上述目的,根据本专利技术第一方面实施例提出了一种数据校验方法,包括以下步骤:>接收用户输入的数据,并获取所述用户输入的数据的业务类型;根据所述业务类型选择对应的预测算法,其中,所述预测算法是根据所述业务类型的历史输入数据训练得到的;根据所述预测算法预测所述业务类型对应的输入区间;判断所述用户输入的数据是否在所述输入区间之中;如果不在所述输入区间之中,则确定所述用户输入的数据异常。本专利技术实施例的数据校验方法,在接收到用户输入的数据之后,可获取该数据的业务类型,并根据业务类型选择对应的预测算法预测输入区间,如果用户输入的数据不在该输入区间之中,则确定该数据异常,,由此,能够加强不同应用场景下对用户输入的数据的合法性的检查,减少因为输入过程中误操作导致的一些错误,提高数据校验的精度,提高输入数据的可靠性,减少较少通过人工进行异常数据检查的工作量。本专利技术第二方面实施例提出了一种数据校验装置,包括:接收模块,用于接收用户输入的数据,并获取所述用户输入的数据的业务类型;选择模块,用于根据所述业务类型选择对应的预测算法,其中,所述预测算法是根据所述业务类型的历史输入数据训练得到的;预测模块,用于根据所述预测算法预测所述业务类型对应的输入区间;判断模块,用于判断所述用户输入的数据是否在所述输入区间之中;确定模块,用于当所述用户输入的数据不在所述输入区间之中时,确定所述用户输入的数据异常。本专利技术实施例的数据校验装置,在接收到用户输入的数据之后,可获取该数据的业务类型,并根据业务类型选择对应的预测算法预测输入区间,如果用户输入的数据不在该输入区间之中,则确定该数据异常,,由此,能够加强不同应用场景下对用户输入的数据的合法性的检查,减少因为输入过程中误操作导致的一些错误,提高数据校验的精度,提高输入数据的可靠性,减少较少通过人工进行异常数据检查的工作量。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1为根据本专利技术一个实施例的数据校验方法的流程图;图2为根据本专利技术一个实施例中训练预测算法的示意图;图3为根据本专利技术一个具体实施例的数据校验方法的流程图;图4为根据本专利技术另一个实施例的数据校验方法的流程图;图5为根据本专利技术一个实施例的数据校验装置的结构示意图;图6为根据本专利技术另一个实施例的数据校验装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。在本专利技术的描述中,需要理解的是,术语“多个”指两个或两个以上;术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。下面参考附图描述根据本专利技术实施例的数据校验方法和装置。图1为根据本专利技术一个实施例的数据校验方法的流程图。如图1所示,根据本专利技术实施例的数据校验方法,包括:S101,接收用户输入的数据,并获取用户输入的数据的业务类型。数据录入系统可提供输入界面,输入界面中可包括与不同业务对应的输入框。当用户在输入框中输入数据时,可根据输入框对应的业务类型确定用户输入的数据的业务类型。S102,根据业务类型选择对应的预测算法,其中,预测算法是根据业务类型的历史输入数据训练得到的。具体地,可根据业务类型在预先建立的算法库中查找对应的预测算法。其中,算法库中存储了预先分别针对各个业务类型训练的预测算法。因此,可根据用户输入的数据的业务类型从算法库中选择对应的预测算法。在本专利技术的实施例中,还可包括训练上述预测算法的过程。图2为根据本专利技术一个实施例中训练预测算法的示意图。具体地,首先可分别获取各个业务类型对应的历史输入数据。由于各个业务类型对应的历史输入数据具有不同的取值特征,因此,可根据各个业务类型对应的的数据特征选择相应的预测算法。对于一种业务类型,可根据该业务类型对应的历史输入数据分析出该业务类型的输入数据的数据特征,即输入数据的取值随时间的变换规律。例如,随时间变化不大、取值较稳定的特征,或者周期性变化特征,或者季节性变换特征等。进而,可根据各个业务类型对应的数据特征,分别选择适合该数据特征的时间序列算法。举例来说,对于输入数据变化不大、取值区间较稳定的业务类型,可选择简单序时平均数法;而对于具有周期性变换或季节性变化特征的业务类型,则可选择季节趋势预测法。然后,对于各个业务类型,可从各自的历史输入数据中选择一部分数据作为训练数据,并根据各个业务类型的训练数据分别进行训练,以得到各个业务类型对应的时间序列算法的算法参数。最后,对于各个业务类型,从各自的历史输入数据中选择一部分数据作为验证数据,并根据各个业务类型的验证数据验证各自对应的时间序列算法的算法参数的可靠性。如果验证通过,则可将验证通过的算法作为相应业务类型的对应的预测算法,否者重新选择算法并本文档来自技高网...

【技术保护点】
一种数据校验方法,其特征在于,包括以下步骤:接收用户输入的数据,并获取所述用户输入的数据的业务类型;根据所述业务类型选择对应的预测算法,其中,所述预测算法是根据所述业务类型的历史输入数据训练得到的;根据所述预测算法预测所述业务类型对应的输入区间;判断所述用户输入的数据是否在所述输入区间之中;如果不在所述输入区间之中,则确定所述用户输入的数据异常。

【技术特征摘要】
1.一种数据校验方法,其特征在于,包括以下步骤:
接收用户输入的数据,并获取所述用户输入的数据的业务类型;
根据所述业务类型选择对应的预测算法,其中,所述预测算法是根据所述业务类型的历
史输入数据训练得到的;
根据所述预测算法预测所述业务类型对应的输入区间;
判断所述用户输入的数据是否在所述输入区间之中;
如果不在所述输入区间之中,则确定所述用户输入的数据异常。
2.如权利要求1所述的数据校验方法,其特征在于,在确定所述用户输入的数据异常
之后,还包括:
对所述用户进行数据异常提醒。
3.如权利要求2所述的数据校验方法,其特征在于,在对所述用户进行数据异常提醒
之后,还包括:
接收所述用户的确认输入信息,并记录确认次数;
当所述确认次数大于预设阈值时,对所述预测算法进行调整。
4.如权利要求3所述的数据校验方法,其特征在于,所述对所述预测算法进行调整包
括:
根据记录的用户确认输入的数据调整所述预测算法的参数。
5.如权利要求1所述的数据校验方法,其特征在于,所述根据所述预测算法预测所述
业务类型对应的输入区间具体包括:
采用预测算法对所述历史输入数据进行处理以生成所述业务类型对应的输入区间。
6.一种数据校验装置,其特征...

【专利技术属性】
技术研发人员:魏志尧
申请(专利权)人:杭州数梦工场科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1