数据处理方法及装置、计算机设备及存储介质制造方法及图纸

技术编号:19745410 阅读:45 留言:0更新日期:2018-12-12 04:46
一种数据处理方法及装置、计算机设备及存储介质,该数据处理方法包括:获取待处理数据;获取所述待处理数据对应的抽样表达式;解析所述抽样表达式,获取抽样函数以及所述抽样函数对应的抽样参数值;基于所述抽样函数以及对应的所述抽样参数值,对所述待处理数据进行抽样,确定抽样数据。采用本方法可提高抽样效率。

【技术实现步骤摘要】
数据处理方法及装置、计算机设备及存储介质
本申请涉及计算机
,特别涉及一种数据处理方法及装置、计算机设备及存储介质。
技术介绍
随着计算机技术和移动互联网技术的发展,应用的种类也不断增多,给用户提供了便利。例如,手机应用下载平台给用户进行应用下载提供了便利。在各种类应用的开发过程中,为确保应用的正常和稳定运行,需对应用各功能进行测试等,在此过程中,开发人员需要利用数据进行测试。为避免大量数据影响测试效率,需对数据进行抽样,减少测试过程中的数据量,以提高测试效率。在进行抽样过程中,需利用数据输入代码读取待处理数据,目前,将抽样逻辑(可以理解为抽样代码)添加到数据输入代码中,即修改数据输入代码,基于抽样逻辑对输入代码读取的待处理数据进行抽样,以获得抽样数据。然而,上述抽样过程,每进行一次抽样,需写入抽样逻辑,修改数据输入代码,然后再执行抽样逻辑进行抽样,导致抽样效率低。
技术实现思路
基于此,有必要针对现有群发过程中的消息所传达的信息量有限的问题,提出一种数据处理方法及装置、计算机设备及存储介质。一种数据处理方法,包括步骤:获取待处理数据;获取抽样表达式;解析所述抽样表达式,获取抽样函数以及所述抽样函数对应的抽样参数值;基于所述抽样函数以及对应的所述抽样参数值,对所述待处理数据进行抽样,确定抽样数据。一种数据处理装置,包括:数据获取模块,用于获取待处理数据;表达式获取模块,用于获取抽样表达式;解析模块,用于解析所述抽样表达式,获取抽样函数以及所述抽样函数对应的抽样参数值;抽样模块,用于基于所述抽样函数以及对应的所述抽样参数值,对所述待处理数据进行抽样,确定抽样数据。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。上述数据处理方法及装置、计算机设备及存储介质,在数据抽样处理过程中,通过获取抽样表达式,通过抽样表达式中的抽样函数以及所述抽样函数对应的抽样参数值,即可对待处理数据进行抽样,无需在进行抽样过程中重新编辑抽样逻辑以及修改数据数据代码的操作,只需获取抽样表达式,利用其对应的抽样函数以及抽样参数值即可进行抽样,简化抽样步骤,提高抽样效率。附图说明图1为一个实施例中数据处理方法的应用环境示意图;图2为一个实施例中数据处理方法的流程示意图;图3为现有抽样原理图;图4为一个实施例的数据处理方法对应的抽样原理图;图5为一个实施例的表达式配置界面图;图6为一个实施例的利用跳跃抽样函数以及数量限制抽样函数组合抽样的原理图;图7为一个实施例的利用间隔抽样函数进行抽样的原理图;图8为一个实施例的利用随机抽样函数进行抽样的原理图;图9为一个实施例的数据处理装置的模块示意图;图10为一个实施例中计算机设备的内部结构图。具体实施方式为使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本申请,并不限定本申请的保护范围。本申请提供的各实施例的数据处理方法,可以应用于如图1所示的应用环境中,应用环境涉及终端10和服务器20,终端10通过网络与服务器20进行通信。上述数据处理方法可应用于服务器20中,在服务器20中,通过上述数据处理方法可进行数据抽样确定抽样数据,并可基于抽样数据对待测应用的功能进行测试确定测试结果,在测试通过后,可将待测应用的该功能上线,以供用户使用,即终端10可通过访问服务器20下载该待测应用,用户可使用该终端10上该待测应用提供的该功能。该服务器20可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一个实施例中,如图2所示,提供了一种数据处理方法。以该方法应用于图1中服务器20为例进行说明,包括以下步骤S210至S240。S210:获取待处理数据。待处理数据可以理解为待抽样的数据,即需从待处理数据中抽取数据。待处理数据可以包括文章内容、商品信息以及网络接收数据等,其中,文章内容可以是对应用的介绍、使用说明以及评价内容等,该评价内容可以通过网路爬虫从网络进行爬取的方式确定。该文章内容可预先存储与数据库中,通过对数据库的读取可获取该文章内容。商品信息可以是第三方平台提供的商品信息,例如,某电商平台上对应的秒杀商品信息等。其中,第三方平台,可以是指与当前执行数据处理方法的服务器20属于不同平台的相关服务器设备。网络接收数据可以理解为通过访问网络接口拉取的数据。例如,某咨询类应用,每日可提供来自某网络问答社区(可连接各行各业的用户,用户可分享彼此之间的知识、经验和见解,或者说,在该社区,用户可围绕某一话题进行相关的讨论等)的精选内容(可以是精选回答、专栏特稿等)。该咨询类应用提供开放的接口,访问该资讯类应用的开放的接口可拉取精选内容等。S220:获取抽样表达式。S230:解析抽样表达式,获取抽样函数以及抽样函数对应的抽样参数值。抽样表达式可以理解为抽样条件,抽样表达式与待处理数据对应,即表示对待处理数据进行抽样的条件。在抽样表达式中可以包括抽样函数和抽样参数值,抽样函数指可实现抽样功能的函数,也可以理解为抽样规则,即抽样过程中需遵循的要求或规律。在抽样过程中,可从待处理数据中抽取符合该抽样规则的数据。抽样参数值指为抽样过程提供的参数值,可在抽样规则的基础上,增加抽样参数值对其抽样加以限定。即抽样函数以及对应的抽样参数值构成对待处理数据的抽样条件。例如,需要对待处理数据每间隔一个间距值抽取数据,则获取的抽样表达式中的抽样函数需满足每间隔一个间距值进行抽样,还需对间距值进行设定,以限定通过该抽样函数进行抽样时的间隔大小,即对抽样规则进行限定。该抽样函数和间距值构成对待处理数据的抽样条件,即需要每间隔一个间距值对待处理数据进行抽样。S240:基于抽样函数以及对应的抽样参数值,对待处理数据进行抽样,确定抽样数据。在服务器中,预先存储有抽样函数对应的代码,即预先存储有可实现抽样函数的抽样过程的抽样代码。在解析抽样表达式确定抽样函数和抽样参数值后,即可基于抽样函数以及对应的抽样参数值,执行对应的抽样代码,即可对待处理数据实现抽样,以获得抽样数据。上述数据处理方法,在数据抽样处理过程中,通过获取抽样表达式,通过抽样表达式中的抽样函数以及抽样函数对应的抽样参数值,即可对待处理数据进行抽样,无需在进行抽样过程中重新编辑抽样逻辑以及修改数据数据代码的操作,只需获取抽样表达式,利用其对应的抽样函数以及抽样参数值即可进行抽样,简化抽样步骤,提高抽样效率。在一个实施例中,在一个实施例中,在确定抽样数据之后,还可包括步骤:对抽样数据分别进行过滤处理,确定过滤后的抽样数据。在一个示例中,在确定过滤后的抽样数据之后,还可对过滤后的抽样数据进行统计处理,得到数据统计结果。在得到的任意一个抽样数据中,可能存在乱码等噪音,为确保数据的准确性,还需分别对抽样数据分别进行过滤处理,即过滤抽样数据中的噪音。过滤后,还可对其进行统计工作,得到统计结果,便于了解数据情况。例如,针对文章内容的待处理数据,可对其进行字数统计,得到字数统计结果。可以理解,每得到一个抽样数据,可以对其进行上述过滤和统本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:获取待处理数据;获取抽样表达式;解析所述抽样表达式,获取抽样函数以及所述抽样函数对应的抽样参数值;基于所述抽样函数以及对应的所述抽样参数值,对所述待处理数据进行抽样,确定抽样数据。

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取待处理数据;获取抽样表达式;解析所述抽样表达式,获取抽样函数以及所述抽样函数对应的抽样参数值;基于所述抽样函数以及对应的所述抽样参数值,对所述待处理数据进行抽样,确定抽样数据。2.根据权利要求1所述的方法,其特征在于,所述获取抽样表达式,包括:接收响应对表达式配置界面中表达式输入框的交互操作获取的抽样表达式。3.根据权利要求1所述的方法,其特征在于,所述获取待处理数据,包括:基于迭代器对各数据源进行读取,获取所述待处理数据。4.根据权利要求1所述的方法,其特征在于,所述抽样函数包括跳跃抽样函数,所述跳跃抽样函数对应的抽样参数值为跳跃数目;所述基于所述抽样函数以及对应的所述抽样参数值,对所述待处理数据进行抽样,确定抽样数据,包括:基于所述待处理数据的数据顺序,以及所述待处理数据中数据顺序在所述跳跃数目之后的数据,确定所述抽样数据。5.根据权利要求1所述的方法,其特征在于,所述抽样函数包括数量限制抽样函数,所述数量限制抽样函数对应的抽样参数值为抽样数量阈值;所述基于所述抽样函数以及对应的所述抽样参数值,对所述待处理数据进行抽样,确定抽样数据,包括:基于所述待处理数据的数据顺序,将所述待处理数据中数据顺序靠前的所述抽样数量阈值个数据,确定为所述抽样数据。6.根据权利要求1所述的方法,其特征在于,所述抽样函数包括间隔抽样函数,所述间隔抽样函数对应的抽样参数值为间距值;所述基于所述抽样函数以及对应的所述抽样参数值,对所述待处理数据进行抽样,确定抽样数据,包括:基于所述待处理数据的数据顺序,将所述待处理数据中间隔所述间距值的数据,确定为所述抽样数据,所述抽样数据中包括所述待处理数据中数据顺序为第一的数据。7.根据权利要求1所述的方法,其特征在于,所述抽样函数包括随机抽样函...

【专利技术属性】
技术研发人员:王炼吕远方卢力
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1