数据处理方法及装置制造方法及图纸

技术编号:15938820 阅读:56 留言:0更新日期:2017-08-04 21:43
本发明专利技术公开了一种数据处理方法及装置。其中,该方法包括:获取待处理数据,其中,待处理数据为用于反映目标对象的工单信息的数据,待处理数据的数据类型包括目标数据类型;确定目标数据类型对应的目标数据划分方式;按照目标数据划分方式对数据类型为目标数据类型的数据进行数据划分。本发明专利技术解决了相关技术对多种类型的数据进行统一处理导致数据处理效率较低的技术问题。

Data processing method and apparatus

The invention discloses a data processing method and a data processing device. Among them, the method includes: acquiring data, to the data to be processed is used to reflect the target job information data to deal with data types of data including the target data type; determining the target data partition corresponding to the target data type; according to the target data partition of data types for data types data classification. The invention solves the technical problem that the relative technology carries out the unified processing to many kinds of data, and leads to the low efficiency of data processing.

【技术实现步骤摘要】
数据处理方法及装置
本专利技术涉及数据处理领域,具体而言,涉及一种数据处理方法及装置。
技术介绍
随着对核心竞争力的深入认识与调整,客户服务的能力已经成为企业最核心的价值之一,客户服务中心应运而生。客户服务中心是又称为呼叫中心(CallCenter)或电话营销(Telemarketing),它基于CTI(ComputerTelephonyIntegration,即计算机电话集成)技术充分利用通信网和计算机网的多项功能集成并与企业连为一体的一个完整的综合信息服务系统。客户服务中心是企业与客户间交流的直接窗口,在交流过程中产生的用于信息交互的数据对于整个企业的销售、调度、管理、人员考核、增值起到非常重要的统一协调作用。因此,为了有效利用交流过程中产生的信息交互的数据,需要将该数据进行处理,以便于利用该数据进行数据分析,挖掘该数据中的有效信息。在现有技术中,对于该交流过程中产生的信息交互的数据,通常是按照该数据在信息交互的时间先后顺序,将该数据统一处理。但是,在数据处理过程中,并未收集图像和语音数据,并且,在数据处理过程中,通常使用的方法是各数据独立存储,分散管理,会形成“数据孤岛”,不利于数据处理和利用。针对上述相关技术对多种类型的数据进行统一处理导致数据处理效率较低的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种数据处理方法及装置,以至少解决相关技术对多种类型的数据进行统一处理导致数据处理效率较低的技术问题。根据本专利技术实施例的一个方面,提供了一种数据处理方法,包括:获取待处理数据,其中,所述待处理数据为用于反映目标对象的工单信息的数据,所述待处理数据的数据类型至少包括目标数据类型;确定所述目标数据类型对应的目标数据划分方式;按照所述目标数据划分方式对数据类型为所述目标数据类型的数据进行数据划分。进一步地,所述目标数据类型包括以下至少之一:图像格式数据;语音格式数据;结构化文本格式数据。进一步地,在所述目标数据类型为所述图像格式数据的情况下,所述目标数据划分方式为按照几何形状对所述图像格式数据进行切分的方式;在所述目标数据类型为所述语音格式数据的情况下,所述目标数据划分方式为将数据量低于预定阈值的所述语音格式数据进行合并的方式;在所述目标数据类型为所述结构化文本格式数据的情况下,所述目标数据划分方式为将所述结构化文本格式数据对应的数据表进行拆分的方式。进一步地,在所述目标数据类型为所述语音格式数据的情况下,其中,所述按照所述目标数据划分方式对数据类型为所述目标数据类型的数据进行数据划分包括:获取所述语音格式数据的数据量;判断所述语音格式数据的数据量是否低于预定阈值;在所述语音格式数据的数据量低于所述预定阈值的情况下,则将所述语音格式数据确定为待合并语音格式数据;将所述待合并语音格式数据进行合并处理。进一步地,所述将所述待合并语音格式数据进行合并处理包括:对所述待合并语音格式数据执行以下合并操作,得到语音格式数据块,直至所述语音格式数据块的数据量不低于所述预定阈值,其中,所述待合并语音格式数据在执行所述合并操作时标记为当前语音格式数据:将所述当前语音格式数据合并至所述语音格式数据块;判断所述语音格式数据块的数据量是否低于所述预定阈值;在所述语音格式数据块的数据量低于所述预定阈值的情况下,将下一个语音格式数据确定为所述当前语音格式数据。进一步地,在所述按照所述目标数据划分方式对数据类型为所述目标数据类型的数据进行数据划分之后,所述方法还包括:将数据类型为所述目标数据类型的数据进行划分后得到的目标数据块存储在目标数据库。进一步地,在所述将数据类型为所述目标数据类型的数据进行划分后得到的目标数据块存储在目标数据库之后,所述方法还包括:在所述目标数据库中为数据类型为所述目标数据类型的数据设置目标索引方式。根据本专利技术实施例的另一方面,还提供了一种数据处理装置,包括:获取单元,用于获取待处理数据,其中,所述待处理数据为用于反映目标对象的工单信息的数据,所述待处理数据的数据类型至少包括目标数据类型;确定单元,用于确定所述目标数据类型对应的目标数据划分方式;划分单元,用于按照所述目标数据划分方式对数据类型为所述目标数据类型的数据进行数据划分。进一步地,所述目标数据类型包括以下至少之一:图像格式数据;语音格式数据;结构化文本格式数据。进一步地,图像划分模块,用于在所述目标数据类型为所述图像格式数据的情况下,所述目标数据划分方式为按照几何形状对所述图像格式数据进行切分的方式;语音划分模块,用于在所述目标数据类型为所述语音格式数据的情况下,所述目标数据划分方式为将数据量低于预定阈值的所述语音格式数据进行合并的方式;文本划分模块,用于在所述目标数据类型为所述结构化文本格式数据的情况下,所述目标数据划分方式为将所述结构化文本格式数据对应的数据表进行拆分的方式。进一步地,在所述目标数据类型为所述语音格式数据的情况下,其中,所述划分单元包括:获取模块,用于获取所述语音格式数据的数据量;判断模块,用于判断所述语音格式数据的数据量是否低于预定阈值;确定模块,用于在所述语音格式数据的数据量低于所述预定阈值的情况下,则将所述语音格式数据确定为待合并语音格式数据;合并模块,用于将所述待合并语音格式数据进行合并处理。进一步地,所述合并模块包括:对所述待合并语音格式数据执行以下合并操作,得到语音格式数据块,直至所述语音格式数据块的数据量不低于所述预定阈值,其中,所述待合并语音格式数据在执行所述合并操作时标记为当前语音格式数据:合并子模块,用于将所述当前语音格式数据合并至所述语音格式数据块;判断子模块,用于判断所述语音格式数据块的数据量是否低于所述预定阈值;确定子模块,用于在所述语音格式数据块的数据量低于所述预定阈值的情况下,将下一个语音格式数据确定为所述当前语音格式数据。进一步地,在所述划分单元之后,所述装置还包括:存储模块,用于将数据类型为所述目标数据类型的数据进行划分后得到的目标数据块存储在目标数据库。进一步地,在所述存储模块之后,所述装置还包括:索引模块,用于在所述目标数据库中为数据类型为所述目标数据类型的数据设置目标索引方式。在本专利技术实施例中,获取用于反映目标对象的工单信息的待处理数据,以及该待处理数据对应的目标数据类型,并根据获取的待处理数据的目标数据类型确定该目标数据类型对应的目标数据划分方式,再将数据类型为目标数据类型的数据按照目标数据划分方式进行数据划分。采用本专利技术,按照多种类型的数据对应的数据划分方式,将各种类型的数据分别处理,达到了对不同种类型的数据进行不同的处理的目的,从而实现了提高数据处理效率的技术效果,进而解决了相关技术对多种类型的数据进行统一处理导致数据处理效率较低的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种可选的数据处理方法的流程图;图2是根据本专利技术实施例的一种可选的Hadoop集群环境示意图;图3(a)是根据本专利技术实施例的一种可选的水平切分图像格式数据的示意图;图3(b)是根据本专利技术实施例的一种可选的竖直切分图像格式数据的示意图;图3(c本文档来自技高网...
数据处理方法及装置

【技术保护点】
一种数据处理方法,其特征在于,包括:获取待处理数据,其中,所述待处理数据为用于反映目标对象的工单信息的数据,所述待处理数据的数据类型至少包括目标数据类型;确定所述目标数据类型对应的目标数据划分方式;按照所述目标数据划分方式对数据类型为所述目标数据类型的数据进行数据划分。

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取待处理数据,其中,所述待处理数据为用于反映目标对象的工单信息的数据,所述待处理数据的数据类型至少包括目标数据类型;确定所述目标数据类型对应的目标数据划分方式;按照所述目标数据划分方式对数据类型为所述目标数据类型的数据进行数据划分。2.根据权利要求1所述的方法,其特征在于,所述目标数据类型包括以下至少之一:图像格式数据;语音格式数据;结构化文本格式数据。3.根据权利要求2所述的方法,其特征在于,在所述目标数据类型为所述图像格式数据的情况下,所述目标数据划分方式为按照几何形状对所述图像格式数据进行切分的方式;在所述目标数据类型为所述语音格式数据的情况下,所述目标数据划分方式为将数据量低于预定阈值的所述语音格式数据进行合并的方式;在所述目标数据类型为所述结构化文本格式数据的情况下,所述目标数据划分方式为将所述结构化文本格式数据对应的数据表进行拆分的方式。4.根据权利要求2所述的方法,其特征在于,在所述目标数据类型为所述语音格式数据的情况下,其中,所述按照所述目标数据划分方式对数据类型为所述目标数据类型的数据进行数据划分包括:获取所述语音格式数据的数据量;判断所述语音格式数据的数据量是否低于预定阈值;在所述语音格式数据的数据量低于所述预定阈值的情况下,则将所述语音格式数据确定为待合并语音格式数据;将所述待合并语音格式数据进行合并处理。5.根据权利要求4所述的方法,其特征在于,所述将所述待合并语音格式数据进行合并处理包括:对所述待合并语音格式数据执行以下合并操作,得到语音格式数据块,直至所述语音格式数据块的数据量不低于所述预定阈值,其中,所述待合并语音格式数据在执行所述合并操作时标记为当前语音格式数据:将所述当前语音格式数据合并至所述语音格式数据块;判断所述语音格式数据块的数据量是否低于所述预定阈值;在所述语音格式数据块的数据量低于所述预定阈值的情况下,将下一个语音格式数据确定为所述当前语音格式数据。6.根据权利要求1所述的方法,其特征在于,在所述按照所述目标数据划分方式对数据类型为所述目标数据类型的数据进行数据划分之后,所述方法还包括:将数据类型为所述目标数据类型的数据进行划分后得到的目标数据块存储在目标数据库。7.根据权利要求6所述的方法,其特征在于,在所述将数据类型为所述目标数据类型的数据进行划分后得到的目标数据块存储在目标数据库之后,所述方法还包括:在所述目标数据库中为数据类型为所述目标数据类型的数据设置目标索引方式。8.一种数...

【专利技术属性】
技术研发人员:杨柳何伟胡红艳索娟李雅洁高阳马斌李志刚王天军
申请(专利权)人:国网新疆电力公司信息通信公司国家电网公司
类型:发明
国别省市:新疆,65

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1