The present application discloses a method and device for processing heterogeneous data. The user data file receiving user, determine the user data of the user data in the file keys, and keys corresponding to the key, the key and the corresponding key data tables are created according to converting the key is determined and the key for the calibration data format, and the converted key and key stored in the data table. The server of the business provider will set up the data table for the received user data files, transform the data in the user data file into the calibration data format, and store it in the established data table. Compared with the existing technology, this method can transform data stored in the user data file into the corresponding type data and store it in the data table without the need of manual operation to complete data transformation. It not only improves the processing efficiency of heterogeneous data, but also ensures the accuracy of the processing results.
【技术实现步骤摘要】
一种异构数据的处理方法及装置
本申请涉及计算机
,尤其涉及一种异构数据的处理方法及装置。
技术介绍
目前,业务提供方可以面向不同的用户(既可以是个人用户,也可以是企业用户)提供相应业务。某些场景下,业务提供方所提供的某些业务需要使用用户数据,那么,用户就需要向业务提供方提供该用户自身的用户数据(对于企业用户而言,用户数据可以是该企业内的人员数据,诸如:人员的姓名、出生年月、性别等等),以便业务提供方根据用户数据提供相应的业务。然而,不同用户所提供的用户数据并不具有统一的标准,与业务提供方所标定的数据格式之间存在一定差异(这类由用户所提供的数据也称为:异构数据),尤其是在不同的企业用户向业务提供方提供各企业内人员数据的场景下,不同的业务用户所使用的数据格式各不相同,这就需要将不同格式的用户数据转换成业务系统内部统一的标定的数据格式。现有技术中,业务提供方会借助人工的方式,将用户数据的数据格式转换成业务提供方式所标定的数据格式,并存储。但显然,在存储过程中,现有技术的上述方式效率较低,尤其在面对企业用户所提供的人员数据时,其数据量通常都在上百~上万条数据,使用人工的方式转换数据将耗费较长的时间,导致效率过低,并且也不能保证转换后数据的准确性。
技术实现思路
本申请实施例提供一种异构数据的处理方法,用以解决现有技术中对异构数据进行存储时效率较低的问题。本申请实施例提供一种异构数据的处理装置,用以解决现有技术中对异构数据进行存储时效率较低的问题。本申请实施例采用下述技术方案:本申请实施例提供的一种异构数据的处理方法,包括:接收用户发送的用户数据文件;确定所述用户 ...
【技术保护点】
一种异构数据的处理方法,其特征在于,包括:接收用户发送的用户数据文件;确定所述用户数据文件中用户数据的键,以及各键所对应的键值;根据所述键及其对应的键值创建数据表;将确定出的所述键及其键值转换为标定的数据格式,并将转换后的键和键值存储于所述数据表中。
【技术特征摘要】
1.一种异构数据的处理方法,其特征在于,包括:接收用户发送的用户数据文件;确定所述用户数据文件中用户数据的键,以及各键所对应的键值;根据所述键及其对应的键值创建数据表;将确定出的所述键及其键值转换为标定的数据格式,并将转换后的键和键值存储于所述数据表中。2.如权利要求1所述的方法,其特征在于,所述用户数据文件包括Excel文件。3.如权利要求2所述的方法,其特征在于,确定所述用户数据中包含的键,具体包括:获取所述Excel文件中的首行用户数据;识别所述首行用户数据中包含的分隔的各数据,将分隔的每一数据作为所述用户数据的每一键。4.如权利要求2所述的方法,其特征在于,在根据所述键及其对应的键值创建数据表之前,所述方法还包括:检验所述键及其对应的键值的列数相同;和/或检验所述键的数量与标定的键数相同;和/或检验所述键值中不存在空值。5.如权利要求2所述的方法,其特征在于,将确定出的所述键值转换为标定的数据格式,具体包括:将所述键值按照不同的数据类型进行强制转换;将强制转换得到的转换结果的数据格式作为该键值的标定的数据格式;其中,所述数据类型包括:日期字符串、数字字符串、文本字符串。6.如权利要求2所述的方法,其特征在于,根据所述键及其对应的键值创建数据表,具体包括:根据所述键及其键值,确定所述Excel对应的表结构;根据所述表结构创建数据表,并为所述数据表的命名。7.如权利要求6所述的方法,其特征在于,为所述数据表的命名,具体包括:确定所述Excel文件的文件名;将所述文件名确定为所述数据表的表名。8.如权利要求7所述的方法,其特征在于,在根据所述键及其对应的键值创建数据表之前,所述方法还包括:根据所述Excel文件的文件名,查询已创建的所有数据表的表名;当查询到表名与所述文件名一致的数据表时,...
【专利技术属性】
技术研发人员:方腾飞,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。