The invention discloses a data acquisition method, device, device and computer readable storage medium. The method includes: when receiving the self-service report uploaded based on the preset acquisition caliber, reading the target matching field of the self-service report and the type identification of the preset acquisition caliber; judging whether the target matching field corresponds to the type identification, if it corresponds to the type identification, then according to the The auxiliary report generates the report to be collected; when receiving the instruction containing the field to be collected, the field data corresponding to each field to be collected will be collected according to the collection basis information of the corresponding data column of the target matching field in the report to be collected, and the data of each field will be returned to the blank column of the report to be collected. In this scheme, the field data collected based on big data processing technology is returned to the blank column of the report to be collected for storage, so that the collected data and the original data in the report to be collected exist in the report to be collected, which simplifies the collection process and improves the collection efficiency.
【技术实现步骤摘要】
数据采集方法、装置、设备及计算机可读存储介质
本专利技术主要涉及数据处理
,具体地说,涉及一种数据采集方法、装置、设备及计算机可读存储介质。
技术介绍
目前,在对大量数据进行采集时,通常将包含有采集依据的数据表作为采集报表,进而根据该采集报表中的采集依据进行所需要采集数据的采集;如对多个用户的年龄进行采集,则将包含有多个用户姓名的数据表作为采集报表,以对与各用户姓名对应的用户年龄进行采集。但是,在根据采集报表进行采集的过程中,仅保留其中的采集依据,而将其他的数据删除;如对于上述包含有多个姓名的数据表中,还包括有用户电话号码,在采集过程中,仅依据其中的用户姓名进行采集,而将其中的用户电话号码进行删除。如此一来,导致了采集报表中原有数据的丢失;而为了保留原有的数据,在采集之前先对采集报表中的各数据进行备份操作,采集之后再由人工将采集到的数据添加到备份的采集报表中,对两者进行合并;数据采集的过程繁琐,采集效率低。
技术实现思路
本专利技术的主要目的是提供一种数据采集方法、装置、设备及计算机可读存储介质,旨在解决现有技术中数据采集过程繁琐,采集效率低的问题。为实现上述目的,本专利技术提供一种数据采集方法,所述数据采集方法包括以下步骤:当接收到基于预设采集口径上传的自助报表时,读取所述自助报表的目标匹配字段以及所述预设采集口径的类型标识;判断所述目标匹配字段是否和所述类型标识对应,若和所述类型标识对应,则根据所述自助报表,生成待采集报表;当接收到包含待采集字段的 ...
【技术保护点】
1.一种数据采集方法,其特征在于,所述数据采集方法包括以下步骤:/n当接收到基于预设采集口径上传的自助报表时,读取所述自助报表的目标匹配字段以及所述预设采集口径的类型标识;/n判断所述目标匹配字段是否和所述类型标识对应,若和所述类型标识对应,则根据所述自助报表,生成待采集报表;/n当接收到包含待采集字段的指令时,则根据所述目标匹配字段在所述待采集报表中对应数据列的采集依据信息,采集与各所述待采集字段对应的字段数据,并将各所述字段数据返回到所述待采集报表的空白列。/n
【技术特征摘要】
1.一种数据采集方法,其特征在于,所述数据采集方法包括以下步骤:
当接收到基于预设采集口径上传的自助报表时,读取所述自助报表的目标匹配字段以及所述预设采集口径的类型标识;
判断所述目标匹配字段是否和所述类型标识对应,若和所述类型标识对应,则根据所述自助报表,生成待采集报表;
当接收到包含待采集字段的指令时,则根据所述目标匹配字段在所述待采集报表中对应数据列的采集依据信息,采集与各所述待采集字段对应的字段数据,并将各所述字段数据返回到所述待采集报表的空白列。
2.如权利要求1所述的数据采集方法,其特征在于,所述根据所述目标匹配字段在所述待采集报表中对应数据列的采集依据信息,采集与各所述待采集字段对应的字段数据的步骤包括:
读取各所述待采集字段中的字段标识,并将各所述字段标识和各预设敏感标识对比,判断各所述待采集字段中是否具有敏感字段;
若具有敏感字段,则根据所述自助报表对应用户账户的采集权限,以及所述目标匹配字段在所述待采集报表中对应数据列的采集依据信息,采集与各所述待采集字段对应的字段数据;
若不具有敏感字段,则读取所述目标匹配字段在所述待采集报表中对应数据列的采集依据信息,并将各所述采集依据信息和预设数据库对比,采集与各所述待采集字段对应的字段数据。
3.如权利要求2所述的数据采集方法,其特征在于,所述根据所述自助报表对应用户账户的采集权限,以及所述目标匹配字段在所述待采集报表中对应数据列的采集依据信息,采集与各所述待采集字段对应的字段数据的步骤包括:
读取所述用户账户的账户标识,并根据所述账户标识确定所述用户账户是否具有对所述敏感字段进行采集的采集权限;
当具有对所述敏感字段进行采集的采集权限时,则执行读取所述目标匹配字段在所述待采集报表中对应数据的采集依据信息的步骤;
若不具有对所述敏感字段进行采集的采集权限时,则执行读取所述目标匹配字段在所述待采集报表中对应数据的采集依据信息的步骤,并在采集到与所述待采集字段对应的字段数据后,对各所述字段数据进行脱敏处理。
4.如权利要求3所述的数据采集方法,其特征在于,所述在采集到与所述待采集字段对应的字段数据后,对各所述字段数据进行脱敏处理的步骤包括:
读取各所述待采集字段中所具有敏感字段的脱敏规则,并根据所述脱敏规则,对各所述字段数据中与所述敏感字段对应的目标字段数据进行脱敏,其中所述脱敏规则用于对所述目标字段数据进行加密转换的处理;
在各所述目标字段数据均脱敏完成后,用脱敏后的各所述目标字段数据对各所述字段数据进行更新,并将更新的各所述字段数据返回到所述待采集报表的空白列。
5.如权利要求1-4任一项所述的数据采集方法,其特征在于,所述将各所述字段数据返回到所述待采集报表的空白列的步骤之后包括:
...
【专利技术属性】
技术研发人员:刘雪花,
申请(专利权)人:中国平安财产保险股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。