The invention discloses a data collection method, device, device and computer readable storage medium, the method includes: when receiving a demand collection document, reading the filtering range information and demand field information in the demand collection document; calling a preset self-service report, and separately integrating the filtering range information and each demand field information with the report range information of each preset self-service report And report field information comparison to generate the matching degree between demand collection documents and preset self-service reports; according to each matching degree, determine multiple target self-service reports in each preset self-service report, and return multiple target self-service reports to the user account corresponding to the demand collection documents for data collection. Based on the matching degree generated by big data processing technology, this scheme shows the applicability of each preset self-service report to the data to be collected by the demand collection document, from which multiple target self-service reports with high applicability are determined for data collection, making the collected data more accurate.
【技术实现步骤摘要】
数据采集方法、装置、设备及计算机可读存储介质
本专利技术主要涉及数据处理
,具体地说,涉及一种数据采集方法、装置、设备及计算机可读存储介质。
技术介绍
目前,为了对各种类型的数据进行批量采集,通常设置有自助采集报表,在对某些数据有采集需求时,由人工判断该各个数据对应的各个字段是否均存在于某一张自助采集报表中,若均存在某一张自助采集报表中,则调用该自助采集报表进行采集。但是各个自助采集报表会随着时间更新,更新前后的自助采集报表所适用的数据采集类型发生变化,容易导致所调用的自助采集报表不适合对所需要采集的数据进行采集,进而使得所采集的数据不准确。
技术实现思路
本专利技术的主要目的是提供一种数据采集方法、装置、设备及计算机可读存储介质,旨在解决现有技术中对数据采集的不准确的问题。为实现上述目的,本专利技术提供一种数据采集方法,所述数据采集方法包括以下步骤:当接收到需求采集文档时,读取所述需求采集文档中的筛选范围信息和需求字段信息;调用预设自助报表,并将所述筛选范围信息以及各所述需求字段信息分别和各所述预设自助报表的报表范围信息以及报表字段信息对比,生成所述需求采集文档和各所述预设自助报表之间的匹配度;根据各所述匹配度,确定各所述预设自助报表中的多个目标自助报表,并将多个所述目标自助报表返回到所述需求采集文档对应的用户账户,以供所述用户账户基于多个所述目标自助报表进行数据采集。优选地,所述将所述筛选范围信息以及各所述需求字段信息分别和各所述预设自助报 ...
【技术保护点】
1.一种数据采集方法,其特征在于,所述数据采集方法包括以下步骤:/n当接收到需求采集文档时,读取所述需求采集文档中的筛选范围信息和需求字段信息;/n调用预设自助报表,并将所述筛选范围信息以及各所述需求字段信息分别和各所述预设自助报表的报表范围信息以及报表字段信息对比,生成所述需求采集文档和各所述预设自助报表之间的匹配度;/n根据各所述匹配度,确定各所述预设自助报表中的多个目标自助报表,并将多个所述目标自助报表返回到所述需求采集文档对应的用户账户,以供所述用户账户基于多个所述目标自助报表进行数据采集。/n
【技术特征摘要】
1.一种数据采集方法,其特征在于,所述数据采集方法包括以下步骤:
当接收到需求采集文档时,读取所述需求采集文档中的筛选范围信息和需求字段信息;
调用预设自助报表,并将所述筛选范围信息以及各所述需求字段信息分别和各所述预设自助报表的报表范围信息以及报表字段信息对比,生成所述需求采集文档和各所述预设自助报表之间的匹配度;
根据各所述匹配度,确定各所述预设自助报表中的多个目标自助报表,并将多个所述目标自助报表返回到所述需求采集文档对应的用户账户,以供所述用户账户基于多个所述目标自助报表进行数据采集。
2.如权利要求1所述的数据采集方法,其特征在于,所述将所述筛选范围信息以及各所述需求字段信息分别和各所述预设自助报表的报表范围信息以及报表字段信息对比,生成所述需求采集文档和各所述预设自助报表之间的匹配度的步骤包括:
将所述筛选范围信息分别和各所述预设自助报表的报表范围信息进行对比,确定与各所述预设自助报表对应的范围区间,并将各所述范围区间分别和所述筛选范围信息对应的筛选区间对比,确定范围匹配度;
将各所述需求字段信息分别和各所述预设自助报表的报表字段信息进行对比,确定与各所述预设自助报表对应的字段数量,并将各所述字段数量分别和所述需求字段信息对应的需求数量对比,确定字段匹配度;
根据各所述报表范围信息、各所述报表字段信息与各所述预设自助报表之间的对应关系,对各所述范围匹配度以及各所述字段匹配度整合,生成所述需求采集文档和各所述预设自助报表之间的匹配度。
3.如权利要求2所述的数据采集方法,其特征在于,所述对各所述范围匹配度以及各所述字段匹配度整合,生成所述需求采集文档和各所述预设自助报表之间的匹配度的步骤包括:
将各所述范围匹配度和预设第一阈值对比,确定各所述范围匹配度中大于所述预设第一阈值的目标范围匹配度;
将各所述字段匹配度和预设第二阈值对比,确定各所述范围匹配度中大于所述预设第二阈值的目标字段匹配度;
筛选各所述预设自助报表对应的所述目标范围匹配度和所述目标字段匹配度之间的较小值,并将各所述较小值生成为所述需求采集文档和各所述预设自助报表之间的匹配度。
4.如权利要求3所述的数据采集方法,其特征在于,所述将多个所述目标自助报表返回到所述需求采集文档对应的用户账户,以供所述用户账户基于多个所述目标自助报表进行数据采集的步骤之后包括:
接收所述用户账户发送的选择指令,并根据所述选择指令中的报表标识,从多个所述目标自助报表中确定选择自助报表;
根据所述筛选范围信息和各所述需求字段信息,设定所述选择自助报表中的采集范围和采集字段,以将所述选择自助报表更新为采集报表进行数据采集。
5.如权利要求1-4任一项所述的数据采集方法,其特征在于,所述调用预设自助报表的步骤之前包括:...
【专利技术属性】
技术研发人员:刘雪花,
申请(专利权)人:中国平安财产保险股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。