【技术实现步骤摘要】
基于预测模型的数据处理方法、相关设备及介质
[0001]本申请涉及人工智能
,具体涉及一种基于预测模型的数据处理方法、相关设备及介质。
技术介绍
[0002]目前,存在许多需要进行数据分析的场景,然而,待分析的数据可能存在造假情况,可能无法可靠确定数据的真实性。比如在数据抽样场景中,在对大量数据进行分析时,可以通过随机抽样的方式抽取小部分的数据,并将该小部分的数据分析结果作为所有数据的分析结果。例如,相关监管平台可以从不同区域机构中随机抽取目标患者,并对抽取到的目标患者的医疗数据进行分析以发现疑似有问题的医疗数据。由于待分析的数据可能存在造假情况,若不加区分的进行数据抽取或数据分析,可能会导致所分析的数据代表性不足,以及后续得到的分析结果不可靠。因此,如何判别数据的真实性进而提高针对数据的分析结果可靠性成为一个亟待解决的问题。
技术实现思路
[0003]本申请实施例提供了基于预测模型的数据处理方法、相关设备及介质,可以判别数据的真实性,以及提高针对数据的分析结果的可靠性。
[0004]一方面,本 ...
【技术保护点】
【技术特征摘要】
1.一种基于预测模型的数据处理方法,其特征在于,所述方法包括:获取目标用户的用户数据集合;所述用户数据集合包括N组用户数据,所述N组用户数据中每组用户数据均包括M种指标数据,N和M均为正整数;根据所述目标用户的用户数据集合生成目标用户的数据映射图像;所述数据映射图像中包括所述每组用户数据中的M种指标数据分别对应的数据映射点;分别根据所述每组用户数据在所述数据映射图像中的映射点确定所述目标用户的第一维度特征,得到N个第一维度特征;分别根据所述N组用户数据中种类相同的指标数据在所述数据映射图像中的映射点确定所述目标用户的第二维度特征,得到M个第二维度特征;将所述N个第一维度特征和所述M个第二维度特征输入预测模型,得到针对所述目标用户的用户数据的预测结果;所述预测结果用于指示针对所述目标用户的用户数据集合的数据真实概率。2.根据权利要求1所述的方法,其特征在于,所述根据所述目标用户的用户数据集合生成目标用户的数据映射图像,包括:构建所述M种指标数据中每种指标数据对应的映射图像区域;一种指标数据对应一个映射图像区域;根据每种指标数据与映射图像区域的映射关系,将所述每组用户数据中的每种指标数据分别映射到对应的映射图像区域中,得到M个映射后的映射图像区域;根据所述M个映射后的映射图像区域确定所述数据映射图像。3.根据权利要求1所述的方法,其特征在于,所述N组用户数据中包括第i组用户数据,i为小于或等于N的正整数;所述分别根据所述每组用户数据在所述数据映射图像中的映射点确定所述目标用户的第一维度特征,包括:将所述第i组用户数据中的M个指标数据分别在所述数据映射图像中的映射点的连接区域,确定为所述第i组用户数据对应的数据映射区域;获取针对目标用户的合理数据映射区域;根据所述第i组用户数据对应的数据映射区域和所述合理数据映射区域确定所述第i组用户数据所表征的第一维度特征;所述第i组用户数据所表征的第一维度特征为所述N个第一维度特征中的第i个第一维度特征。4.根据权利要求3所述的方法,其特征在于,所述根据所述第i组用户数据对应的数据映射区域和所述合理数据映射区域确定所述第i组用户数据所表征的第一维度特征,包括:将所述第i组用户数据对应的数据映射区域与所述合理数据映射区域进行对比,确定所述第i组用户数据对应的数据映射区域与所述合理数据映射区域的区域重合特征;将所述第i组用户数据对应的数据映射区域与所述合理数据映射区域的区域重合特征,确定为所述第i组用户数据所表征的第一维度特征。5.根据权利要求1所述的方法,其特征在于,所述N组用户数据中包括M组种类相同的指标数据,所述M组种类相同的指标数据包括第j组种类相同的指标数据,j为小于或等于M的正整数;所述分别根据所述N组用户数据中种类相同的指标数据在所述数据映射图像中的映射
点确定所述目标用户的第二维度特征,包括:根据所述第j组种类相同的指标数据在所述数据映射图像中的映射点的连接距离,确定所述第j组种类相同的指标...
【专利技术属性】
技术研发人员:钟明峰,
申请(专利权)人:平安国际智慧城市科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。