一种数据预测方法、设备及可读存储介质技术

技术编号:39419271 阅读:9 留言:0更新日期:2023-11-19 16:08
本申请实施例公开了一种数据预测方法、设备及可读存储介质,涉及人工智能领域,其中,方法包括:获取待预测的目标数据,该目标数据用于指示对象的身份类别;对该目标数据进行脱敏处理,得到目标脱敏数据;分别采用N种数据预测技术对该目标脱敏数据进行处理,得到N个身份预测集合,每个身份预测集合中包括该对象属于M种预测身份类别的概率,N为大于或者等于2的正整数,M为正整数;基于该N个身份预测集合确定该对象的目标身份类别。采用本申请实施例,可以提高数据预测的准确性,并且降低身份信息泄露风险。泄露风险。泄露风险。

【技术实现步骤摘要】
一种数据预测方法、设备及可读存储介质


[0001]本申请涉及人工智能
,尤其涉及一种数据预测方法、设备及可读存储介质。

技术介绍

[0002]目前存在很多业务需要对对象的身份进行判断,从而实现个性化服务,提高服务的准确性。目前一般是通过人工根据经验来对对象的身份信息进行预测,该种预测方式的准确率较低,并且人工成本较高。此外,该种预测方式在预测的过程中容易导致用户身份信息泄露,存在较高的身份信息泄露风险。

技术实现思路

[0003]本申请实施例提供一种数据预测方法、设备及可读存储介质,可以提高数据预测的准确性,并且降低身份信息泄露风险。
[0004]第一方面,本申请提供一种数据预测方法,包括:
[0005]获取待预测的目标数据,该目标数据用于指示对象的身份类别;
[0006]对该目标数据进行脱敏处理,得到目标脱敏数据;
[0007]分别采用N种数据预测技术对该目标脱敏数据进行处理,得到N个身份预测集合,每个身份预测集合中包括该对象属于M种预测身份类别的概率,N为大于或者等于2的正整数,M为正整数;
[0008]基于该N个身份预测集合确定该对象的目标身份类别。
[0009]第二方面,本申请提供一种数据预测装置,包括:
[0010]数据获取单元,用于获取待预测的目标数据,该目标数据用于指示对象的身份类别;
[0011]数据脱敏单元,用于对该目标数据进行脱敏处理,得到目标脱敏数据;
[0012]数据处理单元,用于分别采用N种数据预测技术对该目标脱敏数据进行处理,得到N个身份预测集合,每个身份预测集合中包括该对象属于M种预测身份类别的概率,N为大于或者等于2的正整数,M为正整数;
[0013]身份确定单元,用于基于该N个身份预测集合确定该对象的目标身份类别。
[0014]第三方面,本申请提供了一种计算机设备,包括:处理器、存储器、网络接口;
[0015]上述处理器与存储器、网络接口相连,其中,网络接口用于提供数据通信功能,上述存储器用于存储计算机程序,上述处理器用于调用上述计算机程序,以使包含该处理器的计算机设备执行上述数据预测方法。
[0016]第四方面,本申请提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行上述数据预测方法。
[0017]第五方面,本申请提供了一种计算机程序产品或计算机程序,该计算机程序产品
或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请第一方面中的各种可选方式中提供的数据预测方法。
[0018]本申请实施例中,通过对待预测的目标数据进行脱敏处理,可以提升数据安全性,减少对象身份信息泄露的风险。由于使用多种数据预测技术对目标脱敏数据进行处理,每种数据预测技术对目标脱敏数据进行处理的方式不同,因此处理得到的结果存在差异,通过结合多种数据预测技术确定对象的身份类别,可以实现从多个维度进行身份预测,提高数据预测的准确性。
附图说明
[0019]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是本申请实施例提供的一种数据预测系统的架构示意图;
[0021]图2是本申请实施例提供的一种数据预测方法的应用场景示意图;
[0022]图3是本申请实施例提供的一种数据预测方法的流程示意图;
[0023]图4是本申请实施例提供的一种模型训练方法的流程示意图;
[0024]图5是本申请实施例提供的一种平均池化的示意图;
[0025]图6是本申请实施例提供的一种训练模型的流程示意图;
[0026]图7是本申请实施例提供的一种基于模型对脱敏数据进行处理的示意图;
[0027]图8是本申请实施例提供的另一种基于模型对脱敏数据进行处理的示意图;
[0028]图9是本申请实施例提供的又一种基于模型对脱敏数据进行处理的示意图;
[0029]图10a是本申请实施例中提供一种模型效果对比示意图;
[0030]图10b是本申请实施例中提供一种业务效果对比示意图;
[0031]图11是本申请实施例提供的另一种数据预测方法的流程示意图;
[0032]图12是本申请实施例提供的又一种数据预测方法的流程示意图;
[0033]图13是本申请实施例提供的一种数据预测装置的组成结构示意图;
[0034]图14是本申请实施例提供的一种计算机设备的组成结构示意图。
具体实施方式
[0035]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0036]人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
[0037]其中,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
[0038]本申请实施例中涉及到用户信息相关的数据(例如目标数据)均为用户授权后的数据。本申请涉及人工智能领域的机器学习技术。可选地,例如,可以利用机器学习技术对目标脱敏数据进行处理,得到N个身份预测集合,从而基于N个身份预测集合确定对象(即用户)的目标身份类别。或者,还可以利用机器学习技术对目标数据进行脱敏处理,得到目标脱敏数据,等等。本申请技术方案可以应用于对用户的目标数据进行预测,确定用户的身份类别的场景中。通过确定对象的身份类别,可以实现针对性地广告投放、提高用户点击率。或者,通过确定对象的身份类别,可以预测对象的金融贷款能力,从而在进行购房、购车等场景中进行针对性贷款发放,降低贷款机构的损失。本申请技术方案还可以应用于其他需要进行对象的身份类别预测的场景,本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据预测方法,其特征在于,包括:获取待预测的目标数据,所述目标数据用于指示对象的身份类别;对所述目标数据进行脱敏处理,得到目标脱敏数据;分别采用N种数据预测技术对所述目标脱敏数据进行处理,得到N个身份预测集合,每个身份预测集合中包括所述对象属于M种预测身份类别的概率,N为大于或者等于2的正整数,M为正整数;基于所述N个身份预测集合确定所述对象的目标身份类别。2.根据权利要求1所述的方法,其特征在于,所述目标脱敏数据中包括稠密特征和/或稀疏特征;所述分别采用N种数据预测技术对所述目标脱敏数据进行处理,得到N个身份预测集合,包括:分别采用N种数据预测技术对所述稠密特征和/或所述稀疏特征进行处理,得到N个身份预测集合。3.根据权利要求2所述的方法,其特征在于,所述N个身份预测集合包括第一身份预测集合、第二身份预测集合和第三身份预测集合中的至少两种;所述分别采用N种数据预测技术对所述稠密特征和/或所述稀疏特征进行处理,得到N个身份预测集合,包括:对所述稀疏特征进行特征压缩,对压缩后的特征与所述稠密特征进行特征拼接,得到第一拼接特征,基于所述第一拼接特征确定所述第一身份预测集合;和/或,对所述稀疏特征和所述稠密特征进行特征压缩,对压缩后的特征进行特征拼接,得到第二拼接特征,基于所述第二拼接特征确定所述第二身份预测集合;和/或,对所述稀疏特征进行特征压缩,对压缩后的特征与所述稠密特征进行特征拼接,得到第三拼接特征,基于注意力机制对所述第三拼接特征进行权重处理,以确定所述第三身份预测集合。4.根据权利要求1

3任一项所述的方法,其特征在于,所述基于所述N个身份预测集合确定所述对象的目标身份类别,包括:从所述N个身份预测集合中确定属于相同种类的预测身份类别,以及相同种类的预测身份类别的概率;基于所述N个身份预测集合中相同种类的预测身份类别的概率,确定M种预测身份类别中每种预测身份类别的概率,得到每种预测身份类别的总概率;从所述M种预测身份类别的总概率中确定出最大概率;将所述最大概率对应的预测身份类别确定为所述对象的目标身份类别。5.根据权利要求1所述的方法,其特征在于,所述对所述目标数据进行脱敏处理,得到目标脱敏数据,包括:获取所述目标数据的原始敏感概率;对所述目标数据添加噪声,得到噪声数据,基于所述噪声数据和所述原始敏感概率确定所述噪声数据的...

【专利技术属性】
技术研发人员:樊鹏
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1