【技术实现步骤摘要】
用户信息的处理方法及装置、电子设备、存储介质
[0001]本专利技术涉及数据处理
,具体而言,涉及一种用户信息的处理方法及装置、电子设备、存储介质。
技术介绍
[0002]目前,用户的收入水平为构建用户画像提供了有效的支持,并且收入水平也是影响消费能力的主要因素之一,在商业领域有着不可或缺的需求。然而,由于目前社会收入的多元化,难以精准的体现出用户的收入水平。
[0003]现有的评估用户收入水平的常规规则模型,比如关键字匹配,其覆盖用户量少,而且规则具有一定局限性,用户收入评估不准确。
[0004]针对上述相关技术中存在的技术问题,目前没有提出有效的解决方案。
技术实现思路
[0005]鉴于上述问题,本专利技术提出了一种用户信息的处理方法及装置、电子设备、存储介质,以至少解决现有的规则模型对用户收入水平预测不准确的技术问题。
[0006]第一方面,本专利技术提供了一种用户信息的处理方法,包括:获取目标用户的用户信息,其中,所述用户信息至少包括用户个人信息和历史金融行为信息;将所述 ...
【技术保护点】
【技术特征摘要】
1.一种用户信息的处理方法,其特征在于,包括:获取目标用户的用户信息,其中,所述用户信息至少包括用户个人信息和历史金融行为信息;将所述用户信息输入预先训练的用户收入水平预测模型进行特征学习,输出所述目标用户的收入水平信息;其中,所述用户收入水平预测模型为利用含有用户个人信息、历史金融行为信息、信用卡授信额度和历史收入信息的用户样本集训练回归树模型得到。2.根据权利要求1所述的方法,其特征在于,在将所述用户信息输入预先训练的用户收入水平预测模型进行特征学习之前,所述方法还包括:获取包含多个用户对应的用户信息的用户样本集,其中,所述用户样本集包括各个用户的用户个人信息、各个用户的历史金融行为信息、各个用户的信用卡授信额度和各个用户的历史收入信息;对所述用户样本集进行数据清洗,得到标准化样本集;利用所述标准化样本集训练所述回归树模型,得到所述用户收入水平预测模型。3.根据权利要求2所述的方法,其特征在于,所述获取包含多个用户对应的用户信息的用户样本集包括:获取包含多个第一用户对应的用户信息的基础用户样本集;基于所述基础用户样本集中各所述第一用户对应的历史收入信息和信用卡授信额度,从所述多个第一用户中筛选出符合预设条件的多个第二用户;其中,所述预设条件为各个用户的历史收入信息位于[信用卡授信额度/n,信用卡授信额度],n为固定常量;从所述基础用户样本集中筛选出包含所述多个第二用户对应的用户信息的筛选用户样本集,作为所述用户样本集。4.根据权利要求2所述的方法,其特征在于,所述用户样本集中每个信息对应一个特征值,所述对所述用户样本集进行数据清洗包括以下至少之一:修正所述用户样本集中存在明显错误的特征值;完善所述用户样本集中存在部分信息遗漏的特征值;对所述用户样本集中的特征值进行特征标准化。5.根据权利要求2所述的方法,其特征在于,所述通过将所述标准化样本集输入所述回归树进行训练,生成所述用户收入水平预测模型包括:步骤A,按照预设比例将所述标准化样本集划分为训练集和测试集;步骤B,将所述训练集输入所述回归树模型进行训...
【专利技术属性】
技术研发人员:刘欢,
申请(专利权)人:大箴杭州科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。