基于多元数据融合的用户分类方法及相关设备技术

技术编号:35356854 阅读:19 留言:0更新日期:2022-10-26 12:35
本发明专利技术涉及人工智能,提供一种基于多元数据融合的用户分类方法及相关设备。该方法采集待测用户的用户信息;对所述用户信息进行预处理,得到多个结构化特征;基于所述多个结构化特征中任意两个结构化特征的特征相似度选取出第一特征对及第二特征对;基于预先训练完成的分类模型识别每个结构化特征的特征重要度;根据所述特征重要度融合所述第一特征对,得到融合特征,合并所述第二特征对,得到合并特征,并根据所述融合特征及所述合并特征生成多个目标特征;基于所述分类模型对所述多个目标特征进行识别处理,提高分类结果的准确性。此外,本发明专利技术还涉及区块链技术,所述分类结果可存储于区块链中。于区块链中。于区块链中。

【技术实现步骤摘要】
基于多元数据融合的用户分类方法及相关设备


[0001]本专利技术涉及人工智能
,尤其涉及一种基于多元数据融合的用户分类方法及相关设备。

技术介绍

[0002]在金融营销领域中,存在不同维度的异构数据,这些数据来源复杂、结构形式多变,仅凭单一维度、单一数据形式无法充分挖掘用户的特性。然而,目前在对潜在客户进行识别的过程中,由于无法有效融合用户的多元数据,造成无法准确的识别出用户是否属于潜在客户。

技术实现思路

[0003]鉴于以上内容,有必要提供一种基于多元数据融合的用户分类方法及相关设备,能够解决无法准确的识别出用户是否属于潜在客户的技术问题。
[0004]一方面,本专利技术提出一种基于多元数据融合的用户分类方法,所述基于多元数据融合的用户分类方法包括:
[0005]采集待测用户的用户信息;
[0006]对所述用户信息进行预处理,得到多个结构化特征;
[0007]基于所述多个结构化特征中任意两个结构化特征的特征相似度选取出第一特征对及第二特征对;
[0008]基于预先训练完成的分类模型识别每个结构化特征的特征重要度;
[0009]根据所述特征重要度融合所述第一特征对,得到融合特征,合并所述第二特征对,得到合并特征,并根据所述融合特征及所述合并特征生成多个目标特征;
[0010]基于所述分类模型对所述多个目标特征进行识别处理,得到所述待测用户的分类结果。
[0011]根据本专利技术优选实施例,所述对所述用户信息进行预处理,得到多个结构化特征包括:
[0012]基于所述用户信息的采集来源识别出所述用户信息中的结构化信息;
[0013]基于所述结构化信息构建用户画像宽表;
[0014]识别所述用户画像宽表中每个宽表字段所对应的字段信息的异常数据;
[0015]从所述待测用户中筛选出与所述异常数据对应的目标用户;
[0016]基于所述异常数据检测所述目标用户是否为异常用户;
[0017]若所述目标用户不为所述异常用户,则对所述目标用户所对应的异常数据进行替换处理,得到所述多个结构化特征。
[0018]根据本专利技术优选实施例,所述对所述用户信息进行预处理,得到多个结构化特征还包括:
[0019]基于所述用户信息的采集来源识别出所述用户信息中的非结构化信息;
[0020]基于预设字符对所述非结构化信息进行数据清洗,得到文本信息;
[0021]从所述文本信息中提取文本序列及时间序列;
[0022]基于预设特征对所述文本序列进行文本分析,并基于所述预设特征对所述时间序列进行时间分析,得到所述多个结构化特征。
[0023]根据本专利技术优选实施例,所述基于所述多个结构化特征中任意两个结构化特征的特征相似度选取出第一特征对及第二特征对包括:
[0024]基于所述任意两个结构化特征构建生成的第一向量及第二向量计算出所述特征相似度;
[0025]将所述特征相似度大于或者等于第一预设相似度阈值的任意两个结构化特征确定为所述第一特征对;
[0026]将所述特征相似度小于或者等于第二预设相似度阈值的任意两个结构化特征确定为所述第二特征对,所述第一预设相似度阈值大于所述第二预设相似度阈值。
[0027]根据本专利技术优选实施例,所述基于预先训练完成的分类模型识别每个结构化特征的特征重要度包括:
[0028]对所述分类模型进行扩增处理,得到多个处理模型;
[0029]计算所述多个结构化特征的特征数量在所述多个处理模型的模型数量上的比值;
[0030]基于所述比值从所述多个结构化特征中选取特征分别输入至所述多个处理模型中并行处理,得到所述分类模型对每个结构化特征的输出类别;
[0031]基于所述多个结构化特征的标注类别与所述输出类别的比较结果识别出所述分类模型对每个结构化特征的预测准确性;
[0032]对所述预测准确性进行归一化处理,得到每个结构化特征的特征重要度。
[0033]根据本专利技术优选实施例,所述根据所述特征重要度融合所述第一特征对,得到融合特征,合并所述第二特征对,得到合并特征,并根据所述融合特征及所述合并特征生成多个目标特征包括:
[0034]基于所述特征重要度计算所述第一特征对中第一左特征在所述第一特征对中的第一重要度占比,并计算所述第一特征对中第一右特征在所述第一特征对中的第二重要度占比;
[0035]基于所述第一重要度占比及所述第二重要度占比对所述第一左特征及所述第一右特征进行加权和计算,得到所述融合特征;
[0036]对所述第二特征对中第二左特征及所述第二特征对中第二右特征进行互斥合并处理,得到所述合并特征;
[0037]将所述融合特征及所述合并特征确定为所述多个目标特征,所述多个目标特征中的任意两个目标特征的特征相似度大于所述第二预设相似度阈值,且小于所述第一预设相似度阈值。
[0038]根据本专利技术优选实施例,所述对所述第二特征对中第二左特征及所述第二特征对中第二右特征进行互斥合并处理,得到所述合并特征包括:
[0039]对于所述第二左特征,从所述第二右特征中识别出与所述第二左特征有关联的任一特征作为初筛特征,并根据所述第二左特征及所述初筛特征构建特征簇;
[0040]从第二右特征中识别出同时与所述第二左特征及所述初筛特征有关联的特征作
为中间特征;
[0041]统计所述中间特征与所述特征簇中的特征值不同时为配置值的数量作为所述中间特征与所述特征簇中的矛盾数;
[0042]若所述矛盾数小于预设矛盾阈值,则将所述中间特征合并至所述特征簇中;
[0043]基于所述特征重要度对每个合并后的特征簇进行融合处理,得到所述合并特征。
[0044]另一方面,本专利技术还提出一种基于多元数据融合的用户分类装置,所述基于多元数据融合的用户分类装置包括:
[0045]采集单元,用于采集待测用户的用户信息;
[0046]预处理单元,用于对所述用户信息进行预处理,得到多个结构化特征;
[0047]选取单元,用于基于所述多个结构化特征中任意两个结构化特征的特征相似度选取出第一特征对及第二特征对;
[0048]识别单元,用于基于预先训练完成的分类模型识别每个结构化特征的特征重要度;
[0049]生成单元,用于根据所述特征重要度融合所述第一特征对,得到融合特征,合并所述第二特征对,得到合并特征,并根据所述融合特征及所述合并特征生成多个目标特征;
[0050]所述识别单元,还用于基于所述分类模型对所述多个目标特征进行识别处理,得到所述待测用户的分类结果。
[0051]另一方面,本专利技术还提出一种电子设备,所述电子设备包括:
[0052]存储器,存储计算机可读指令;及
[0053]处理器,执行所述存储器中存储的计算机可读指令以实现所述基于多元数据融合的用户分类方法。
[0054]另一方面,本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多元数据融合的用户分类方法,其特征在于,所述基于多元数据融合的用户分类方法包括:采集待测用户的用户信息;对所述用户信息进行预处理,得到多个结构化特征;基于所述多个结构化特征中任意两个结构化特征的特征相似度选取出第一特征对及第二特征对;基于预先训练完成的分类模型识别每个结构化特征的特征重要度;根据所述特征重要度融合所述第一特征对,得到融合特征,合并所述第二特征对,得到合并特征,并根据所述融合特征及所述合并特征生成多个目标特征;基于所述分类模型对所述多个目标特征进行识别处理,得到所述待测用户的分类结果。2.如权利要求1所述的基于多元数据融合的用户分类方法,其特征在于,所述对所述用户信息进行预处理,得到多个结构化特征包括:基于所述用户信息的采集来源识别出所述用户信息中的结构化信息;基于所述结构化信息构建用户画像宽表;识别所述用户画像宽表中每个宽表字段所对应的字段信息的异常数据;从所述待测用户中筛选出与所述异常数据对应的目标用户;基于所述异常数据检测所述目标用户是否为异常用户;若所述目标用户不为所述异常用户,则对所述目标用户所对应的异常数据进行替换处理,得到所述多个结构化特征。3.如权利要求1或2所述的基于多元数据融合的用户分类方法,其特征在于,所述对所述用户信息进行预处理,得到多个结构化特征包括:基于所述用户信息的采集来源识别出所述用户信息中的非结构化信息;基于预设字符对所述非结构化信息进行数据清洗,得到文本信息;从所述文本信息中提取文本序列及时间序列;基于预设特征对所述文本序列进行文本分析,并基于所述预设特征对所述时间序列进行时间分析,得到所述多个结构化特征。4.如权利要求1所述的基于多元数据融合的用户分类方法,其特征在于,所述基于所述多个结构化特征中任意两个结构化特征的特征相似度选取出第一特征对及第二特征对包括:基于所述任意两个结构化特征构建生成的第一向量及第二向量计算出所述特征相似度;将所述特征相似度大于或者等于第一预设相似度阈值的任意两个结构化特征确定为所述第一特征对;将所述特征相似度小于或者等于第二预设相似度阈值的任意两个结构化特征确定为所述第二特征对,所述第一预设相似度阈值大于所述第二预设相似度阈值。5.如权利要求1所述的基于多元数据融合的用户分类方法,其特征在于,所述基于预先训练完成的分类模型识别每个结构化特征的特征重要度包括:对所述分类模型进行扩增处理,得到多个处理模型;
计算所述多个结构化特征的特征数量在所述多个处理模型的模型数量上的比值;基于所述比值从所述多个结构化特征中选取特征分别输入至所述多个处理模型中并行处理,得到所述分类模型对每个结构化特征的输出类别;基于所述多个结构化特征的标注类别与所述输出类别的比较结果识别出所述分类模型对每个结构化特征的预测准确性;对所述预测准确性进行归一化处理,得到每个结构...

【专利技术属性】
技术研发人员:薛淼姚梦秋邓坤王建明
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1