基于多维数据挖掘的用户信用确定方法技术

技术编号：22330813 阅读：42 留言：0更新日期：2019-10-19 12:24

本发明专利技术提供了一种基于多维数据挖掘的用户信用确定方法，该方法包括：记录已确认的风险用户与当前待分析用户的特征样本二元组训练一个深度卷积网络，通过学习一组分层非线性变换将特征样本二元组投影到新建特征空间中，利用相似度算法分别得到当前待分析用户与风险用户的行为模式相似度；如果当前待分析用户与某个风险用户的行为模式相似度大于预设阈值，则将当前待分析用户识别为失信用户。本发明专利技术提出了一种基于多维数据挖掘的用户信用确定方法，减少了待分析用户行为特征的数量，消除了特征间的冗余，采用的分类模型更加高效实用，有效地提高信用评估的速度以及评估的准确性，更好地适应了海量数据的流式计算场景。

全部详细技术资料下载

【技术实现步骤摘要】
基于多维数据挖掘的用户信用确定方法
本专利技术涉及网络安全，特别涉及一种基于多维数据挖掘的用户信用确定方法。
技术介绍
互联网通信及大数据技术的发展为确定用户信用等级提供了坚实的数据和技术基础。根据研究发现，用户的互联网行为是人的行为在互联网载体上的实现形式，其本质与社会行为一致，且资产、经营状况的变化会通过其网络行为体现出来。而网络行为数据所表现出的社交关系更被认为与用户征信具有强相关性，因此用户信用不仅存在于财务报表、抵押业务信息之中，而且还可体现在相关的用户行为数据、社会关系等非结构化数据中。这些数据会持续不断产生并输入数据分析和挖掘引擎。与传统数据相比，流式数据呈现出实时性、易失性、突发性、无序性和无限性等特征。由于互联网业务对系统响应时间的高要求，这些数据往往需要实时的分析和计算。因此在互联网海量的流式数据环境下，如何提高用户信用的计算准确率和实时性，成为了大数据分析领域中急需解决的主要问题。在网络规模呈几何级增长的今天，被检测的数据量极其庞大，传统的网络分析监测工具和平台很难应付；并且存储和处理大量的社交网络数据会耗费大量的资源和时间。但随着用户行为和社交关系的日趋复杂化，现有的方法已无法实现风险用户行为特征的识别以及对失信用户进行的控制管理，并导致计算时间滞后。
技术实现思路
为解决上述现有技术所存在的问题，本专利技术提出了一种基于多维数据挖掘的用户信用确定方法，包括：记录已确认的风险用户与当前待分析用户的特征样本二元组(xf，xc)，其中xf、xc分别表示风险用户和待分析用户的征信特征向量；训练一个深度卷积网络，通过学习一组分层非线性变换将特征...

【技术保护点】
1.一种基于多维数据挖掘的用户信用确定方法，其特征在于，包括：记录已确认的风险用户与当前待分析用户的特征样本二元组(xf，xc)，其中xf、xc分别表示风险用户和待分析用户的征信特征向量；训练一个深度卷积网络，通过学习一组分层非线性变换将特征样本二元组投影到新建特征空间中，在该空间中正样本对多于预设阈值，负样本对少于该预设阈值；设置深度卷积网络共M层，第m层有p(m)个神经元，其中m＝1，2，3，…，M，对给定的用户行为特征向量x的第m层输出为：h

【技术特征摘要】
1.一种基于多维数据挖掘的用户信用确定方法，其特征在于，包括：记录已确认的风险用户与当前待分析用户的特征样本二元组(xf，xc)，其中xf、xc分别表示风险用户和待分析用户的征信特征向量；训练一个深度卷积网络，通过学习一组分层非线性变换将特征样本二元组投影到新建特征空间中，在该空间中正样本对多于预设阈值，负样本对少于该预设阈值；设置深度卷积网络共M层，第m层有p(m)个神经元，其中m＝1，2，3，…，M，对给定的用户行为特征向量x的第m层输出为：hm(x)＝tanh(W(m)h(m-1)+b(m))x；式中，W(m)为第m层的权重参数，b(m)为第m层的偏置量，经过上述M层非线性变换得到F(xf)，F(xc)：F(xf)＝h(M)(xf)，F(xc)＝h(M)(xc)，计算风险用户与当前待分析用户在新特征空间中的距离...

【专利技术属性】
技术研发人员：马涛，
申请(专利权)人：成都威嘉软件有限公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人