一种贷款中介的识别方法、系统、设备及存储介质技术方案

技术编号：23512799 阅读：16 留言：0更新日期：2020-03-18 00:06

本发明专利技术实施例公开了一种贷款中介的识别方法、系统、设备及存储介质。该贷款中介的识别方法包括：构建第一记账数据的文本特征向量；基于K‑Means算法从所述文本特征向量中聚类出第一中介用户集；通过LDA模型从所述第一中介用户集中提取第二中介用户集。本发明专利技术实施例实现了提高贷款中介的识别准确率。

An identification method, system, equipment and storage medium of loan intermediary

全部详细技术资料下载

【技术实现步骤摘要】
一种贷款中介的识别方法、系统、设备及存储介质
本专利技术实施例涉及互联网信息技术，尤其涉及一种贷款黑中介的识别方法、系统、设备及存储介质。
技术介绍
随着互联网金融的快速发展，基于互联网开展的借贷业务越来越多，由于信息上的不对称，出现越来越多的中介代办行为，随着中介高额返利的吸引出现越来越多的黑中介团伙骗贷行为。有报导指出当前金融科技领域坏账率约在10％-15％，其中60％-70％的坏账就是由黑中介“创造”；甚至多家金融科技平台借款申请人里，10％-15％都由黑中介“幕后操纵”。360金融发布的《2018智能反欺诈洞察报告》指出，黑中介存在以推荐贷款口子为由，骗取用户信息、购买用户信息进行骗贷，而信用意识相对薄弱的三四线城市人群以及偏远地区，如农村的用户往往成为黑中介骗贷受害者。现有技术中，中介的识别方法大多来源于人工标识，主要来源有客服，公开的网络数据爬虫等。上述方法都属于已知用户是中介，主要动作是采集人工标注结合传统朴素贝叶斯等有监督分类模型训练人工标注数据来识别黑中介，有监督学习方法只能学习到样本知识，无法学习样本以外的知识，这对训练样本提出了较高要求，训练样本直接决定模型泛化效果，实际操作较复杂，且识别的准确率较低。
技术实现思路
本专利技术实施例提供一种贷款黑中介的识别方法、系统、设备及存储介质，以实现提高贷款中介的识别准确率。为达此目的，本专利技术实施例提供了一种贷款黑中介的识别方法，该识别方法包括：构建第一记账数据的文本特征向量；基于K-Mea...

【技术保护点】
1.一种贷款中介的识别方法，其特征在于，包括：/n构建第一记账数据的文本特征向量；/n基于K-Means算法从所述文本特征向量中聚类出第一中介用户集；/n通过LDA模型从所述第一中介用户集中提取第二中介用户集。/n

【技术特征摘要】
1.一种贷款中介的识别方法，其特征在于，包括：
构建第一记账数据的文本特征向量；
基于K-Means算法从所述文本特征向量中聚类出第一中介用户集；
通过LDA模型从所述第一中介用户集中提取第二中介用户集。

2.根据权利要求1所述的识别方法，其特征在于，所述构建第一记账数据的文本特征向量包括：
获取中介用户的记账行为模式和第一记账数据；
通过结巴分词方法和关键词过滤技术过滤所述第一记账数据中的混淆语义脏数据以得到第一文本数据；
根据所述记账行为模式通过结巴分词方法构建所述第一文本数据的文本特征向量。

3.根据权利要求1所述的识别方法，其特征在于，所述通过LDA模型从所述第一中介用户集中提取第二中介用户集包括：
通过LDA模型对第一中介用户集的记账数据进行文本主题识别；
从所述第一中介用户集中提取所述文本主题为中介主题的概率高于预设值的用户作为第二中介用户集。

4.根据权利要求1所述的识别方法，其特征在于，所述通过LDA模型从所述第一中介用户集中提取第二中介用户集之后包括：
从所述第二中介用户集中识别出黑中介用户。

5.根据权利要求4所述的识别方法，其特征在于，所述从所述第二中介用户集中识别出黑中介用户包括：
建立用户团伙信息；
根据所述用户团伙信息对全部用户进行团伙划分；
获取每个团伙内用户的贷后数...

【专利技术属性】
技术研发人员：韦雪碧，
申请(专利权)人：随手北京信息技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人