风险识别方法、装置及服务器制造方法及图纸

技术编号：21953720 阅读：20 留言：0更新日期：2019-08-24 18:12

本说明书实施例提供了一种风险识别方法，获得待识别样本的内部信息，基于该内部信息，从公开网络中爬取获得待识别样本对应的外部信息，然后基于该样本的内部信息和所述外部信息，确定特征信息，最后，将特征信息输入目标风险识别模型，通过目标风险识别模型对所述待识别样本进行风险识别，获得风险识别结果。这样，可通过样本的内部信息去挖掘更为全面的外部信息，使得样本对应的用户画像更为全面。而目标风险识别模型也是基于训练样本的内部信息和外部信息进行训练得到，目标风险识别模型的输入考虑了样本的内部信息和外部信息。所以，能够对于外部信息中的一些潜在风险进行识别，使得风险防控能力更为全面。

Risk identification methods, devices and servers

全部详细技术资料下载

【技术实现步骤摘要】
风险识别方法、装置及服务器
本说明书实施例涉及互联网
，尤其涉及一种风险识别方法、装置及服务器。
技术介绍
随着互联网的快速发展，越来越多的业务可以通过网络实现，如在线支付、在线购物等互联网业务。互联网在给人们生活提供便利的同时，也带来了风险。不法人员可能会进行电子业务欺诈，给其它用户造成损失。现有的风险识别主要是依靠用户预留在系统的相关信息以及在系统内部的交易信息等信息进行风险识别模型训练，风险防控能力较为单一，对于是否有剩余风险的把控和是否有新风险的探索主要靠合规经验及运营人工探索为主。所以，为了能够提升整体风控能力，亟需设计一种能够准确全面对样本进行风险识别的方案。
技术实现思路
本说明书实施例提供及一种风险识别方法、装置及服务器。第一方面，本说明书实施例提供一种风险识别方法，包括：获得待识别样本的内部信息，基于所述内部信息，从公开网络中爬取获得所述待识别样本对应的外部信息；基于所述内部信息和所述外部信息，确定特征信息；将所述特征信息输入目标风险识别模型，通过所述目标风险识别模型对所述待识别样本进行风险识别，获得风险识别结果。第二方面，本说明书实施例提供一种风险识别模型训练方法，包括：针对训练样本集中每个训练样本，基于该训练样本的内部信息，从公开网络中爬取获得该训练样本的外部信息，其中，所述训练样本集中包括已标定属性的黑样本和未标定属性的未知样本；针对训练样本集中每个训练样本，基于该基于所述训练样本集中每个训练样本对应的内部信息和外部信息，确定与该训练样本对应的特征信息；基于所述训练样本集中所有训练样本的特征信息，采用半监督机器学习算法对风险识别模...

【技术保护点】
1.一种风险识别方法，包括：获得待识别样本的内部信息，基于所述内部信息，从公开网络中爬取获得所述待识别样本对应的外部信息；基于所述内部信息和所述外部信息，确定特征信息；将所述特征信息输入目标风险识别模型，通过所述目标风险识别模型对所述待识别样本进行风险识别，获得风险识别结果。

【技术特征摘要】
1.一种风险识别方法，包括：获得待识别样本的内部信息，基于所述内部信息，从公开网络中爬取获得所述待识别样本对应的外部信息；基于所述内部信息和所述外部信息，确定特征信息；将所述特征信息输入目标风险识别模型，通过所述目标风险识别模型对所述待识别样本进行风险识别，获得风险识别结果。2.根据权利要求1所述的方法，所述基于所述内部信息，从公开网络中爬取获得所述待识别样本对应的外部信息，包括：以所述内部信息中的身份信息作为关键信息，通过预设搜索引擎对所述关键信息进行搜索，从搜索结果中爬取获得每个搜索结果的摘要信息作为外部信息；和/或以所述内部信息中的身份信息作为关键信息，将从预设门户网站中爬取的与所述关键信息对应的信息作为外部信息。3.根据权利要求1所述的方法，所述基于所述内部信息和所述外部信息，确定特征信息，包括：从预设维度对所述内部信息和所述外部信息进行特征提取，形成与所述待识别样本对应的特征向量。4.根据权利要求3所述的方法，所述预设维度包括相似性维度，所述从预设维度对所述内部信息和所述外部信息进行特征提取，形成与所述待识别样本对应的特征向量，包括：确定预设黑样本对应的目标特征向量；将所述内部信息和所述外部信息转换为词向量形式的信息后，从所述词向量形式的信息中提取出与所述目标特征向量对应的相似性特征向量。5.根据权利要求3所述的方法，所述预设维度包括统计性维度，所述从预设维度对所述内部信息和所述外部信息进行特征提取，形成与所述待识别样本对应的特征向量，包括：从所述内部信息和所述外部信息中提取出统计性特征，形成统计性特征向量。6.根据权利要求3所述的方法，所述预设维度包括独特性维度，所述从预设维度对所述内部信息和所述外部信息进行特征提取，形成与所述待识别样本对应的特征向量，包括：将所述内部信息和所述外部信息转换为词向量形式的信息后，从所述词向量形式的信息中提取出与独特性特征向量，其中，所述独特性特征向量包括出现在所述内部信息和所述外部信息中的多个元素分别对应的独特性值，每个元素的独特性值为该元素在所述内部信息和所述外部信息中出现的次数与该元素在预设样本集对应的信息出现的总次数的比值。7.根据权利要求3所述的方法，所述预设维度包括情报性维度，所述从预设维度对所述内部信息和所述外部信息进行特征提取，形成与所述待识别样本对应的特征向量，包括：将所述内部信息和所述外部信息转换为词向量形式的信息后，将所述词向量形式的信息通过特征均值处理得到情报性特征向量或将所述词向量形式的信息通过主成分分析处理得到情报性特征向量。8.根据权利要求3-7中任一权利要求所述的方法，将所述特征信息输入目标风险识别模型之前，通过如下步骤训练获得所述目标风险识别模型：针对训练样本集中每个训练样本，基于该训练样本的内部信息，从公开网络中爬取获得该训练样本的外部信息，其中，所述训练样本集中包括已标定属性的黑样本和未标定属性的未知样本；针对训练样本集中每个训练样本，确定与该训练样本对应的特征信息；基于所述训练样本集中所有训练样本的特征信息，采用半监督机器学习算法对风险识别模型进行训练，获得目标风险识别模型。9.一种风险识别模型训练方法，包括：针对训练样本集中每个训练样本，基于该训练样本的内部信息，从公开网络中爬取获得该训练样本的外部信息，其中，所述训练样本集中包括已标定属性的黑样本和未标定属性的未知样本；针对训练样本集中每个训练样本，基于该训练样本对应的内部信息和外部信息，确定与该训练样本对应的特征信息；基于所述训练样本集中所有训练样本的特征信息，采用半监督机器学习算法对风险识别模型进行训练，获得目标风险识别模型...

【专利技术属性】
技术研发人员：周绪刚，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人