【技术实现步骤摘要】
一种异常身份识别方法及装置
[0001]本专利技术涉及数据识别领域,尤其涉及一种异常身份识别方法及装置。
技术介绍
[0002]在金融行业中有效识别客户真实身份,防范违法犯罪人员的金融交易行为,是保证金融安全的重要一环,也是央行及银保监会对银行监管的重要环节,这一过程包括客户开户过程客户真实身份的有效识别,金融交易过程交易双方真实身份识别,以及对历史交易的滚动回溯性排查场景,从事前、事中及事后需要进行全方位的识别与管控。
[0003]目前对于犯罪人员的官方发布数据中,由于客观条件所限,人员的描述信息并不规范与完整,往往会存在关键数据的缺失情况或者数据瑕疵,例如缺少证件类信息,缺少年龄信息等,此外由于不同语言、繁简体、拼音以及语序、特殊字符等问题干扰,加上需要对比的数据量大,时效性高,对比信息不完整等问题,在身份核实与比对过程中,存在较大的难度,而人工识别又无法满足日益暴增的交易数据量。
[0004]当前金融机构大多通过传统关系型数据库的精确匹配或者简单模糊匹配方式,在实际中会得出大量无关的误报信息,精准度不高 ...
【技术保护点】
【技术特征摘要】
1.一种异常身份识别方法,其特征在于,包括:构建风险数据集市;根据所述风险数据集市中的原始数据,构建数据索引;获取待核查数据;基于所述数据索引以及预设匹配算法,构建客户身份识别模型;根据所述客户身份识别模型以及所述待核查数据,对所述待核查数据对应的主体进行身份识别。2.如权利要求1所述的异常身份识别方法,其特征在于,所述构建风险数据集市,包括:采集初始的风险数据;对所述初始的风险数据进行清洗;对清洗后的风险数据进行统一转换,构建风险数据集市。3.如权利要求1所述的异常身份识别方法,其特征在于,所述根据所述风险数据集市中的原始数据,构建数据索引,包括:根据所述原始数据的语言种类,对所述原始数据进行解析;对解析后的数据进行规格转换处理;对转换处理后的数据进行干扰项降噪处理;通过降噪处理后的数据构建数据索引。4.如权利要求3所述的异常身份识别方法,其特征在于,所述根据所述原始数据的语言种类,对所述原始数据进行解析,包括:判断所述风险数据集市中的原始数据的语言种类;根据所述语言种类对应的语言解析策略,对所述原始数据进行解析及分词;根据分词结果,提取所述原始数据的核心词汇,将所述原始数据以及对应的核心词汇确定为解析后的数据。5.如权利要求3所述的异常身份识别方法,其特征在于,所述对解析后的数据进行规格转换处理,包括:对解析后的数据进行中文繁简体转换处理以及拼音转换处理。6.如权利要求3所述的异常身份识别方法,其特征在于,所述对转换处理后的数据进行干扰项降噪处理,包...
【专利技术属性】
技术研发人员:刘旋飞,胡佰庆,高建新,丁珂,梁春雨,
申请(专利权)人:北京领雁科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。