目标人物自动化调查方法与系统技术方案

技术编号:37974029 阅读:21 留言:0更新日期:2023-06-30 09:49
一种目标人物自动化调查方法与系统,通过一智能分析方法取得大量文本数据中的关键信息,可执行目标人物调查,在目标人物自动化调查方法中,先取得目标人物的信息,基于一自然语言处理模型,根据目标人物的信息,对取得的文本数据进行事件分类与人物分类,得出文本数据中的一个或多个特殊关键词,经比对特殊关键词与目标人物信息,可判断文本数据中与目标人物关联的信息,最后可以一统计推论方法,得出目标人物存在负面属性以及发生风险的概率。目标人物存在负面属性以及发生风险的概率。目标人物存在负面属性以及发生风险的概率。

【技术实现步骤摘要】
目标人物自动化调查方法与系统


[0001]说明书公开一种客户尽责调查的方法,特别是一种通过搜集文本数据、分群分类与特征比对实现目标人物自动化调查的方法与系统。

技术介绍

[0002]银行基于金融安全、反洗钱、反资恐,以及配合政府政策等原因,需要对其现有客户或新客户进行调查,其涉及一种认识你的客户(Know Your Customer,KYC),这是银行或各企业确认客户身份的程序。
[0003]认识你的客户的主要流程包括客户识别程序(customer identification procedure,CIP),能取得客户的名称、出生日期、地址与身分证号码等,客户尽职调查(customer due diligence,CDD),以及持续监控,需要持续监控客户财务交易和帐户,其中监控的范围如相关人物的活动信息、异常跨境活动、制裁名单以及新闻提及的负面信息等。
[0004]其中客户尽职调查(CDD)任务的调查内容包含客户的工作经历,还有客户工作相关企业的性质与负面消息,以及客户本人或与客户相关的联系人、联系单位、司法相关记录、负面新闻,以及国际或政府提供的制裁名单。
[0005]针对客户尽职调查,现有的做法是以人工在网上扒搜大量与客户同名的相关公开新闻报导,此类数据即客户尽职调查文本数据。此后,人工对新闻内容进行分类与特征比对,配合银行内部数据库中客户的个人基本资料,以排除此客户带有任何经济犯罪、政治相关、恐怖主义相关,或其他前科与负面消息属性。另外,还可藉此确认客户属性,后续实施相对应的监控。/>[0006]然而,上述方法需要使用大量的人力资源对每个客户在线进行公开新闻搜索的工作,并且因为数据很多是源自公开的第三方数据,其内容格式各自不同,在大量文本中取得信息的难度高,也容易遗漏重要内容,并且外部数据源的内容也经常变化,因此分析的结果缺乏稳定性与可共享性。如此,即便从各种数据源取得的数据完成客户尽职调查,相同姓名数据难以重复使用,并造成大量分析资源的浪费。

技术实现思路

[0007]有鉴于现有认识你的客户程序的缺失,本专利技术说明书公开一种目标人物自动化调查方法与系统,其中引入人工智能方法,通过数据搜集、关键词搜寻、数据分群、人物剖析探勘、聚合、信息提取,以及最终风险评估等步骤,实现自动化目标人物调查的目的,可以解决习知人工处理需要的大量人力资源,并且能快速分析数据得到结果,以大幅度缩减延时。
[0008]根据实施例,所述目标人物自动化调查系统主要分为一前端系统与一后端系统,前端系统包括一前端数据馈入系统,用以前置处理自一个或多个数据源取得的文本数据;一文本前处理分析系统,用以对文本数据进行分词分句以及专名处理;以及一文本数据仓储系统,用以接收经过前端数据馈入系统处理的文本数据以及接收通过文本前处理分析系统处理过的增强数据。而后端系统包括用以处理大量文本数据与智能分析的计算丛集,以
及排程优化系统,排程优化系统针对文本数据与增强数据规划该计算丛集的计算资源,并包括一后端人工智能算法核心,可根据目标人物信息执行人工智能算法,从文本数据中取得与目标人物相关的信息,并判断目标人物的负面属性与风险。
[0009]在目标人物自动化调查系统运行的目标人物自动化调查方法包括,接收调查一目标人物的请求,亦取得目标人物的信息,于是可基于一自然语言处理模型对取得的文本数据进行事件分类与人物分类,取得文本数据中的一个或多个特殊关键词,经比对一个或多个特殊关键词与目标人物信息后,可判断文本数据中与目标人物关联的信息,经确认文本数据中目标人物的信息后,可以一统计推论方法(如贝叶斯统计推论方法)得出目标人物存在负面属性以及发生风险的概率。
[0010]优选地,文本数据将通过前端系统进行优化,包括从各种数据源取得大量的文本数据,探勘文本数据中的特殊关键词,以增强文本数据、进行文本内容清理、进行文本分词,再使用自然语言处理方法分群分类,即在文本数据仓储系统中建立自然语言处理模型。
[0011]进一步地,当进行事件分类时,还包括根据关键词检索文本数据,取得检索后文本后,检索每篇文章特殊关键词,以建立各篇文本的词向量,再执行一分类算法,以能取得事件分类,并集成为事件特殊关键词。
[0012]进一步地,当进行人物分类时,每个事件特殊关键词联结后集成为聚类关键词,据此建立词向量,再执行一分类算法,将相同属性类别文字聚类后,取得个人聚类,实现人物分类,再集成为个人聚类关键词。
[0013]为使能更进一步了解本专利技术的特征及
技术实现思路
,请参阅以下有关本专利技术的详细说明与图式,然而所提供的图式仅用于提供参考与说明,并非用来对本专利技术加以限制。
附图说明
[0014]图1显示为目标人物自动化调查系统的架构实施例图;
[0015]图2显示目标人物自动化调查系统的前端系统架构实施例示意图;
[0016]图3显示目标人物自动化调查系统中前端系统的前端数据馈入系统实施例功能方块图;
[0017]图4显示目标人物自动化调查系统中前端系统的文本前处理分析系统实施例功能方块图;
[0018]图5显示目标人物自动化调查系统中前端系统的文本数据仓储系统实施例功能方块图;
[0019]图6显示目标人物自动化调查系统的后端系统架构实施例示意图;
[0020]图7显示目标人物自动化调查系统中后端系统的后端人工智能算法核心一实施例功能方块图;
[0021]图8显示目标人物自动化调查系统中后端系统的后端人工智能算法核心二实施例功能方块图;
[0022]图9显示目标人物自动化调查系统中后端系统的后端人工智能算法核心三实施例功能方块图;
[0023]图10显示目标人物自动化调查方法的实施例流程图;
[0024]图11显示目标人物自动化调查方法中事件分类的流程实施例图;
[0025]图12显示目标人物自动化调查方法中个人聚类的流程实施例图;以及
[0026]图13显示目标人物自动化调查方法流程实施例图。
具体实施方式
[0027]本专利技术关于一种目标人物自动化调查方法与系统,通过人工智能的机器学习方法实现自然语言处理(natural language processing,NLP),特别可以利用各式公开信息,如新闻与外部公开数据,对一目标人物进行身分调查。举例来说,目标人物自动化调查方法与系统可应用在协助银行或其他机构查询分析以确认客户的身份,通过各种公开信息取得目标人物的负面消息,如犯罪记录,据此可以评估目标人物的风险属性,可用于洗钱防制、阻绝金融诈骗等用途。
[0028]所提出的目标人物自动化调查系统的架构实施例图可参考图1显示的示意图,图中显示有一目标人物自动化调查系统100,可以为任何形式的计算机系统所实现的工作站主机或云端服务器,其中通过计算机系统中的处理器11、内存12、联机网络与处理网络封包的网络单元13以及储存各种文本数据与记录的数据库14等相互电性连接的硬件组件,加上执行各种功能的软件程序,两者协本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种目标人物自动化调查方法,其特征在于,所述目标人物自动化调查方法包括:接收调查一目标人物的请求,并取得该目标人物的信息;基于一自然语言处理模型,根据该目标人物的信息,对取得的文本数据进行事件分类与人物分类,取得该文本数据中的一个或多个特殊关键词;比对该一个或多个特殊关键词与目标人物信息,判断该文本数据中与该目标人物关联的信息;以及经确认该文本数据中该目标人物的信息,以一统计推论方法,得出该目标人物存在负面属性以及发生风险的概率。2.根据权利要求1所述的目标人物自动化调查方法,其特征在于,所述文本数据通过一前端系统进行优化,包括从各种数据源取得大量的文本数据,探勘该文本数据中的特殊关键词,以增强文本数据、进行文本内容清理、进行文本分词,再使用自然语言处理方法分群分类,即在文本数据仓储系统中建立该自然语言处理模型。3.根据权利要求1所述的目标人物自动化调查方法,其特征在于,在进行该事件分类的步骤中,还包括根据关键词检索该文本数据,取得检索后的文本后,检索每篇文章特殊关键词,以建立各篇文本的词向量,再执行一分类算法,以能取得事件分类,并集成为事件特殊关键词。4.根据权利要求1所述的目标人物自动化调查方法,其特征在于,在进行该人物分类的步骤中,每个事件特殊关键词联结后集成为聚类关键词,据此建立词向量,再执行一分类算法,将相同属性类别文字聚类后,取得个人聚类,实现该人物分类,再集成为个人聚类关键词。5.根据权利要求1所述的目标人物自动化调查方法,其特征在于,以一贝叶斯统计推论方法实作该统计推论方法,得出该目标人物存在负面属性以及发生风险的概率。6.根据权利要求1至5中任一项所述的目标人物自动化调查方法,其特征在于,所述文本数据包括实时汇入的数据以及批量汇入的数据,再经格式整合与验证数据正确性后,进行一文本前处理分析。7.根据权利要求6所述的目标人物自动化调查方法,其特征在于,所述文本前处理分析包括执行分段分句,其中:引入各种领域中的文本模板,以取得该文本数据中的关键内容;对特定数据源或是特定语言的格式模板进行模糊比对,以进行分段与分句;以及统一文本格式。8.根据权利要求7所述的目标人物自动化调查方法,其特征在于,所述文本前处理分析还进行分词与专名处理,其中:对该文本数据执行自然语言处理与语法分析,根据领域词典与专名词典,取得关键内容,并进行分词。9.一种目标人物自动化调查系统,其特征在于,所述目标人物自动化调查系统包括:一前端系统,其中包括一前端数据馈入...

【专利技术属性】
技术研发人员:简嘉宏徐嘉泰苏文信张淑仪程昱翔张宇宏邱奕安苏庭仪傅心玮黄承光吴君勉
申请(专利权)人:鼎新电脑股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1