【技术实现步骤摘要】
一种基于短文本特征提取的风控处理方法及设备
[0001]本申请涉及信息安全防护
,尤其涉及一种基于短文本特征提取的风控处理方法及设备。
技术介绍
[0002]风险控制(风控)是指风险管理者采用各种措施和方法,消灭或减少风险事件发生的各种可能性,或风险控制者减少风险事件发生时造成的损失。但是,总会有些事情是不能控制的,风险总是存在的。作为管理者会采取各种措施减小风险事件发生的可能性,或者把可能的损失控制在一定的范围内,以避免在风险事件发生时带来的难以承担的损失。
[0003]目前,互联网的发展,带动了经济的迅速发展,同时也给风控带来了巨大挑战。互联网大数据时代的到来,使得每个人所能够掌握的信息存在严重的不对称现象,人们在线上进行的活动、业务等,往往存在各种风险。在线上聊天过程中,双方都不能确定是否是本人正在与自己聊天,而进行转账或私密文件传输或私密信息交互时,为了确认对方是否本人往往需要进行电话或者视频通话的方式。但是,在一些不方便的场景下,对方可能不能进行电话或视频通话,这样的增加了信息传输的风险。
[0004]基于此,亟需一种能够在线上聊天过程中,对聊天内容的风控处理方法,通过识别对方身份,提高聊天中双方的信息交换的安全性。
技术实现思路
[0005]本申请实施例提供了一种基于短文本特征提取的风控处理方法及设备,用于解决线上聊天的信息交互存在风险,线上聊天的安全性低的技术问题。
[0006]一方面,本申请提供了一种基于短文本特征提取的风控处理方法,该方法包括:获取风控主 ...
【技术保护点】
【技术特征摘要】
1.一种基于短文本特征提取的风控处理方法,其特征在于,所述方法包括:获取风控主体的待处理短文本;将所述待处理短文本输入预设的短文本识别模型,确定所述待处理短文本的第一意图;确定所述风控主体的若干待测信息;其中,所述待测信息来自所述风控主体发表的动态、历史聊天记录;根据预设的用户画像模型以及各所述待测信息,生成所述风控主体所对应的用户画像数据;根据所述用户画像数据、各所述待测信息以及所述短文本识别模型,确定所述风控主体的若干第二意图;将所述第一意图与各所述第二意图进行匹配,以确定所述第一意图是否存在匹配度大于第一预设阈值的所述第二意图;若存在,根据各所述待测信息中的短文本,生成所述待处理短文本相应的风控聊天短文本;其中,所述风控聊天短文本用于表达所述第一意图;将所述风控聊天短文本与所述待处理短文本进行比对,以根据所述风控聊天短文本与所述待处理短文本的比对结果,确定所述风控主体是否为风险用户。2.根据权利要求1所述方法,其特征在于,确定所述风控主体的若干第二意图,具体包括:将各所述待测信息进行分词处理,并确定分词处理后的各所述待测信息中的第一关键词;确定各所述待测信息中所述第一关键词相应的共现邻接词;其中,所述共现邻接词为各所述待测信息中所述第一关键词以外的关键词;根据各所述第一关键词及其所述共现邻接词,生成若干关键词三元组;其中,所述关键词三元组由一个所述第一关键词及其相应的两个所述共现邻接词,在各所述待测信息中的两两之间的共现次数组成;根据各所述关键词三元组,生成若干主题词语集;其中,所述主题词语集包括所述第一关键词相应的各所述关键词三元组中,两个所述共现邻接词组成的词对;基于所述待测信息中的词语在所述主题词语集的词对共现次数,确定所述待测信息的主题分布概率;根据所述主题分布概率,确定所述待测信息的主题标签,以通过各所述主题标签,生成若干第一待定意图,以根据各所述第一待定意图及所述用户画像数据,确定若干所述第二意图。3.根据权利要求1所述方法,其特征在于,根据所述用户画像数据、各所述待测信息以及所述短文本识别模型,确定所述风控主体的若干第二意图,具体包括:通过所述短文本识别模型,确定所述用户画像数据相应的若干第二待定意图;其中,所述短文本识别模型为预先训练好的用于语义意图识别的神经网络模型;基于预设意图类型库以及所述第二待定意图,确定所述风控主体的若干所述第二意图。4.根据权利要求1所述方法,其特征在于,所述方法应用于预先搭建的区块链平台,所
述风控主体对应于所述区块链平台的任一节点;确定所述风控主体的若干待测信息,具体包括:确定所述风控主体在所述区块链平台的主体账户;通过所述区块链平台中的第三方节点,获取所述主体账户的若干待测信息;其中,所述待测信息至少包括以下一项或多项:发表文章摘要、网站评论、聊天记录;确定所述风控主体是否为风险用户之后,所述方法还包括:将所述风控聊天短文本与所述待处理短文本比对结果,发送至所述区块链平台的第三方节点;接收所述第三方节点基于所述比对结果生成的反馈信息;其中,所述反馈信息包括:短信、语音;确定所述反馈信息是否为可信比对结果,以确定所述比对结果的可信度;其中,所述可信度用于确定所述风控主体是否为风险用户。5.根据权利要求1所述方法,其特征在于,根据预设的用户画像模型以及各所述待测信息,生成所述风控主体所对应的用户画像数据之前,所述方法还包括:通过互联网爬取技术,获取所述待处理短文本的来源平台的若干用户特征数据;其中,所述用户特征数据包括:用户评论、发表文章、发表动态;或者,通过预设特征样本库,确定若干用户特征数据;将所述用户特征数据进行短文本特征提取,并将短文本特征提取后的所述用户特征数据输入所述用户画像模型,对所述用户...
【专利技术属性】
技术研发人员:周维浩,
申请(专利权)人:杭银消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。