一种风险识别方法及装置制造方法及图纸

技术编号:14399246 阅读:150 留言:0更新日期:2017-01-11 12:34
本申请公开了一种风险识别方法,包括:根据当前业务操作的属性信息,获取与所述当前业务操作相关的文本沟通信息;从所述文本沟通信息中提取特征词语,生成词语向量集;利用根据历史文本沟通信息建立的分类模型,确定所述词语向量集的风险类别;根据所述词语向量集的风险类别,识别所述当前业务操作是否存在风险。本申请同时提供一种风险识别装置。上述方法,提供了一种识别业务操作风险的新思路:根据与当前业务操作相关的文本沟通信息进行风险识别,从而可以高效地识别出可能存在风险的业务操作,并为后续风险控制环节提供有力的参考。

【技术实现步骤摘要】

本申请涉及风险控制领域,具体涉及一种风险识别方法及装置
技术介绍
随着互联网技术的发展,基于互联网的各种业务操作越来越多,其中大部分用户的操作行为都是正常的,然而也存在少量黑客或者恶意用户盗用他人账户、或者盗刷卡等欺诈行为,针对这种情况,风险控制已经成为了业务操作过程不可或缺的一个重要环节。通过风险控制,一方面可以通过对风险的提前识别避免欺诈行为的发生,另一方面可以对存在风险的业务操作做出及时的处理,避免合法用户遭受损失、或者尽可能减少损失。现有技术的风险控制通常是在对大量的、各类数据进行分析的基础上展开的,例如,采集与业务操作相关的用户标识、业务操作类型、业务操作时间、业务操作涉及的客体(例如商品)信息等数据,然后基于各种历史操作数据、社交数据、风险数据、黑名单数据等,对业务操作进行全规则覆盖分析和/或采用设定的模型进行打分评估,并根据分析结果和/或打分结果,辨识业务操作中可能存在的风险。对于在网络环境下发起的每个业务操作都采用上述方式进行识别,从而从大量业务操作中识别出可能存在风险的业务操作,并采取进一步的风险控制措施。通过上面的描述可以看出,传统的风险控制方式为了从大量的业务操作中识别出少量的、个别的风险操作,需要以大量的、种类繁多的数据为基础,对所有业务操作逐一地进行风险规则分析和/或模型算法计算,处理过程耗时、处理效率低下,在业务操作数量较多的一些网络业务系统中,上述风险控制方式已经难以满足线上的实时应用需求。
技术实现思路
本申请实施例描述的一种风险识别方法及装置,提供了一种识别业务操作风险的新思路:根据业务操作的文本沟通信息识别业务操作是否存在风险,从而为高效实施风险控制提供便利,安全性高。本申请提供一种风险识别方法,包括:根据当前业务操作的属性信息,获取与所述当前业务操作相关的文本沟通信息;从所述文本沟通信息中提取特征词语,生成词语向量集;利用根据历史文本沟通信息建立的分类模型,确定所述词语向量集的风险类别;根据所述词语向量集的风险类别,识别所述当前业务操作是否存在风险。可选的,所述当前业务操作的属性信息包括以下所列之一或者任意组合:业务操作标识、业务操作涉及的客体标识、执行业务操作的用户标识。可选的,所述利用根据历史文本沟通信息建立的分类模型,确定所述词语向量集的风险类别,包括:以所述词语向量集为输入,采用风险识别分类器识别所述词语向量集的风险类别,所述风险识别分类器为根据历史文本沟通信息构建的机器分类模型。可选的,所述风险识别分类器包括:基于朴素贝叶斯算法的风险识别分类器;所述以所述词语向量集为输入,采用风险识别分类器识别所述词语向量集的风险类别,包括:针对每种风险类别,根据预先训练风险识别分类器得到的所述风险类别的先验概率、以及在所述风险类别条件下出现所述词语向量集中各词语的条件概率,计算在所述词语向量集出现的条件下对应所述风险类别的后验概率;从计算得到的后验概率中选择最大值,所述最大值对应的风险类别即为所述词语向量集的风险类别。可选的,在从所述文本沟通信息中提取词语之前,执行下述操作:对所述文本沟通信息进行预处理,以便于执行后续的识别操作。可选的,所述对所述文本沟通信息进行预处理包括:从所述文本沟通信息中删除预先设定的无效信息;判断执行上述删除操作后的文本沟通信息是否为空,若是,将所述文本沟通信息标识为:无沟通信息,并结束本方法的执行;若否,则执行下述操作:从所述文本沟通信息中提取预先设定的参与沟通的其中一方录入的信息;并将提取的信息作为执行后续操作所采用的文本沟通信息。可选的,所述词语向量集的风险类别包括:正常沟通信息、或异常沟通信息;所述根据所述词语向量集的风险类别,识别所述当前业务操作是否存在风险,包括:当所述词语向量集的风险类别为正常沟通信息时,识别所述当前业务操作不存在风险;或者,当所述词语向量集的风险类别为异常沟通信息时,识别所述当前业务操作存在风险。可选的,在识别所述当前业务操作是否存在风险之后,执行下述操作:判断所述获取的文本沟通信息中是否存在未得到答复的询问信息;若是,根据所述当前业务操作的风险识别结果和预先设定的提醒策略确定是否需要提醒,并在需要时向被询问方推送相应的提醒信息。可选的,所述方法还包括:根据所述当前业务操作的风险识别结果,选择相应的策略实施风险控制。可选的,所述根据所述当前业务操作的风险识别结果,选择相应的策略实施风险控制包括:根据所述当前业务操作的风险识别结果,采用逐一处理或者抽样处理的方式进行风险控制。可选的,在识别所述当前业务操作是否存在风险之后,执行下述操作:识别所述文本沟通信息的内容类别;所述根据所述当前业务操作的风险识别结果,选择相应的策略实施风险控制包括:根据所述当前业务操作的风险识别结果以及所述内容类别,选择相应的策略实施风险控制。相应的,本申请还提供一种风险识别装置,包括:文本沟通信息获取单元,用于根据当前业务操作的属性信息,获取与所述当前业务操作相关的文本沟通信息;词语提取单元,用于从所述文本沟通信息获取单元获取的文本沟通信息中提取特征词语,生成词语向量集;文本风险类别确定单元,用于利用根据历史文本沟通信息建立的分类模型,确定所述词语提取单元生成的词语向量集的风险类别;业务操作风险识别单元,用于根据所述文本风险类别确定单元输出的所述词语向量集的风险类别,识别所述当前业务操所是否存在风险。可选的,所述文本风险类别确定单元具体用于,以所述词语向量集为输入,采用风险识别分类器识别所述词语向量集的风险类别,所述风险识别分类器为根据历史文本沟通信息构建的机器分类模型。可选的,所述文本风险类别确定单元采用的风险识别分类器包括:基于朴素贝叶斯算法的风险识别分类器;所述文本风险类别确定单元包括:后验概率计算子单元,用于针对每种风险类别,根据预先训练风险识别分类器得到的所述风险类别的先验概率、以及在所述风险类别条件下出现所述词语向量集中各词语的条件概率,计算在所述词语向量集出现的条件下对应所述风险类别的后验概率;风险类别确定子单元,用于从计算得到的后验概率中选择最大值,所述最大值对应的风险类别即为所述词语向量集的风险类别。可选的,所述装置还包括:文本预处理单元,用于对所述文本沟通信息获取单元获取的文本沟通信息进行预处理,并在预处理操作后触发所述词语提取单元工作。可选的,所述文本预处理单元包括:无效信息删除子单元,用于从所述文本沟通信息中删除预先设定的无效信息;沟通信息判断子单元,用于判断执行上述删除操作后的文本沟通信息是否为空,若是,将所述文本沟通信息标识为:无沟通信息,并结束本装置的执行;单方录入信息提取子单元,用于当所述沟通信息判断子单元的输出为否时,从所述文本沟通信息中提取预先设定的参与沟通的其中一方录入的信息,并将提取的信息作为执行后续操作所采用的文本沟通信息。可选的,所述装置还包括:询问信息判断单元,用于在所述业务操作风险识别单元完成风险识别操作后,判断所述文本沟通信息获取单元获取的文本沟通信息中是否存在未得到答复的询问信息;提醒信息推送单元,用于当所述询问信息判断单元的输出为是时,根据所述业务操作风险识别单元输出的结果和预先设定的提醒策略确定是否需要提醒,并在需要时向被询问方推送本文档来自技高网...
一种风险识别方法及装置

【技术保护点】
一种风险识别方法,其特征在于,包括:根据当前业务操作的属性信息,获取与所述当前业务操作相关的文本沟通信息;从所述文本沟通信息中提取特征词语,生成词语向量集;利用根据历史文本沟通信息建立的分类模型,确定所述词语向量集的风险类别;根据所述词语向量集的风险类别,识别所述当前业务操作是否存在风险。

【技术特征摘要】
1.一种风险识别方法,其特征在于,包括:根据当前业务操作的属性信息,获取与所述当前业务操作相关的文本沟通信息;从所述文本沟通信息中提取特征词语,生成词语向量集;利用根据历史文本沟通信息建立的分类模型,确定所述词语向量集的风险类别;根据所述词语向量集的风险类别,识别所述当前业务操作是否存在风险。2.根据权利要求1所述的风险识别方法,其特征在于,所述当前业务操作的属性信息包括以下所列之一或者任意组合:业务操作标识、业务操作涉及的客体标识、执行业务操作的用户标识。3.根据权利要求1所述的风险识别方法,其特征在于,所述利用根据历史文本沟通信息建立的分类模型,确定所述词语向量集的风险类别,包括:以所述词语向量集为输入,采用风险识别分类器识别所述词语向量集的风险类别,所述风险识别分类器为根据历史文本沟通信息构建的机器分类模型。4.根据权利要求3所述的风险识别方法,其特征在于,所述风险识别分类器包括:基于朴素贝叶斯算法的风险识别分类器;所述以所述词语向量集为输入,采用风险识别分类器识别所述词语向量集的风险类别,包括:针对每种风险类别,根据预先训练风险识别分类器得到的所述风险类别的先验概率、以及在所述风险类别条件下出现所述词语向量集中各词语的条件概率,计算在所述词语向量集出现的条件下对应所述风险类别的后验概率;从计算得到的后验概率中选择最大值,所述最大值对应的风险类别即为所述词语向量集的风险类别。5.根据权利要求1所述的风险识别方法,其特征在于,在从所述文本沟通信息中提取词语之前,执行下述操作:对所述文本沟通信息进行预处理,以便于执行后续的识别操作。6.根据权利要求5所述的风险识别方法,其特征在于,所述对所述文本沟通信息进行预处理包括:从所述文本沟通信息中删除预先设定的无效信息;判断执行上述删除操作后的文本沟通信息是否为空,若是,将所述文本沟通信息标识为:无沟通信息,并结束本方法的执行;若否,则执行下述操作:从所述文本沟通信息中提取预先设定的参与沟通的其中一方录入的信息;并将提取的信息作为执行后续操作所采用的文本沟通信息。7.根据权利要求1-6任一所述的风险识别方法,其特征在于,所述词语向量集的风险类别包括:正常沟通信息、或异常沟通信息;所述根据所述词语向量集的风险类别,识别所述当前业务操作是否存在风险,包括:当所述词语向量集的风险类别为正常沟通信息时,识别所述当前业务操作不存在风险;或者,当所述词语向量集的风险类别为异常沟通信息时,识别所述当前业务操作存在风险。8.根据权利要求1-6任一所述的风险识别方法,其特征在于,在识别所述当前业务操作是否存在风险之后,执行下述操作:判断所述获取的文本沟通信息中是否存在未得到答复的询问信息;若是,根据所述当前业务操作的风险识别结果和预先设定的提醒策略确定是否需要提醒,并在需要时向被询问方推送相应的提醒信息。9.根据权利要求1-6任一所述的风险识别方法,其特征在于,还包括:根据所述当前业务操作的风险识别结果,选择相应的策略实施风险控制。10.根据权利要求9所述的风险识别方法,其特征在于,所述根据所述当前业务操作的风险识别结果,选择相应的策略实施风险控制包括:根据所述当前业务操作的风险识别结果,采用逐一处理或者抽样处理的方式进行风险控制。11.根据权利要求9所述的风险识别方法,其特征在于,在识别所述当前业务操作是否存在风险之后,执行下述操作:识别所述文本沟通信息的内容类...

【专利技术属性】
技术研发人员:沈雄郝静云
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1