一种待发布文本的风险检测方法、装置及设备制造方法及图纸

技术编号:26531026 阅读:28 留言:0更新日期:2020-12-01 14:11
本说明书实施例公开了一种待发布文本的风险检测方法、装置及设备,涉及合规领域,所述方法包括:确定待发布的金融产品的宣传文本的业务场景信息;根据所述业务场景信息,确定预设的适用于所述宣传文本的第一风险检测规则和第二风险检测规则;根据所述第一风险检测规则对所述宣传文本进行敏感词汇检测,生成第一检测结果;根据所述第二风险检测规则对所述宣传文本进行必要信息检测,生成第二检测结果;根据所述第一检测结果和第二检测结果生成风险提示信息,所述风险提示信息用于提示所述宣传文本存在的合规风险。

【技术实现步骤摘要】
一种待发布文本的风险检测方法、装置及设备
本说明书实施例涉及合规和计算机
,尤其涉及一种待发布文本的风险检测方法、装置及设备。
技术介绍
文本合规性检查是指自动判断待检查文本是否符合相关规章制度的规定。例如,金融保险行业是一种文字密集型行业,许多产品条款都要遵从相关监管机构发布的相关法律或者法规等的规定,否则就会因为违反相关规定面临严重后果。只有符合相关规定的宣传文本才可以进行发布。通常通过人工方式完成对金融文本的合规性检查,以判断该金融本是否符合相关规定。但是,通过人工方式进行合规性检查,不仅准确率低(检查者无法同时熟知各种规章制度),而且效率差(待检查文本过多),耗时耗力。
技术实现思路
本说明书实施例提供一种待发布文本的风险检测方法、装置及设备,以解决现有的方法存在的人工进行合规检测效率低的问题。为解决上述技术问题,本说明书实施例是这样实现的:第一方面,本说明书实施例提供的一种待发布文本的风险检测方法,包括:确定待发布的金融产品的宣传文本的业务场景信息;根据所述业务场景信息本文档来自技高网...

【技术保护点】
1.一种待发布文本的风险检测方法,包括:/n确定待发布的金融产品的宣传文本的业务场景信息;/n根据所述业务场景信息,确定预设的适用于所述宣传文本的第一风险检测规则和第二风险检测规则;/n根据所述第一风险检测规则对所述宣传文本进行敏感词汇检测,生成第一检测结果;/n根据所述第二风险检测规则对所述宣传文本进行必要信息检测,生成第二检测结果;/n根据所述第一检测结果和第二检测结果生成风险提示信息,所述风险提示信息用于提示所述宣传文本存在的合规风险。/n

【技术特征摘要】
1.一种待发布文本的风险检测方法,包括:
确定待发布的金融产品的宣传文本的业务场景信息;
根据所述业务场景信息,确定预设的适用于所述宣传文本的第一风险检测规则和第二风险检测规则;
根据所述第一风险检测规则对所述宣传文本进行敏感词汇检测,生成第一检测结果;
根据所述第二风险检测规则对所述宣传文本进行必要信息检测,生成第二检测结果;
根据所述第一检测结果和第二检测结果生成风险提示信息,所述风险提示信息用于提示所述宣传文本存在的合规风险。


2.如权利要求1所述的方法,在所述确定待发布的金融产品的宣传文本的业务场景信息之前,还包括:
根据业务场景,配置适用于所述业务场景的至少一条风险检测规则;
将所述至少一条风险检测规则与用于表示所述业务场景的业务场景信息对应存储。


3.如权利要求2所述的方法,所述根据业务场景,配置适用于所述业务场景的至少一条风险检测规则,具体包括:
对于配置一条风险检测规则:
选定至少一个规则算子;所述规则算子包括基于正则表达式模型的算子或基于关键词模型的算子;
基于所述至少一个规则算子,确定所述风险检测规则;所述风险检测规则为一个规则算子,或者,为由至少一个规则算子以及逻辑运算符构成逻辑表达式。


4.如权利要求1所述的方法,所述确定待发布的金融产品的宣传文本的业务场景信息,具体包括:
基于所述宣传文本的文本内容确定所述宣传文本的摘要信息;
确定所述摘要信息对应的业务场景信息,所述业务场景包括:保险业务、基金业务、投资业务、股票业务或贷款业务。


5.如权利要求1所述的方法,当所述风险提示信息表示所述宣传文本不存在合规风险时,在所述业务场景信息表示的业务场景中发布所述宣传文本。


6.如权利要求1所述的方法,所述根据所述第一风险检测规则对所述宣传文本进行敏感词汇检测,生成第一检测结果,具体包括:
确定所述第一风险检测规则对应的敏感词汇库;
判断所述宣传文本中是否包括所述敏感词汇库中的任一词汇,得到第一判断结果;
当所述第一判断结果为是,确定所述宣传文本中包含的位于所述敏感词汇词库中的敏感词汇,构成敏感词汇集合;
根据所述敏感词汇集合生成第一检测结果,所述第一检测结果用于表示所述宣传文本包含所述敏感词汇集合中的敏感词汇。


7.如权利要求6所述的方法,在所述根据所述敏感词汇集合生成第一检测结果之前,还包括:
针对所述敏感词汇集合中的一个敏感词汇,确定所述敏感词汇在所述宣传文本中的位置信息;
将所述位置信息与所述敏感词汇对应存储于所述敏感词汇集合,其中,所述第一检测结果包括所述敏感词汇在所述宣传文本中的位置信息。


8.如权利要求6所述的方法,所述敏感词汇库中的敏感词汇包括:不符合实际的宣传用语、误导性词汇、权威引荐性词汇、预测性词汇和暗示性词汇中的至少一种。


9.如权利要求1所述的方法,所述根据所述第二风险检测规则对所述宣传文本进行必要提示信息的检测,生成第二检测结果,具体包括:
确定所述第二风险检测规则对应的必要信息类型库;
判断所述宣传文本中是否缺少所述必要信息类型库中任一类型对应的信息,得到第二判断结果;
当所述第二判断结果为是,确定所述宣传文本中缺少的属于所述必要信息类型库中的任一类型的信息,构成信息类型集合;
根据所述信息类型集合生成第二检测结果,所述第二检测结果表示所述宣传文本缺少所述信息类型集合中任一类型对应的信息。


10.如权利要求9所述的方法,所述方法还包括:
当所述第二判断结果为否,确定所述宣传文本中属于所述必要信息类型库中的任一类型的各信息;
对于所述各信息中的任一信息,确定所述任一信息在所述宣传文本中的位置信息和所述任一信息的字体信息;
根据所述位置信息和所述字体信息判断任一信息是否位于突出位置,得到第三判断结果;
若所述第三判断结果为否,根据所述任意信息、所述位置信息和所述字体信息生成第二检查结果,所述第二检测结果表示所述宣传文本中的所述任一信息的设置不符合规定。


11.如权利要求9所述的方法,所述必要信息类型库中的类型信息包括:风险提示类型信息、用户数据授权提示类型信息和用于支持业绩的数据类型信息中的至少一种。


12.如权利要求1所述的方法,所述方法还包括:
获取对所述宣传文本的人工复检结果;
将所述人工复检结果和所述风险提示信息进行对比,生成对比结果;
根据所述对比结果调整所述第一风险检测规则和所述第二风险检测规则。


13.一种待发布文本的风险检测装置,包括:
业务场景信息确定模块,用于确定待发布的金融产品的宣传文本的业务场景信息;
风险检测规则确定模块,用于根据所述业务场景信息,确定预设的适用于所述宣传文本的第一风险检测规则和第二风险检测规则;
第一检测结果生成模块,用于根据所述第一风险检测规则对所述宣传文本进行敏感词汇检测,生成第一检测结果;
第二检测结果生成模块,用于根据所述第二风险检测规则对所述宣传文本进行必要信息检测,生成第二检测结果;
风险提示信息生成模块,用于根据所述第一检测结果和第二检测结果生成风险提示信息,所述风险提示信息用于提示所述宣传文本存在的合规风险。


14.如权利要求13所述的装置,所述装置...

【专利技术属性】
技术研发人员:马振
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1