【技术实现步骤摘要】
风险识别方法、系统、装置、设备和存储介质
[0001]本专利技术涉及人工智能
,尤其涉及一种风险识别方法
、
系统
、
装置
、
设备和存储介质
。
技术介绍
[0002]即时通信
(Instant Messaging
,简称
IM)
工具是一种在用户之间传递即时消息的应用程序,是最流行的互联网通讯工具之一
。
在实际中,用户使用
IM
工具与他人聊天时产生的对话文本中可能包括与违规风险相关的信息,比如不合规的收费信息
、
虚假信息以及欺诈信息等等
。
因此,如何提高对话文本风险识别的准确性就成为一个亟待解决的技术问题
。
技术实现思路
[0003]有鉴于此,本专利技术实施例提供一种风险识别方法
、
系统
、
装置
、
设备和存储介质,用以提高对话文本风险识别的准确性
。
[0004]第一方面,本专利技术实施例提供一种风险识别方法,包括:
[0005]确定潜在风险文本在对话文本中的目标位置;
[0006]以所述目标位置为起点,从所述对话文本中截取预设长度的目标文本,所述目标文本中的其他对话文本在所述潜在风险文本之前产生;
[0007]将包含所述潜在风险文本的所述目标文本以及风险识别文本作为提示信息,输入生成式模型中,以由所述生成式模型确定所述潜在风险文 ...
【技术保护点】
【技术特征摘要】
1.
一种风险识别方法,其特征在于,包括:确定潜在风险文本在对话文本中的目标位置;以所述目标位置为起点,从所述对话文本中截取预设长度的目标文本,所述目标文本中的其他对话文本在所述潜在风险文本之前产生;将包含所述潜在风险文本的所述目标文本以及风险识别文本作为提示信息,输入生成式模型中,以由所述生成式模型确定所述潜在风险文本是否存在风险
。2.
根据权利要求1所述的方法,其特征在于,所述确定潜在风险文本在对话文本中的目标位置,包括:分别对所述对话文本中各条文本进行特征提取;根据所述各条文本各自的特征向量,确定所述对话文本中是否存在潜在风险文本;若存在所述潜在风险文本,则确定所述潜在风险文本的所述目标位置
。3.
根据权利要求1所述的方法,其特征在于,所述确定潜在风险文本在对话文本中的目标位置,包括:将所述对话文本输入第一模型,以由所述第一模型根据所述对话文本中各条文本各自的特征向量,输出所述潜在风险文本的所述目标位置
。4.
根据权利要求1所述的方法,其特征在于,所述以所述目标位置为起点,从所述对话文本中截取预设长度的目标文本,包括:按照对话主题将所述对话文本划分为至少一个对话段;以所述目标位置为起点,按照预设长度从所述潜在风险文本所属的目标对话段中截取所述目标文本
。5.
根据权利要求4所述的方法,其特征在于,所述方法还包括:若所述目标对话段的长度小于所述预设长度,则将所述目标对话段确定为所述目标文本
。6.
根据权利要求1所述的方法,其特征在于,所述以所述目标位置为起点,从所述对话文本中截取预设长度的目标文本,包括:将所述对话文本
、
所述目标位置以及所述预设长度输入第二模型,以由所述第二模型将所述对话文本划分为至少一个对话段,并输出以所述目标位置为起点,按照所述预设长度从所述潜在风险文本所属的目标对话段中截取出的所述目标文本
。7.
根据权利要求6所述的方法,其特征在于,所述方法还包括:获取训练对话文本
、
风险文本在所述训练对话文本中训练位置,以及所述训练对话文本中包含所述风险文本的参考文本;将所述训练对话文本
、
所述训练位置以及预设长度输入所述第二模型,以由所述第二模型输出以所述训练位置为起点,按照所述预设...
【专利技术属性】
技术研发人员:彭飞,
申请(专利权)人:北京五八信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。