【技术实现步骤摘要】
一种增强发言情感的方法、系统、终端及存储介质
[0001]本申请涉及数据处理
,尤其是涉及一种增强发言情感的方法、系统、终端及存储介质。
技术介绍
[0002]当前,很多电信诈骗采用伪装成跟人交友、推荐理财、返利刷单等等话术施行诈骗,对于诈骗意图明显的话术在当前的自然语言分类中已经有了一定的准确性,但是,对于一些伪装性强的话术,自然语言分析模型仍然不能准确进行识别和判断,从而可能出现误判的情况。
技术实现思路
[0003]本申请提供一种增强发言情感的方法、系统、终端及存储介质,具有提高识别诈骗话术的特点。
[0004]本申请目的一是提供一种增强发言情感的方法。
[0005]本申请的上述申请目的一是通过以下技术方案得以实现的:一种增强发言情感的方法,包括:获取目标发言人当前发言数据的初始涉电诈情感分值K,所述目标发言人为不能明确识别当前发言数据的情感的发言人;获取所述目标发言人的历史发言数据的风险分值;计算所述历史发言数据的风险分值的中位数,并根据所述中位数得到历史情感偏向分值T1;以所述 ...
【技术保护点】
【技术特征摘要】
1.一种增强发言情感的方法,其特征在于,包括:获取目标发言人当前发言数据的初始涉电诈情感分值K,所述目标发言人为不能明确识别当前发言数据的情感的发言人;获取所述目标发言人的历史发言数据的风险分值;计算所述历史发言数据的风险分值的中位数,并根据所述中位数得到历史情感偏向分值T1;以所述目标发言人发送当前的发言数据为中心时刻,在时间长度上,以中心时刻向前截取第一指定时间,将在第一指定时间内发言的发言人标记为第一关联发言人;以中心时刻向后截取第二指定时间,将在第二指定时间内发言的发言人标记为第二关联发言人;获取第一关联发言人在第一指定时间内的发言数据的风险分值;获取第二关联发言人在第二指定时间内的发言数据的风险分值;合并第一关联发言人在第一指定时间内的发言数据的风险分值和第二关联发言人在第二指定时间内的发言数据的风险分值,得到第一风险分值序列,计算所述第一风险分值序列中的中位数,并根据所述第一风险分值序列中的中位数得到关联情感偏向分值T2;获取第一关联发言人的历史发言数据的风险分值,并计算第一关联发言人的历史发言数据的风险分值的中位数值;获取第二关联发言人的历史发言数据的风险分值,并计算第二关联发言人的历史发言数据的风险分值的中位数值;合并第一关联发言人的历史发言数据的风险分值的中位数值和第二关联发言人的历史发言数据的风险分值的中位数值,得到第二风险分值序列,计算所述第二风险分值序列中的中位数,并根据所述第二风险分值序列中的中位数得到历史关联情感偏向分值T3;获取预设的第一权重W1、第二权重W2、第三权重W3;计算目标发言人的最终涉电诈情感分值。2.根据权利要求1所述的增强发言情感的方法,其特征在于,所述获取目标发言人当前发言数据的初始涉电诈情感分值K之前,包括:获取训练数据,所述训练数据包括涉电诈发言和不涉电诈发言;采用所述训练数据训练分类模型得到风险分值预测模型;获取待测数据;根据所述待测数据和所述风险分值预测模型得到初始涉电诈情感分值K;获取涉电诈情感分值阈值范围Q;当所述初始涉电诈情感分值K位于所述涉电诈情感分值阈值范围Q中时,将所述待测数据标记为不能明确识别情感的当前发言数据,且将发送所述当前发言数据的发言人标记为目标发言人。3.根据权利要求1所述的增强发言情感的方法,其特征在于,所述计算所述历史发言数据的风险分值的中位数包括:将n项历史发言数据的风险分值按照降序排序或者升序排序的方式进行排列,得到历史分值序列(x1,x2,x3,
…
,x
n
);计算历史分值序列(x1,x2,x3,
…
,x
n
)的中位数,当:
n为奇数时,所述中位数;n为偶数时,所述中位数。4.根据权利要求3所述的增强发言情感的方法,其特征在于,所述根据所述中位数得到历史情感偏向分值T1包括:历史情感偏向分值T1=m1‑
h;所述h为...
【专利技术属性】
技术研发人员:徐涛,吴楠,蒋修强,胡大明,卢小军,王金涛,王方舟,
申请(专利权)人:北京码牛科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。