基于实时语音情感分析的非法信息识别方法及装置制造方法及图纸

技术编号:29839372 阅读:19 留言:0更新日期:2021-08-27 14:29
本发明专利技术提供了基于实时语音情感分析的非法信息识别方法及装置,方法包括:从获取的语音原始数据中提取情感特征;将提取的情感特征输入预先训练的鲁棒性情感分析模型中获得语音原始数据的可信度数值;根据可信度数值与预设的第一阈值和第二阈值的大小关系判断语音原始数据是否为非法信息。通过建立鲁棒性情感分析模型,对通话人的语音进行情感分析,对语音的可信度进行打分,如果打分超过预设值时,预设值可以为两道,当低于最低预设值时,可及时引导客户到柜台办理相关业务,通过银行柜员有效防止诈骗事实的发生,本申请对受诈可信度的不同分别提醒引导,能大大降低客户的实际受诈率,保证客户资金安全,提高银行专业可信度。

【技术实现步骤摘要】
基于实时语音情感分析的非法信息识别方法及装置
本申请属于语音情感分析
,具体地讲,涉及一种基于实时语音情感分析的非法信息识别方法及装置。
技术介绍
随着互联网应用和通讯技术的迅速发展,普通个人客户的小额转账大多采用线上方式完成,但是大额转账业务目前仍是以柜台和ATM机办理为主。当前,有非法冒充银行客服电话引诱储户进行转账的诈骗行为,且大多数诈骗者会将受骗人引导至ATM自助转账设备进行转账操作以图躲过银行柜员对受骗人行为的警觉。因此,需要对非法信息进行识别来预防电信诈骗的发生。
技术实现思路
本申请基于实时语音情感分析的非法信息识别方法及装置,以至少解决当前在ATM机办理业务时因电信诈骗而遭受损失的问题。根据本申请的第一个方面,提供了一种基于实时语音情感分析的非法信息识别方法,包括:从获取的语音原始数据中提取情感特征;将提取的情感特征输入预先训练的鲁棒性情感分析模型中获得语音原始数据的可信度数值;根据可信度数值与预设的第一阈值和第二阈值的大小关系判断语音原始数据是否为非法信息。在一实施例中,从获取的语音原始数据中提取情感特征,包括:对获取的语音原始数据中的语音信号进行预加重;对预加重后的语音信号进行分帧处理并提取每一帧的情感特征。在一实施例中,根据可信度数值与预设的第一阈值和第二阈值的大小关系判断语音原始数据是否为非法信息,包括:如果可信度数值高于第一阈值但小于第二阈值,则将语音原始数据划分为疑似非法信息并向用户发出提示;如果可信度数值高于第二阈值,则终止后续业务流程并进行预警。在一实施例中,鲁棒性情感分析模型的训练步骤包括:提取标注后的历史语音数据中的情感特征;将预先分类的情感类别与历史语音数据中的情感特征进行匹配生成情感类别与情感特征之间的映射关系;根据映射关系建立多级网络模型;通过多棵决策树构造随机森林语音识别算法,并利用标注后的历史语音数据对多级网络模型进行训练,获得鲁棒性情感分析模型。在一实施例中,通过多棵决策树构造随机森林语音识别算法,并利用标注后的历史语音数据对多级网络模型进行训练,获得鲁棒性情感分析模型,包括:计算多级网络模型中各个子节点的基尼系数;根据各个子节点的基尼系数计算分裂的基尼系数;根据分裂的基尼系数构建多颗输入样本不同的决策树,通过多颗决策树构建分类判断的随机森林;利用随机森林及标注后的历史语音数据对多级网络模型进行训练,获得鲁棒性情感分析模型。根据本申请的第二个方面,还提供了一种基于实时语音情感分析的非法信息识别装置,包括:情感特征提取单元,用于从获取的语音原始数据中提取情感特征;可信度数值输出单元,用于将提取的情感特征输入预先训练的鲁棒性情感分析模型中获得语音原始数据的可信度数值;非法信息判定单元,用于根据可信度数值与预设的第一阈值和第二阈值的大小关系判断语音原始数据是否为非法信息。在一实施例中,情感特征提取单元包括:预加重模块,用于对获取的语音原始数据中的语音信号进行预加重;分帧模块,用于对预加重后的语音信号进行分帧处理并提取每一帧的情感特征。在一实施例中,非法信息判定单元包括:第一判断模块,用于如果可信度数值高于第一阈值但小于第二阈值,则将语音原始数据划分为疑似非法信息并向用户发出提示;第二判断模块,用于如果可信度数值高于第二阈值,则终止后续业务流程并进行预警。在一实施例中,还包括一鲁棒性情感分析模型的训练装置包括:特征提取单元,用于提取标注后的历史语音数据中的情感特征;映射关系生成单元,用于将预先分类的情感类别与历史语音数据中的情感特征进行匹配生成情感类别与情感特征之间的映射关系;多级网络模型建立单元,用于根据映射关系建立多级网络模型;鲁棒情感分析模型生成单元,用于通过多棵决策树构造随机森林语音识别算法,并利用标注后的历史语音数据对多级网络模型进行训练,获得鲁棒性情感分析模型。在一实施例中,鲁棒情感分析模型生成单元包括:基尼系数计算模块,用于计算多级网络模型中各个子节点的基尼系数;分裂基尼系数计算模块,用于根据各个子节点的基尼系数计算分裂的基尼系数;随机森林建立模块,用于根据分裂的基尼系数构建多颗输入样本不同的决策树,通过多颗决策树构建分类判断的随机森林;训练模块,用于利用随机森林及标注后的历史语音数据对多级网络模型进行训练,获得鲁棒性情感分析模型。根据本申请的第三个方面,还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现基于实时语音情感分析的非法信息识别方法的步骤。根据本申请的第四个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现基于实时语音情感分析的非法信息识别方法的步骤。由上述技术方案可知,本申请提供的一种基于实时语音情感分析的非法信息识别方法及装置,方法包括:从获取的语音原始数据中提取情感特征;将提取的情感特征输入预先训练的鲁棒性情感分析模型中获得语音原始数据的可信度数值;根据可信度数值与预设的第一阈值和第二阈值的大小关系判断语音原始数据是否为非法信息。由于正规的银行客服人员均受过严格的通话情感表达与话术培训,语音的情感比普通人更自然和稳定,而诈骗者在面对受骗人的设问时,较容易出现暂时的迟疑、紧张等情绪,因此通过ATM设备对电话人的语音情感进行分析,可进行初步的可疑诈骗判断。通过建立鲁棒性情感分析模型,对通话人的语音进行情感分析,对语音的可信度进行打分,如果打分超过预设值时,预设值可以为两道,当低于最低预设值时,可及时引导客户到柜台办理相关业务,通过银行柜员有效防止诈骗事实的发生,本申请建立的多级网络模型通过各情感类别及其对应的特征组合,将7种情感类别构建按序分层识别网络,以先区分情感差别明显的大类、后区分情感差别不明显的小类为原则,减小相关性不大的情感类别间的相互干扰,该步骤为使每一类情感类别的特征组合发挥关键作用,采取不同情感类别的特征组合赋予识别权重分数的方法,即特征的重要性进行评分,这样可使每层网络更关键的特征发挥更大的分类作用,提高情感的分类准确率,然后参考语音情感识别领域较为成熟的结论,在网络前两层人为选取先进行情感区分的平静、无聊和恐惧三个类别,选取的原则是该类情感与其余情感差异性更大,这种分类方式将使特征集合减少出现分类误判的情况,从而提高情感识别的分类正确率,得到基于一般语音的有效鲁棒性情感分析模型。采用该模型可以通过有效的语音情感识别方法,对受诈可信度的不同分别提醒引导,能大大降低客户的实际受诈率,保证客户资金安全,提高银行专业可信度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施本文档来自技高网...

【技术保护点】
1.一种基于实时语音情感分析的非法信息识别方法,其特征在于,包括:/n从获取的语音原始数据中提取情感特征;/n将提取的所述情感特征输入预先训练的鲁棒性情感分析模型中获得语音原始数据的可信度数值;/n根据所述可信度数值与预设的第一阈值和第二阈值的大小关系判断所述语音原始数据是否为非法信息。/n

【技术特征摘要】
1.一种基于实时语音情感分析的非法信息识别方法,其特征在于,包括:
从获取的语音原始数据中提取情感特征;
将提取的所述情感特征输入预先训练的鲁棒性情感分析模型中获得语音原始数据的可信度数值;
根据所述可信度数值与预设的第一阈值和第二阈值的大小关系判断所述语音原始数据是否为非法信息。


2.根据权利要求1所述的基于实时语音情感分析的非法信息识别方法,其特征在于,所述从获取的语音原始数据中提取情感特征,包括:
对获取的语音原始数据中的语音信号进行预加重;
对预加重后的语音信号进行分帧处理并提取每一帧的情感特征。


3.根据权利要求2所述的基于实时语音情感分析的非法信息识别方法,其特征在于,所述根据所述可信度数值与预设的第一阈值和第二阈值的大小关系判断所述语音原始数据是否为非法信息,包括:
如果所述可信度数值高于第一阈值但小于第二阈值,则将所述语音原始数据划分为疑似非法信息并向用户发出提示;
如果所述可信度数值高于第二阈值,则终止后续业务流程并进行预警。


4.根据权利要求1至3中任一项所述的基于实时语音情感分析的非法信息识别方法,其特征在于,鲁棒性情感分析模型的训练步骤包括:
提取标注后的历史语音数据中的情感特征;
将预先分类的情感类别与历史语音数据中的情感特征进行匹配生成情感类别与情感特征之间的映射关系;
根据所述映射关系建立多级网络模型;
通过多棵决策树构造随机森林语音识别算法,并利用标注后的历史语音数据对所述多级网络模型进行训练,获得所述鲁棒性情感分析模型。


5.根据权利要求4所述的基于实时语音情感分析的非法信息识别方法,其特征在于,所述通过多棵决策树构造随机森林语音识别算法,并利用标注后的历史语音数据对所述多级网络模型进行训练,获得所述鲁棒性情感分析模型,包括:
计算多级网络模型中各个子节点的基尼系数;
根据各个子节点的基尼系数计算分裂的基尼系数;
根据分裂的基尼系数构建多颗输入样本不同的决策树,通过多颗决策树构建分类判断的随机森林;
利用随机森林及标注后的历史语音数据对所述多级网络模型进行训练,获得所述鲁棒性情感分析模型。


6.一种基于实时语音情感分析的非法信息识别装置,其特征在于,包括:
情感特征提取单元,用于从获取的语音原始数据中提取情感特征;
可信度数值输出单元,用于将提取的所述情感特征输入预先训练的鲁棒性情感分析模型中获得语音原始数据的可信度数值;
非法...

【专利技术属性】
技术研发人员:涂晴宇倪晓平林露丝王玲亚
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1