语音识别方法及装置、存储介质、计算设备制造方法及图纸

技术编号:22848332 阅读:26 留言:0更新日期:2019-12-17 23:09
一种语音识别方法及装置、存储介质、计算设备,所述语音识别方法包括:从一组语音数据中提取情绪特征向量,并将所述一组语音数据转换为文本数据;基于所述情绪特征向量和所述文本数据,训练得到情绪检测模型,所述情绪检测模型用于计算情绪得分;基于待检测语音数据和所述情绪检测模型,计算所述待检测语音数据的情绪得分;基于所述情绪得分判断所述待检测语音数据是否具有违规风险。本发明专利技术提供的技术方案可以高效、准确地完成语音数据的检测,提高违规语音检出率。

【技术实现步骤摘要】
语音识别方法及装置、存储介质、计算设备
本专利技术涉及语音检测
,具体地涉及一种语音识别方法及装置、存储介质、计算设备。
技术介绍
随着通信技术的发展,呼叫中心每天都会产生海量的电话录音文件。在开展对话内容质检工作时,传统质检方法可以采用人工抽查方式,随机抽查少量电话录音文件,以判断客服人员的对话内容是否违规。但是,传统质检方法效率较低,无法逐个排查每一电话录音文件,难以及时通过录音文件发现客服人员的工作质量。
技术实现思路
本专利技术解决的技术问题是如何高效、准确识别违规语音。为解决上述技术问题,本专利技术实施例提供一种语音识别方法,包括:从一组语音数据中提取情绪特征向量,并将所述一组语音数据转换为文本数据;基于所述情绪特征向量和所述文本数据,训练得到情绪检测模型,所述情绪检测模型用于计算情绪得分;基于待检测语音数据和所述情绪检测模型,计算所述待检测语音数据的情绪得分;基于所述情绪得分判断所述待检测语音数据是否具有违规风险。可选的,所述基于所述情绪得分判断所述待检测语音数据是否具有违规风险包括:当所述情绪得分高于预设阈值时,确定所述待检测语音数据具有违规风险。可选的,所述语音识别方法还包括:对具有违规风险的待检测语音数据做标记。可选的,所述基于所述情绪特征向量和所述文本数据,训练得到情绪检测模型包括:基于所述情绪特征向量和所述文本数据,采用神经网络算法训练得到所述情绪检测模型。可选的,所述基于所述特征向量和所述文本数据,训练得到情绪检测模型包括:基于所述情绪特征向量和所述文本数据,采用逻辑回归算法训练得到所述情绪检测模型。可选的,所述情绪特征向量用于表示情绪类型,所述情绪类型选自:高兴、悲伤、愤怒、害怕、厌恶。可选的,所述将所述一组语音数据转换为文本数据包括:采用语音转文本技术,将所述语音数据转换为所述文本数据。可选的,所述语音数据包括第一角色的语音数据和第二角色的语音数据,所述从一组语音数据中提取情绪特征向量,并将所述一组语音数据转换为文本数据包括:对所述一组语音数据中的第一角色的语音数据和第二角色的语音数据进行区分,以得到所述第一角色的语音数据和第二角色的语音数据;提取所述第一角色的语音数据和第二角色的语音数据各自的情绪特征向量,并将所述第一角色的语音数据和第二角色的语音数据各自转换为文本数据。为解决上述技术问题,本专利技术实施例还提供一种语音识别装置,包括:提取模块,用于从一组语音数据中提取情绪特征向量,并将所述一组语音数据转换为文本数据;训练模块,基于所述情绪特征向量和所述文本数据,训练得到情绪检测模型,所述情绪检测模型用于计算情绪得分;计算模块,基于待检测语音数据和所述情绪检测模型,计算所述待检测语音数据的情绪得分;判断模块,基于所述情绪得分判断所述待检测语音数据是否具有违规风险。为解决上述技术问题,本专利技术实施例还提供一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述方法的步骤。为解决上述技术问题,本专利技术实施例还提供一种计算设备,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述方法的步骤。与现有技术相比,本专利技术实施例的技术方案具有以下有益效果:本专利技术实施例提供一种语音识别方法,包括:从一组语音数据中提取情绪特征向量,并将所述一组语音数据转换为文本数据;基于所述情绪特征向量和所述文本数据,训练得到情绪检测模型,所述情绪检测模型用于计算情绪得分;基于待检测语音数据和所述情绪检测模型,计算所述待检测语音数据的情绪得分;基于所述情绪得分判断所述待检测语音数据是否具有违规风险。本专利技术实施例通过将语音数据提取的情绪特征向量和文本数据作为输入数据,训练得到情绪检测模型。由于存在大量的语音数据可以作为训练模型的输入数据,因而可以发挥统计优势,通过训练方法得到准确度很高的情绪检测模型。基于该准确度很高的情绪检测模型确定待检测语音数据,可以更加高效、准确地完成语音数据的检测,提高违规语音检出率。进一步,本专利技术实施例适用于海量语音检测,可以扩展语音检测场景。进一步,所述基于所述情绪特征向量和所述文本数据,训练得到情绪检测模型包括:基于所述情绪特征向量和所述文本数据,采用神经网络算法训练得到所述情绪检测模型。本专利技术实施例采用神经网络模型作为所述情绪检测模型,可以借助神经网络的优势,训练出准确度较高的情绪检测模型,进一步有利于提高违规语音检出率。附图说明图1是本专利技术实施例的一种语音识别方法的流程示意图;图2是本专利技术实施例的一种典型场景下的语音识别方法的流程示意图;图3是本专利技术实施例的一种语音识别方法的流程示意图。具体实施方式如
技术介绍
所言,现有技术采用人工抽检方式查找违规语音,效率低。本申请专利技术人经研究发现,现有技术中,还可以采用如下步骤确定语音数据是否是违规语音:首先,将待检测语音数据转换为文本数据,并提取所述待检测语音数据的情绪特征向量;其次,根据情绪特征向量确定语音特征,并查找转换得到的文本数据中是否包含预设关键字;之后,结合所述语音特征和预设关键字,综合确定所述音频数据是否为违规语音数据。然而,采用现有技术方案分析海量电话录音文件中的每一电话录音,无法获取统计违规语音数据的共性信息,准确度低。本专利技术实施例提供一种语音识别方法,包括:从一组语音数据中提取情绪特征向量,并将所述一组语音数据转换为文本数据;基于所述情绪特征向量和所述文本数据,训练得到情绪检测模型,所述情绪检测模型用于计算情绪得分;基于待检测语音数据和所述情绪检测模型,计算所述待检测语音数据的情绪得分;基于所述情绪得分判断所述待检测语音数据是否具有违规风险。本专利技术实施例通过将语音数据提取的情绪特征向量和文本数据作为输入数据,训练得到情绪检测模型。由于存在大量的语音数据可以作为训练模型的输入数据,因而可以发挥统计优势,通过训练方法得到准确度很高的情绪检测模型。基于该准确度很高的情绪检测模型确定待检测语音数据,可以更加高效、准确地完成语音数据的检测,提高违规语音检出率。进一步,本专利技术实施例适用于海量语音检测,可以扩展语音检测场景。为使本专利技术的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本专利技术的具体实施例做详细的说明。图1是本专利技术实施例的一种语音识别方法的流程示意图。所述语音识别方法可以由计算设备,例如服务器、个人终端等执行。具体而言,所述语音识别方法可以包括以下步骤:步骤S101,从一组语音数据中提取情绪特征向量,并将所述一组语音数据转换为文本数据;步骤S102,基于所述情绪特征向量和所述文本数据,训练得到情绪检测模型,所述情绪检测模型用于计算情绪得分;步骤S103,基于待检测语音数据和所述情绪检测模型,计算所述待检测语音数据的情绪得分;步骤S104,基于所述情绪得分判断所述待检测语音数据是否具有违规风险。更具体而言,可以将呼叫中心的每本文档来自技高网
...

【技术保护点】
1.一种语音识别方法,其特征在于,包括:/n从一组语音数据中提取情绪特征向量,并将所述一组语音数据转换为文本数据;/n基于所述情绪特征向量和所述文本数据,训练得到情绪检测模型,所述情绪检测模型用于计算情绪得分;/n基于待检测语音数据和所述情绪检测模型,计算所述待检测语音数据的情绪得分;/n基于所述情绪得分判断所述待检测语音数据是否具有违规风险。/n

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:
从一组语音数据中提取情绪特征向量,并将所述一组语音数据转换为文本数据;
基于所述情绪特征向量和所述文本数据,训练得到情绪检测模型,所述情绪检测模型用于计算情绪得分;
基于待检测语音数据和所述情绪检测模型,计算所述待检测语音数据的情绪得分;
基于所述情绪得分判断所述待检测语音数据是否具有违规风险。


2.根据权利要求1所述的语音识别方法,其特征在于,所述基于所述情绪得分判断所述待检测语音数据是否具有违规风险包括:
当所述情绪得分高于预设阈值时,确定所述待检测语音数据具有违规风险。


3.根据权利要求2所述的语音识别方法,其特征在于,还包括:
对具有违规风险的待检测语音数据做标记。


4.根据权利要求1至3任一项所述的语音识别方法,其特征在于,所述基于所述情绪特征向量和所述文本数据,训练得到情绪检测模型包括:
基于所述情绪特征向量和所述文本数据,采用神经网络算法训练得到所述情绪检测模型。


5.根据权利要求1至3任一项所述的语音识别方法,其特征在于,所述基于所述情绪特征向量和所述文本数据,训练得到情绪检测模型包括:
基于所述特征向量和所述文本数据,采用逻辑回归算法训练得到所述情绪检测模型。


6.根据权利要求1至3任一项所述的语音识别方法,其特征在于,所述情绪特征向量用于表示情绪类型,所述情绪类型选自:高兴、悲伤、愤怒、害怕、厌恶。


7.根据权利要求1至3任一项所...

【专利技术属性】
技术研发人员:李君浩邹婷婷顾少丰
申请(专利权)人:上海上湖信息技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1