情绪智能识别方法、装置及计算机可读存储介质制造方法及图纸

技术编号:24358041 阅读:56 留言:0更新日期:2020-06-03 02:59
本发明专利技术涉及一种人工智能技术,揭露了一种情绪智能识别方法,包括:获取用户的语音数据集,将所述语音数据集转换为文本数据集;通过预设的清洗规则对所述文本数据集中的字符进行删除、替换以及增强操作后得到标准文本数据集;对所述标准文本数据集进行文本信息特征提取,得到文本序列向量集;将所述文本序列向量集输入至预先构建的情绪识别模型中计算所述文本序列向量集对应的情绪状态的概率分布集,并利用最大分值算法计算出所述情绪状态的概率分布集中的最大化情绪状态,根据所述最大化情绪状态识别所述用户的情绪。本发明专利技术还提出一种情绪智能识别装置以及一种计算机可读存储介质。本发明专利技术实现了用户情绪的识别。

Method, device and computer readable storage medium of emotion intelligent recognition

【技术实现步骤摘要】
情绪智能识别方法、装置及计算机可读存储介质
本专利技术涉及人工智能
,尤其涉及一种情绪智能识别方法、装置及计算机可读存储介质。
技术介绍
基于文本的自然语言处理(NaturalLanguageProcessing,简称NLP)的相关技术有了飞速发展,尤其是基于深度学习的端到端的模型在某些领域均已超过了人类的水平。为了能够充分利用自然语言处理的相关技术,如句法分析、语义分析、篇章分析、文本分类等,智能客服等方面需要将电话语音经过ASR技术转换成相应的文本数据。但是在ASR进行语音信息转换成文本的过程中可能会受到语音质量的影响,因为存在噪音、语速过快、方言等导致转换出来的文本信息会包含错字、少字、字或词重复的问题。此外,由于用户在与客服沟通的过程中表现的各类情绪,如正面情绪、负面情绪、中性情绪经常是不平衡,进一步加剧了深度学习模型的识别难度。
技术实现思路
本专利技术提供一种情绪智能识别方法、装置及计算机可读存储介质,其主要目的在于提供一种根据用户的语音数据识别用户情绪的方案。为实现上述目的,本专利技术提供的一种情绪智能识别方法,包括:获取用户的语音数据集,将所述语音数据集转换为文本数据集;通过预设的清洗规则对所述文本数据集中的字符进行删除、替换以及增强操作后得到标准文本数据集;对所述标准文本数据集进行文本信息特征提取,得到文本序列向量集;将所述文本序列向量集输入至预先构建的情绪识别模型中计算所述文本序列向量集对应的情绪状态的概率分布集,并利用最大分值算法计算出所述情绪状态的概率分布集中的最大化情绪状态,根据所述最大化情绪状态识别所述用户的情绪。可选地,所述将所述语音数据集转换为文本数据集包括:对所述语音数据集进行预加重和加窗分帧处理,得到标准语音数据集;通过预先构建的损失函数计算出所述标准语音数据集的域间损失,利用随机梯度算法计算所述域间损失的最优参数,根据所述最优参数对所述标准语音数据集进行更新操作后得到最优语音数据集;通过回归算法将所述最优语音数据集转换为对应的文本数据集。可选地,所述回归算法包括:其中,xj表示输出文本数据,xk表示文本数据输出方式,k表示文数据的总量,e表示无限不循环小数。可选地,所述文本序列向量集对应的情绪状态的概率分布集的计算方法包括:其中,p(y|Wd)表示情绪状态概率,S(Wd,y)表示情绪状态的输出分值矩阵,y表示情绪状态的文本序列,Wd表示包含字序列以及上下文信息的词表示,YWd代表文本序列y对应的所有可能情绪类别,e表示无限不循环小数。可选地,所述最大分值算法包括:其中,y*表示目标文本序列集的概率分布集中的最大化情绪状态。此外,为实现上述目的,本专利技术还提供一种情绪智能识别装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的情绪智能识别程序,所述情绪智能识别程序被所述处理器执行时实现如下步骤:获取用户的语音数据集,将所述语音数据集转换为文本数据集;通过预设的清洗规则对所述文本数据集中的字符进行删除、替换以及增强操作后得到标准文本数据集;对所述标准文本数据集进行文本信息特征提取,得到文本序列向量集;将所述文本序列向量集输入至预先构建的情绪识别模型中计算所述文本序列向量集对应的情绪状态的概率分布集,并利用最大分值算法计算出所述情绪状态的概率分布集中的最大化情绪状态,根据所述最大化情绪状态识别所述用户的情绪。可选地,所述将所述语音数据集转换为文本数据集包括:对所述语音数据集进行预加重和加窗分帧处理,得到标准语音数据集;通过预先构建的损失函数计算出所述标准语音数据集的域间损失,利用随机梯度算法计算所述域间损失的最优参数,根据所述最优参数对所述标准语音数据集进行更新操作后得到最优语音数据集;通过回归算法将所述最优语音数据集转换为对应的文本数据集。可选地,所述回归算法包括:其中,xj表示输出文本数据,xk表示文本数据输出方式,k表示文数据的总量,e表示无限不循环小数。可选地,所述文本序列向量集对应的情绪状态的概率分布集的计算方法包括:其中,p(y|Wd)表示情绪状态概率,S(Wd,y)表示情绪状态的输出分值矩阵,y表示情绪状态的文本序列,Wd表示包含字序列以及上下文信息的词表示,YWd代表文本序列y对应的所有可能情绪类别,e表示无限不循环小数。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有情绪智能识别程序,所述情绪智能识别程序可被一个或者多个处理器执行,以实现如上所述的情绪智能识别方法的步骤。本专利技术提出的情绪智能识别方法、装置及计算机可读存储介质,获取用户的语音数据集,对语音数据集进行清洗处理从而可以消除语音数据中由于存在噪音、语速过快、方言等导致转换出来的文本信息包含错字、少字、字或词重复的问题;进一步地,本专利技术利用预先构建的情绪识别模型识别用户当时的情绪,从而为进一步减轻语音识别的难度。附图说明图1为本专利技术一实施例提供的情绪智能识别方法的流程示意图;图2为本专利技术一实施例提供的情绪智能识别装置的内部结构示意图;图3为本专利技术一实施例提供的情绪智能识别装置中情绪智能识别程序的模块示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术提供一种情绪智能识别方法。参照图1所示,为本专利技术一实施例提供的情绪智能识别方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。在本实施例中,情绪智能识别方法包括:S1、获取用户的语音数据集,将所述语音数据集转换成文本数据。本专利技术较佳实施例中,所述用户的语音数据集通过从企业的人工客服与用户进行通话时进行获取得到。进一步地,本专利技术利用自动语音识别技术(AutomaticSpeechRecognition,ASR)将所述语音数据集转换成文本数据。所述ASR由一个编码器和两个解码器组成,用于提取语音数据和文本数据之间的共同域间特征,同时学习不成对的语音数据和文本数据。由于语音和文本是不同的数据类型,语音是连续向量的序列,而文本是离散符号的序列,此外,语音的长度比自动语音识别中的文本长度长,因此,本专利技术在所述编码器的输入层使用嵌入层g(·)进行文本输入,将连续向量表示g(y)转换为字符y的离散id。进一步地,本专利技术将所述语音数据集输入金字塔双向长短期记忆网络f(·)中,以缩短语音数据长度。在所述ASR语音转换器的编码-解码器网络中,文本数据的自动编码不仅可以增强文本数据的中间表示,还可以在本专利技术规范这些表示形式时增强语音数据的中间表示,使语音和文本数据的中间域表示在训练期间彼此更加相似。较佳地,本专利技术本文档来自技高网...

【技术保护点】
1.一种情绪智能识别方法,其特征在于,所述方法包括:/n获取用户的语音数据集,将所述语音数据集转换为文本数据集;/n通过预设的清洗规则对所述文本数据集中的字符进行删除、替换以及增强操作后得到标准文本数据集;/n对所述标准文本数据集进行文本信息特征提取,得到文本序列向量集;/n将所述文本序列向量集输入至预先构建的情绪识别模型中计算所述文本序列向量集对应的情绪状态的概率分布集,并利用最大分值算法计算出所述情绪状态的概率分布集中的最大化情绪状态,根据所述最大化情绪状态识别所述用户的情绪。/n

【技术特征摘要】
1.一种情绪智能识别方法,其特征在于,所述方法包括:
获取用户的语音数据集,将所述语音数据集转换为文本数据集;
通过预设的清洗规则对所述文本数据集中的字符进行删除、替换以及增强操作后得到标准文本数据集;
对所述标准文本数据集进行文本信息特征提取,得到文本序列向量集;
将所述文本序列向量集输入至预先构建的情绪识别模型中计算所述文本序列向量集对应的情绪状态的概率分布集,并利用最大分值算法计算出所述情绪状态的概率分布集中的最大化情绪状态,根据所述最大化情绪状态识别所述用户的情绪。


2.如权利要求1所述的情绪智能识别方法,其特征在于,所述将所述语音数据集转换为文本数据集包括:
对所述语音数据集进行预加重和加窗分帧处理,得到标准语音数据集;
通过预先构建的损失函数计算出所述标准语音数据集的域间损失,利用随机梯度算法计算所述域间损失的最优参数,根据所述最优参数对所述标准语音数据集进行更新操作后得到最优语音数据集;
通过回归算法将所述最优语音数据集转换为对应的文本数据集。


3.如权利要求2所述的情绪智能识别方法,其特征在于,所述回归算法包括:



其中,xj表示输出文本数据,xk表示文本数据输出方式,k表示文数据的总量,e表示无限不循环小数。


4.如权利要求1至3中任意一项所述的情绪智能识别方法,其特征在于,所述文本序列向量集对应的情绪状态的概率分布集的计算方法包括:



其中,p(y|Wd)表示情绪状态概率,S(Wd,y)表示情绪状态的输出分值矩阵,y表示情绪状态的文本序列,Wd表示包含字序列以及上下文信息的词表示,YWd代表文本序列y对应的所有可能情绪类别,e表示无限不循环小数。


5.如权利要求4所述的情绪智能识别方法,其特征在于,所述最大分值算法包括:



其中,y*表示目标文本序列集的概率分布集中的最大化情绪状态。


6.一种情绪智能识别装置,其特征在于,所述装置包括存储器和处理器,所述...

【专利技术属性】
技术研发人员:蒋江涛马骏王少军
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1