情绪智能识别方法、装置及计算机可读存储介质制造方法及图纸

技术编号：24358041 阅读：56 留言：0更新日期：2020-06-03 02:59

本发明专利技术涉及一种人工智能技术，揭露了一种情绪智能识别方法，包括：获取用户的语音数据集，将所述语音数据集转换为文本数据集；通过预设的清洗规则对所述文本数据集中的字符进行删除、替换以及增强操作后得到标准文本数据集；对所述标准文本数据集进行文本信息特征提取，得到文本序列向量集；将所述文本序列向量集输入至预先构建的情绪识别模型中计算所述文本序列向量集对应的情绪状态的概率分布集，并利用最大分值算法计算出所述情绪状态的概率分布集中的最大化情绪状态，根据所述最大化情绪状态识别所述用户的情绪。本发明专利技术还提出一种情绪智能识别装置以及一种计算机可读存储介质。本发明专利技术实现了用户情绪的识别。

Method, device and computer readable storage medium of emotion intelligent recognition

全部详细技术资料下载

【技术实现步骤摘要】
情绪智能识别方法、装置及计算机可读存储介质
本专利技术涉及人工智能
，尤其涉及一种情绪智能识别方法、装置及计算机可读存储介质。
技术介绍
基于文本的自然语言处理(NaturalLanguageProcessing，简称NLP)的相关技术有了飞速发展，尤其是基于深度学习的端到端的模型在某些领域均已超过了人类的水平。为了能够充分利用自然语言处理的相关技术，如句法分析、语义分析、篇章分析、文本分类等，智能客服等方面需要将电话语音经过ASR技术转换成相应的文本数据。但是在ASR进行语音信息转换成文本的过程中可能会受到语音质量的影响，因为存在噪音、语速过快、方言等导致转换出来的文本信息会包含错字、少字、字或词重复的问题。此外，由于用户在与客服沟通的过程中表现的各类情绪，如正面情绪、负面情绪、中性情绪经常是不平衡，进一步加剧了深度学习模型的识别难度。
技术实现思路
本专利技术提供一种情绪智能识别方法、装置及计算机可读存储介质，其主要目的在于提供一种根据用户的语音数据识别用户情绪的方案。为实现上述目的，本专利技术提供的一种情绪智能识别方法，包括：获取用户的语音数据集，将所述语音数据集转换为文本数据集；通过预设的清洗规则对所述文本数据集中的字符进行删除、替换以及增强操作后得到标准文本数据集；对所述标准文本数据集进行文本信息特征提取，得到文本序列向量集；将所述文本序列向量集输入至预先构建的情绪识别模型中计算所述文本序列向量集对应的情绪状态的概率分布集，并利用最大分值算法...

【技术保护点】
1.一种情绪智能识别方法，其特征在于，所述方法包括：/n获取用户的语音数据集，将所述语音数据集转换为文本数据集；/n通过预设的清洗规则对所述文本数据集中的字符进行删除、替换以及增强操作后得到标准文本数据集；/n对所述标准文本数据集进行文本信息特征提取，得到文本序列向量集；/n将所述文本序列向量集输入至预先构建的情绪识别模型中计算所述文本序列向量集对应的情绪状态的概率分布集，并利用最大分值算法计算出所述情绪状态的概率分布集中的最大化情绪状态，根据所述最大化情绪状态识别所述用户的情绪。/n

【技术特征摘要】
1.一种情绪智能识别方法，其特征在于，所述方法包括：
获取用户的语音数据集，将所述语音数据集转换为文本数据集；
通过预设的清洗规则对所述文本数据集中的字符进行删除、替换以及增强操作后得到标准文本数据集；
对所述标准文本数据集进行文本信息特征提取，得到文本序列向量集；
将所述文本序列向量集输入至预先构建的情绪识别模型中计算所述文本序列向量集对应的情绪状态的概率分布集，并利用最大分值算法计算出所述情绪状态的概率分布集中的最大化情绪状态，根据所述最大化情绪状态识别所述用户的情绪。

2.如权利要求1所述的情绪智能识别方法，其特征在于，所述将所述语音数据集转换为文本数据集包括：
对所述语音数据集进行预加重和加窗分帧处理，得到标准语音数据集；
通过预先构建的损失函数计算出所述标准语音数据集的域间损失，利用随机梯度算法计算所述域间损失的最优参数，根据所述最优参数对所述标准语音数据集进行更新操作后得到最优语音数据集；
通过回归算法将所述最优语音数据集转换为对应的文本数据集。

3.如权利要求2所述的情绪智能识别方法，其特征在于，所述回归算法包括：

其中，xj表示输出文本数据，xk表示文本数据输出方式，k表示文数据的总量，e表示无限不循环小数。

4.如权利要求1至3中任意一项所述的情绪智能识别方法，其特征在于，所述文本序列向量集对应的情绪状态的概率分布集的计算方法包括：

其中，p(y|Wd)表示情绪状态概率，S(Wd，y)表示情绪状态的输出分值矩阵，y表示情绪状态的文本序列，Wd表示包含字序列以及上下文信息的词表示，YWd代表文本序列y对应的所有可能情绪类别，e表示无限不循环小数。

5.如权利要求4所述的情绪智能识别方法，其特征在于，所述最大分值算法包括：

其中，y*表示目标文本序列集的概率分布集中的最大化情绪状态。

6.一种情绪智能识别装置，其特征在于，所述装置包括存储器和处理器，所述...

【专利技术属性】
技术研发人员：蒋江涛，马骏，王少军，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人