用于语音信息的情感倾向性确定方法及系统技术方案

技术编号:28379869 阅读:39 留言:0更新日期:2021-05-08 00:07
本发明专利技术实施例提供一种用于语音信息的情感倾向性确定方法。该方法包括:基于情感词典对语音信息的识别文本进行情感倾向分析,确定识别文本情感倾向的情感值;根据语音信息的音频信号的韵律特征进行情感分析,确定多个情绪类型各自的评分;基于情感倾向的情感值以及与情感倾向对应情绪类型的评分确定混合情感分析结果,以确定语音信息的情感倾向性。本发明专利技术实施例还提供一种用于语音信息的情感倾向性确定系统。本发明专利技术实施例提升情感倾向性判断的准确率,有助于结合用户情绪及时做到情绪安抚,同时为后期的语音运营提供重要参考。

【技术实现步骤摘要】
用于语音信息的情感倾向性确定方法及系统
本专利技术涉及智能语音领域,尤其涉及一种用于语音信息的情感倾向性确定方法及系统。
技术介绍
通过确定用户的情感倾向,可以有助于针对用户提供合适的信息。在情感分析中,通常是通过机器学习或者语义规则的方式进行文本挖掘,从而判断文本的情感倾向性,另一类是从音频入手,通过提取音频典型特征来判断语音情感倾向性。主流的情感分析方法是从文本入手。一类是通过利用机器学习的方法。首先对文本数据进行预处理,再将文本进行向量化表示。接着构建情感分类模型,最后依据分类模型进行文本情感极性分析。其常见方法有最大信息熵、朴素贝叶斯、支持向量机等。另一类是采用语义规则的方式进行分析,通过提取文本中关键的情感词,并结合相关修饰词,从篇、章、段、句、词等多维度来分析文本整体的情感倾向。另一种情感分析方法是从音频信号入手。首先需要对音频进行预处理,主要包括:端点检测、预加重、加窗分帧,再提取音频的韵律特征、音质特征、基于谱的特征、非线性特征等,最后综合考虑以上特征对音频进行情感分类。在实现本专利技术过程中,专利技术人发现相关技术中至少存在如下问题:1、基于文本的情感分析方法,主要研究对象是微博,评论此类的短文本或法律公文等长文本,并非完全适用于语音音频转写出的超短文本。仅考虑了语言学层面传递的情感信息,忽略了音频带来的附加情绪信息,基于文本的情感研究本身已足够复杂,且长短文本已覆盖主流应用场景,从而市面上对实际家庭语音环境下音频转文字的超短文本研究甚少,更不会综合考虑音频信息进行情感分析。2、基于音频信号的情感分析方法,会受到发音人地域、语言、年龄、教育背景,以及音频本身等多方面影响,对人的几种基本情感混杂情况也无法处理,另外,仅参照音频信号,对于忧伤和厌恶,愤怒和惊奇等暂时还没有很好的办法能准确区分。因此,音频信号更适合用来进行辅助情感分析。其缺陷为研究该领域长期以来的难点。首先,音频信息特征提取方法有限,主要围绕韵律特征展开研究;其次,客观因素导致用于研究的音频无法标准化,例如:发音人地域、语言、年龄等各因素,导致以此入手的各类研究结果差异较大;最后,现实生活中人的情绪表达微妙,部分情感即使是人也难以分辨,例如:忧伤和厌恶,愤怒和惊奇。
技术实现思路
为了至少解决现有技术中的情感倾向性的方法无法适用于语音音频转写出的超短文本、忽略了音频带来的附加情绪信息、对于部分情绪无法准确的区分的问题。第一方面,本专利技术实施例提供一种用于语音信息的情感倾向性确定方法,包括:基于情感词典对语音信息的识别文本进行情感倾向分析,确定所述识别文本情感倾向的情感值;根据所述语音信息的音频信号的韵律特征进行情感分析,确定多个情绪类型各自的评分;基于所述情感倾向的情感值以及与所述情感倾向对应情绪类型的评分确定混合情感分析结果,以确定所述语音信息的情感倾向性。第二方面,本专利技术实施例提供一种用于语音信息的情感倾向性确定系统,包括:情感倾向确定程序模块,用于基于情感词典对语音信息的识别文本进行情感倾向分析,确定所述识别文本情感倾向的情感值;情绪确定程序模块,用于根据所述语音信息的音频信号的韵律特征进行情感分析,确定多个情绪类型各自的评分;倾向性确定程序模块,用于基于所述情感倾向的情感值以及与所述情感倾向对应情绪类型的评分确定混合情感分析结果,以确定所述语音信息的情感倾向性。第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例的用于语音信息的情感倾向性确定方法的步骤。第四方面,本专利技术实施例提供一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本专利技术任一实施例的用于语音信息的情感倾向性确定方法的步骤。本专利技术实施例的有益效果在于:提升情感倾向性判断的准确率,有助于结合用户情绪及时做到情绪安抚,同时为后期的语音运营提供重要参考。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例提供的一种用于语音信息的情感倾向性确定方法的流程图;图2是本专利技术一实施例提供的一种用于语音信息的情感倾向性确定方法的试验数据图;图3是本专利技术一实施例提供的一种用于语音信息的情感倾向性确定方法的整体流程图;图4是本专利技术一实施例提供的一种用于语音信息的情感倾向性确定系统的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示为本专利技术一实施例提供的一种用于语音信息的情感倾向性确定方法的流程图,包括如下步骤:S11:基于情感词典对语音信息的识别文本进行情感倾向分析,确定所述识别文本情感倾向的情感值;S12:根据所述语音信息的音频信号的韵律特征进行情感分析,确定多个情绪类型各自的评分;S13:基于所述情感倾向的情感值以及与所述情感倾向对应情绪类型的评分确定混合情感分析结果,以确定所述语音信息的情感倾向性。在本实施方式中,发现当前主流的文本内容的情感分析方法,主要局限在微博、评论等短文本或小说、公文等长文本,对语音识别后的超短文本并不完全适用。另外,该文本分析方法仅考虑了语言学层面传递的情感信息,忽略了音频带来的附加情绪信息。另一类基于音频信号的情感分析方法,不仅会受到发音人地域、语言、年龄等因素的限制,且现有的音频信息分析方法也较为局限。因此,本方法考虑将两种方法进行融合。对于步骤S11,确定语音信息的情感倾向性需要从其对应的识别文本和语音信号两个方面进行判断。根据情感词典进行识别文本的情感倾向性分析。首先,要构建基础情感词典。本方法需要构建的基础情感词典包括:正面/负面情感词词典、转折词词典、程度副词词典、否定词词典。作为一种实施方式,在本实施例中,在所述基于情感词典对语音信息的识别文本进行情感倾向分析之前,所述方法包括:对所述语音信息进行预处理,确定所述语音信息的音频信号;对所述音频信号进行自动语音识别,得到所述语音信息的识别文本。所述正面情感词词典、负面情感词词典由基础情感词典确定,包括:通过中文情感极性词典以及同义词词典对所述基础情感词典扩充;对扩充后的基础情感词典中的正面情感词、负面情感词合并去重,得到本文档来自技高网
...

【技术保护点】
1.一种用于语音信息的情感倾向性确定方法,包括:/n基于情感词典对语音信息的识别文本进行情感倾向分析,确定所述识别文本情感倾向的情感值;/n根据所述语音信息的音频信号的韵律特征进行情感分析,确定多个情绪类型各自的评分;/n基于所述情感倾向的情感值以及与所述情感倾向对应情绪类型的评分确定混合情感分析结果,以确定所述语音信息的情感倾向性。/n

【技术特征摘要】
1.一种用于语音信息的情感倾向性确定方法,包括:
基于情感词典对语音信息的识别文本进行情感倾向分析,确定所述识别文本情感倾向的情感值;
根据所述语音信息的音频信号的韵律特征进行情感分析,确定多个情绪类型各自的评分;
基于所述情感倾向的情感值以及与所述情感倾向对应情绪类型的评分确定混合情感分析结果,以确定所述语音信息的情感倾向性。


2.根据权利要求1所述的方法,其中,所述情绪类型包括:愤怒、喜悦、平静;
所述根据所述语音信息的音频信号的韵律特征进行情感分析,确定多个情绪类型各自的评分包括:
通过分类器对所述音频信号的韵律特征进行情感分类,得到情感分类结果Cp(m),其中,所述m对应于各情绪类型的评分。


3.根据权利要求2所述的方法,其中,所述基于所述情感倾向的情感值以及与所述情感倾向对应情绪类型的评分确定混合情感分析结果包括:
当所述识别文本情感倾向为正面情感时,将喜悦情绪类型的评分与所述识别文本情感倾向的情感值w相结合,得到混合情感分析结果;
当所述识别文本情感倾向为负面情感时,将愤怒情绪类型的评分与所述识别文本情感倾向的情感值w相结合,得到混合情感分析结果。


4.根据权利要求1所述的方法,其中,在所述基于情感词典对语音信息的识别文本进行情感倾向分析之前,所述方法包括:
对所述语音信息进行预处理,确定所述语音信息的音频信号;
对所述音频信号进行自动语音识别,得到所述语音信息的识别文本。


5.根据权利要求1所述的方法,其中,所述情感词典至少包括:正面情感词词典、负面情感词词典;
所述确定所述识别文本情感倾向的情感值包括:
当所述识别文本至少包括情感词时,所述情感值其中,所述N为情感词数量,所述P为各情感词对应的情感值,所述j为预设参数。


6.根据权利要求5所述的方法,其中,所述情感词典至少还包括:否定词词典;
所述确定所述识别文本情感倾向的情感值包括:
当所述识别文本至少包括情感词和否定词时,所述情感值其中,所述k为否定词的个数。


7.根据权利要求5所述的方法,其中,所述情感词典至少还包括:程度副词词典;
所述确定所述识别文本情感倾向的情感值包括:
当所述识别文本至少包括情感词和程度副词时,所述情感值其中,所述d为所述程度副词对应的预设权重。

...

【专利技术属性】
技术研发人员:张钰
申请(专利权)人:苏州思必驰信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1