感情推测系统以及计算机可读介质技术方案

技术编号:23151331 阅读:30 留言:0更新日期:2020-01-18 14:19
本发明专利技术提供一种感情推测系统以及计算机可读介质,基于说话语音的说话者感情推测技术,其处理负载小,难以受到杂音等的影响,且精度高。本发明专利技术感情推测系统包括:特征量提取部,对所收录的说话语音进行分析,以提取预定的特征量;元音区间确定部,基于由特征量提取部所提取的特征量来确定发出元音的区间;以及感情推测部,基于由元音区间确定部所确定的元音区间的特征量来推测说话者的感情。

Emotion speculation system and computer-readable medium

【技术实现步骤摘要】
感情推测系统以及计算机可读介质
本专利技术涉及一种感情推测系统以及存储程序的计算机可读介质。
技术介绍
有根据语音来推测说话者的感情的以往技术。下述专利文献1中,揭示了一种感情推测器生成装置,其包括:分析区间设定部,设定分析区间,所述分析区间是通过对针对成为教学数据源的语音数据进行语音识别处理的结果进行词素分析处理及强调词提取处理,来分析语音数据的特征量的区间;强调类型决定部,将分析区间内所含的语音数据的特征量有变化的图形,基于分类为多个等级(class)的变化图形,而决定为分析区间内所含的语音数据的特征量变化图形;以及感情推测器生成部,将对应于每种特征量变化图形而分类的语音数据作为教学数据,对应于每种特征量变化图形,生成对说出语音时的说话者的感情进行推测的感情推测器。而且,下述专利文献2中揭示了一种感情识别装置,其包括:特征性音色检测部件,从输入语音中检测与特定感情关联的特征性音色;语音识别部件,基于由特征性音色检测部件所检测的特征性音色,来识别输入语音中所含的音韵的种类;特征性音色发生指标计算部件,基于由语音识别部件所识别出的音韵的种类,针对每种音韵而计算表示特征性音色的发生难易的特征性音色发生指标;以及感情判定部件,基于特征性音色发生指标越小则感情越强的规则,根据由特征性音色发生指标计算部件所计算出的特征性音色发生指标,来判定发出特征性音色的音韵中的、输入语音说话者的感情,并且所述感情识别装置根据输入语音来识别所述输入语音说话者的感情。现有技术文献专利文献专利文献1:日本专利特开2017-111760号公报专利文献2:日本专利第4085130号公报
技术实现思路
专利技术所要解决的问题在对针对语音进行语音识别处理的结果进行分析而推测说话者的感情时,因进行语音识别处理造成的负载大。而且,容易受到杂音等的影响,感情推测精度低。本专利技术的目的在于提供一种基于说话语音的说话者感情推测技术,与基于语音识别的结果来推测说话者感情的结构相比,处理负载小,难以受到杂音等的影响,且精度高。解决问题的技术手段技术方案1的本专利技术是一种感情推测系统,包括:特征量提取部件,对所收录的说话语音进行分析,以提取预定的特征量;元音区间确定部件,基于由所述特征量提取部件所提取的所述特征量来确定发出元音的区间;以及推测部件,基于由所述元音区间确定部件所确定的元音区间的所述特征量来推测说话者的感情。技术方案2的本专利技术是根据技术方案1所述的感情推测系统,其中,所述推测部件参照元音分类概率数据库,求出由所述元音区间确定部件所确定的元音区间的特征量图形符合各个所述感情种类的概率,所述元音分类概率数据库关于各元音而记录有预定的每种感情种类的特征量图形。技术方案3的本专利技术是根据技术方案2所述的感情推测系统,其中,所述推测部件将由所述元音区间确定部件所确定的元音区间分割为多个帧,关于每个所述帧的特征量图形,参照所述元音分类概率数据库来求出符合各个所述感情种类的概率,并基于所获得的每帧的所述概率,来确定所述元音区间所符合的感情种类。技术方案4的本专利技术是根据技术方案3所述的感情推测系统,还包括:元音分类概率数据库更新部件,将所述元音区间内的每个所述帧的特征量图形作为与所述元音区间对应的元音的特征量图形而记录到所述元音分类概率数据库中。技术方案5的本专利技术是根据技术方案1所述的感情推测系统,其中,所述推测部件针对由所述元音区间确定部件所确定的每个元音区间,根据所述元音区间的特征量来推测所述元音区间内的说话者的感情,参照转变概率数据库,求出对所述说话语音中所含的多个元音区间的各个推测的元音间的感情转变概率,所述转变概率数据库针对每种元音组合而记录有从一个元音区间内的感情向另一个元音区间的感情的转变概率,基于每个所述元音区间的感情推测结果及各元音区间之间的感情转变概率,确定所述说话语音整体内的说话者的感情。技术方案6的本专利技术是根据技术方案5所述的感情推测系统,还包括:转变概率数据库更新部件,基于由所述推测部件所获得的、所述说话语音中所含的各元音间的感情转变概率,对相符的元音间的感情转变概率进行更新。技术方案7的本专利技术是一种存储程序的计算机可读介质,所述程序由计算机(computer)来读取并执行,所述程序的特征在于,使所述计算机作为下述部件发挥功能,即:特征量提取部件,对所收录的说话语音进行分析,以提取预定的特征量;元音区间确定部件,基于由所述特征量提取部件所提取的所述特征量来确定发出元音的区间;以及推测部件,基于由所述元音区间确定部件所确定的元音区间的所述特征量来推测说话者的感情。专利技术的效果根据技术方案1的专利技术,能够提供一种基于说话语音的说话者感情推测技术,与基于语音识别的结果来推测说话者感情的结构相比,处理负载小,难以受到杂音等的影响,且精度高。根据技术方案2的专利技术,通过利用特征量图形的匹配(matching)来进行推测,从而与使用语音识别的推测相比,能够减少处理负载。根据技术方案3的专利技术,通过对元音区间进行细分化而加以判断,从而与针对通过语音识别所获得的每个元音进行推测的结构相比,能够提高精度。根据技术方案4的专利技术,与仅使用预先准备的数据库的数据来进行处理的结构相比,能够使用户的说话中的特征反映到数据库中,从而能够提高推测的精度。根据技术方案5的专利技术,与仅使用每个元音区间的推测结果来进行语音整体的感情推测的结构相比,能够抑制在每个元音区间的推测结果中出现的突发性变化等的影响,从而能够提高推测的精度。根据技术方案6的专利技术,与仅使用预先准备的数据库的数据来进行处理的结构相比,能够使用户的说话中的特征反映到数据库中,从而能够提高推测的精度。根据技术方案7的专利技术,能够提供一种基于说话语音的说话者感情推测技术,其在安装有本专利技术的程序的计算机中,与基于语音识别的结果来推测说话者感情的结构相比,处理负载小,难以受到杂音等的影响,且精度高。附图说明图1是表示本实施方式的感情推测系统的整体结构的图。图2是表示特征量提取部对语音帧的设定例的图。图3A及图3B是表示元音区间的确定处理的图,图3A是表示确定元音区间的起点及终点的情况的图,图3B是表示确定元音区间并标注ID的情况的图。图4是表示第1共振峰(formant)及第2共振峰的频率与日语元音的关系的图。图5是表示元音区间的感情推测处理的图。图6是表示元音区间之间的状态转变分析处理的图。图7是表示感情推测系统的动作的流程图。图8是表示被用作感情推测系统的计算机的硬件(hardware)结构例的图。符号的说明10:语音获取部20:特征量提取部30:元音区间特定部40:感情推测部41:元音分类感情推测部42:元音间状态转变分析部本文档来自技高网
...

【技术保护点】
1.一种感情推测系统,其特征在于,包括:/n特征量提取部件,对所收录的说话语音进行分析,以提取预定的特征量;/n元音区间确定部件,基于由所述特征量提取部件所提取的所述特征量来确定发出元音的区间;以及/n推测部件,基于由所述元音区间确定部件所确定的元音区间的所述特征量来推测说话者的感情。/n

【技术特征摘要】
20180709 JP 2018-1299281.一种感情推测系统,其特征在于,包括:
特征量提取部件,对所收录的说话语音进行分析,以提取预定的特征量;
元音区间确定部件,基于由所述特征量提取部件所提取的所述特征量来确定发出元音的区间;以及
推测部件,基于由所述元音区间确定部件所确定的元音区间的所述特征量来推测说话者的感情。


2.根据权利要求1所述的感情推测系统,其特征在于,
所述推测部件参照针对各元音而记录有预定的每种感情种类的特征量图形的元音分类概率数据库,而求出由所述元音区间确定部件所确定的所述元音区间的特征量图形符合各个所述感情种类的概率。


3.根据权利要求2所述的感情推测系统,其特征在于,
所述推测部件将由所述元音区间确定部件所确定的所述元音区间分割为多个帧,关于每个所述帧的特征量图形,参照所述元音分类概率数据库来求出符合各个所述感情种类的所述概率,并基于所获得的每个所述帧的所述概率,来确定所述元音区间所符合的感情种类。


4.根据权利要求3所述的感情推测系统,其特征在于,还包括:
元音分类概率数据库更新部件,将所述元音区间内的每个所述帧的特征量图形作为与所述元音区间对应的元音的特征量图形而记录到所述元音分...

【专利技术属性】
技术研发人员:罗旋
申请(专利权)人:富士施乐株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1