话语状态确定装置及方法制造方法及图纸

技术编号:14773130 阅读:59 留言:0更新日期:2017-03-09 11:07
本发明专利技术提供了一种话语状态确定装置及方法。该话语状态确定装置包括平均反馈语频率估计单元、反馈语频率计算单元以及确定单元。平均反馈语频率估计单元基于第一讲话者的语音信号和第二讲话者的语音信号来估计平均反馈语频率,该平均反馈语频率表示在从第二讲话者的语音信号的语音开始时间至预定时间的时间段中第二讲话者的反馈语频率。反馈语频率计算单元基于第一讲话者的语音信号和第二讲话者的语音信号来计算每单位时间中第二讲话者的反馈语频率。确定单元基于在平均反馈语频率估计单元中估计的平均反馈语频率和在反馈语频率计算单元中计算的反馈语频率来确定第二讲话者的满意度。

【技术实现步骤摘要】

本文中论述的实施方式涉及一种话语状态确定装置。
技术介绍
作为一种用于估计在语音呼叫中每个讲话者的情绪状态的技术,已知下述一种技术:通过使用讲话者的反馈语反馈的数量来确定讲话者(对方讲话者)是否处于生气状态(作为示例,参见专利文献1)。作为一种用于检测在语音呼叫期间讲话者(对方讲话者)的情绪状态的技术,已知下述一种技术:通过使用反馈语话语的间隔等来检测讲话者是否处于兴奋状态(作为示例,参见专利文献2)。此外,作为一种用于根据语音信号检测反馈语反馈的技术,已知下述一种技术:将语音信号的话语区间与反馈语反馈字典中登记的反馈语数据进行比较,并且将话语区间中的与反馈语数据匹配的区间检测作为反馈语区间(作为示例,参见专利文献3)。此外,作为一种用于记录通过语音呼叫等在两个人之间进行的对话并且在对话结束之后再现所记录的对话(语音呼叫)的数据的技术,已知下述一种技术:根据讲话者的语速来改变再现速度(作为示例,参见专利文献4)。此外,已知元音可以用作讲话者的语音的特征量(作为示例,参见非专利文献1)。专利文献1:日本公开特许公报No.2010-175684专利文献2:日本公开特许公报No.2007-286097专利文献3:日本公开特许公报No.2013-225003专利文献4:日本公开特许公报No.2013-200423非专利文献1:“Onsei(voice)1”,[在线],[于2015年8月29日搜索],互联网<URL:http://media.sys.wakayama-u.ac.jp/kawahara-lab/LOCAL/diss/diss7/S3_6.htm>
技术实现思路
一方面,本专利技术的目的在于提高基于给出反馈语反馈的方式确定讲话者的情绪状态的准确度。根据实施方式的一方面,话语状态确定装置包括平均反馈语频率估计单元、反馈语频率计算单元以及确定单元。平均反馈语频率估计单元基于第一讲话者的语音信号和第二讲话者的语音信号来估计平均反馈语频率,该平均反馈语频率表示在从第二讲话者的语音信号的语音开始时间至预定时间的时间段中第二讲话者的反馈语频率。反馈语频率计算单元基于第一讲话者的语音信号和第二讲话者的语音信号来计算每单位时间中第二讲话者的反馈语频率。确定单元基于在平均反馈语频率估计单元中估计的平均反馈语频率和在反馈语频率计算单元中计算的反馈语频率来确定第二讲话者的满意度。附图说明图1是示出了根据实施方式1的语音呼叫系统的配置的图;图2是示出了根据实施方式1的话语状态确定装置的功能配置的图;图3是对话语状态确定装置中的语音信号的处理单位进行说明的图;图4是提供了由根据实施方式1的话语状态确定装置执行的处理的细节的流程图;图5是提供了根据实施方式1的平均反馈语频率估计处理的细节的流程图;图6是示出了根据实施方式2的语音呼叫系统的配置的图;图7是示出了根据实施方式2的话语状态确定装置的功能配置的图;图8是提供了存储在存储单元中的语句的示例的图;图9是提供了由根据实施方式2的话语状态确定装置执行的处理的细节的流程图;图10是提供了根据实施方式2的平均反馈语频率估计处理的细节的流程图;图11是示出了根据实施方式3的语音呼叫系统的配置的图;图12是示出了根据实施方式3的服务器的功能配置的图;图13是对话语状态确定装置中的语音信号的处理单位进行说明的图;图14是提供了存储在存储单元中的语句的示例的图;图15是示出了根据实施方式3的再现装置的功能配置的图;图16是提供了由根据实施方式3的话语状态确定装置执行的处理的细节的流程图;图17是提供了根据实施方式3的平均反馈语频率估计处理的细节的流程图;图18是示出了根据实施方式4的记录装置的配置的图;图19是示出了根据实施方式4的话语状态确定装置的功能配置的图;图20是提供了反馈语强度确定信息的示例的图;图21是提供了语速和平均反馈语频率的对应表的示例的图;图22是提供了由根据实施方式4的话语状态确定装置执行的处理的细节的流程图;图23是示出了根据实施方式5的记录系统的功能配置的图;图24是示出了根据实施方式5的话语状态确定装置的功能配置的图;图25是提供了平均反馈语频率的对应表的示例的图;图26是提供了由根据实施方式5的话语状态确定装置执行的处理的细节的流程图;以及图27是示出了计算机的硬件结构的图。具体实施方式将参照附图来对本专利技术的优选实施方式进行说明。对讲话者是否处于生气状态或处于不满意状态的估计(确定)使用了讲话者的情绪状态与给出反馈语反馈的方式之间的关系。更具体地,与讲话者处于正常状态时相比,当讲话者生气或不满意时,反馈语反馈的次数较少。因此,可以作为示例基于反馈语反馈的次数和预先准备的特定阈值来确定对方讲话者的情绪状态。然而,由于反馈语反馈的数量和间隔的个体变化,所以难以基于特定阈值确定讲话者的情绪状态。例如,在天生不太频繁地给出反馈语反馈的确定目标讲话者的情况下,虽然讲话者比处于其正常状态更频繁地给出反馈语反馈,但是反馈语反馈的次数仍可能少于阈值,在这种情况下,可能确定讲话者处于生气状态。在另一示例中,在天生频繁地给出反馈语反馈的讲话者的情况下,虽然讲话者处于生气状态并且反馈语反馈的次数少于其正常状态,却可能确定讲话者处于正常状态。在以下描述中,可以将反馈语反馈简称为“反馈语”。<实施方式1>图1是示出了根据实施方式1的语音呼叫系统的配置的图。如图1中所示,根据本实施方式的语音呼叫系统100包括第一话机2、第二话机3、互联网协议(IP)网络4以及显示装置6。第一话机2包括麦克风201、语音呼叫处理器202、接收器(扬声器)203、显示单元204以及话语状态确定装置5。第一话机2的话语状态确定装置5与显示装置6连接。注意,第一话机2的数量并不限于仅一个,而是可以包括多个话机。第二话机3是可以经由IP网络4与第一话机2连接的话机。第二话机3包括麦克风301、语音呼叫处理器302以及接收器(扬声器)303。在该语音呼叫系统100中,使用第一话机2和第二话机3的语音呼叫通过经由IP网络4根据会话发起协议(SIP)在第一话机2与第二话机3之间进行呼叫连接来实现。第一话机2在语音呼叫处理器202中将由麦克风201收集的第一讲话者的语音信号转换成用于传输的信号并且将经转换的信号传送至第二话机3。第一话机2还在语音呼叫处理器202中将从第二话机3接收到的信号转换成可以从接收器203输出的语音信号,并且将经转换的信号输出至接收器203。第二话机3在语音呼叫处理器302中将由麦克风301收集的第二讲话者(第一讲话者的对方讲话者)的语音信号转换成用于传输的信号,并且将经转换的信号传送至第一话机2。第二话机3还在语音呼叫处理器302中将从第一话机2接收到的信号转换成可以从接收器303输出的语音信号,并且将经转换的信号输出至接收器303。第一话机2中的语音呼叫处理器202和第二话机3中的语音呼叫处理器302分别包括编码器、解码器和收发器单元,但是图1中省略了这些单元。编码器将麦克风201或麦克风301收集的语音信号(模拟信号)转换成数字信号。解码器将从对方话机接收到的数字信号转换成语音信号(模拟信号)。收发器单元根据实时传输协议(RTP)将数字信号打包本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/21/201610709387.html" title="话语状态确定装置及方法原文来自X技术">话语状态确定装置及方法</a>

【技术保护点】
一种话语状态确定装置,包括:平均反馈语频率估计单元,所述平均反馈语频率估计单元被配置成基于第一讲话者的语音信号和第二讲话者的语音信号来估计平均反馈语频率,所述平均反馈语频率表示在从所述第二讲话者的所述语音信号的语音开始时间至预定时间的时间段中所述第二讲话者的反馈语频率;反馈语频率计算单元,所述反馈语频率计算单元被配置成基于所述第一讲话者的所述语音信号和所述第二讲话者的所述语音信号来计算每单位时间中所述第二讲话者的反馈语频率;以及确定单元,所述确定单元被配置成基于所估计的平均反馈语频率和所计算的反馈语频率来确定所述第二讲话者的满意度。

【技术特征摘要】
2015.08.31 JP 2015-1712741.一种话语状态确定装置,包括:平均反馈语频率估计单元,所述平均反馈语频率估计单元被配置成基于第一讲话者的语音信号和第二讲话者的语音信号来估计平均反馈语频率,所述平均反馈语频率表示在从所述第二讲话者的所述语音信号的语音开始时间至预定时间的时间段中所述第二讲话者的反馈语频率;反馈语频率计算单元,所述反馈语频率计算单元被配置成基于所述第一讲话者的所述语音信号和所述第二讲话者的所述语音信号来计算每单位时间中所述第二讲话者的反馈语频率;以及确定单元,所述确定单元被配置成基于所估计的平均反馈语频率和所计算的反馈语频率来确定所述第二讲话者的满意度。2.根据权利要求1所述的话语状态确定装置,其中,所述平均反馈语频率估计单元基于在从所述第二讲话者的所述语音信号的语音开始时间至所述预定时间的时间段中所述第二讲话者的反馈语反馈的次数来估计所述平均反馈语频率。3.根据权利要求1所述的话语状态确定装置,其中,所述平均反馈语频率估计单元基于从所述第二讲话者的所述语音信号的语音开始时间至结束时间的反馈语频率来估计所述平均反馈语频率。4.根据权利要求1所述的话语状态确定装置,其中,所述平均反馈语频率估计单元基于根据所述第二讲话者的所述语音信号计算的语速来估计所述平均反馈语频率。5.根据权利要求1所述的话语状态确定装置,其中,所述平均反馈语频率估计单元通过使用根据所述第二讲话者的所述语音信号中的语音区间的开始时间和结束时间获得的说话时长来计算所述第二讲话者的说话时长,并且基于所计算的说话时长来估计所述平均反馈语频率。6.根据权利要求1所述的话语状态确定装置,其中,所述平均反馈语频率估计单元计算所述第二讲话者的所述语音信号中的累积说话时长,并且根据所述第二讲话者的所述累积说话时长来估计所述平均反馈语频率。7.根据权利要求1所述的话语状态确定装置,其中,所述平均反馈语频率估计单元在所述第二讲话者的讲话者信息发生改变时将所述平均反馈语频率恢复成预定值,并且估计所述改变之后的所述第二讲话者的所述平均反馈语频率。8.根据权利要求7所述的话语状态确定装置,还包括:存储单元,所述存储单元被配置成将所述第二讲话者的讲话者信息和所述第二讲话者的所述平均反馈语频率彼此相关联地存储,其中,所述平均反馈语频率估计单元在所述第二讲话者的讲话者信息发生改变时参考所述存储单元,并且在改变之后的讲话者信息存储在所述存储单元中时从所述存储单元读出所述第二讲话者的讲话者信息。9.根据权利要求1所述的话语状态确定装置,还包括:...

【专利技术属性】
技术研发人员:香村纱友梨外川太郎大谷猛
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1