Evaluate sound accurately. The sound evaluation apparatus 100 parses the sound signal to detect the pitch frequency. The sound evaluation device 100 selects the evaluation object area as the evaluation object in the detected pitch frequency based on the detection frequency distribution of the detected pitch frequency. The sound evaluation device 100 evaluates sound based on the distribution of detection frequency and the selected evaluation object area.
【技术实现步骤摘要】
【国外来华专利技术】声音评价程序、声音评价方法以及声音评价装置
本专利技术涉及声音评价程序等。
技术介绍
近年来,多数的企业倾向于重视顾客满足度,想要把握对应者和顾客的会话中的、应对者的印象、顾客的感情这样的需求日益提高。应对者的印象、顾客的感情大多出现在声音中。例如,在现有技术中,基于通话中的声音的基音频率的上下宽度来判定声音的印象。图15是用于说明现有技术的图。图15的图表5的横轴是表示时间的轴,纵轴是表示频率的轴。在现有技术中,将基音频率的上下宽度较大的判定为清晰(明亮),将基音频率的上下宽度较小的判定为不清晰(低沉)。基音频率的上下宽度是某个期间中的基音频率的最大值与最小值的差。例如,在现有技术中,由于在图表5的期间T1中上下宽度5a较大,所以判定为声音的印象清晰。在现有技术中,由于在图表5的期间T2中上下宽度5b较小,所以判定为声音的印象不清晰。现有技术文献专利文献专利文献1:日本特开2015-87557号公报专利文献2:日本特开2006-267465号公报然而,在上述的现有技术中,存在不能够准确地评价声音这个问题。在检测基音频率的处理中,有时在特性上错误地计算半基音、双基音。因此,如果如现有技术那样单纯地根据基音频率的上下宽度的大小来判定声音的清晰/不清晰的话,则有时不能够准确地评价声音。图16是表示计算准确的基音频率的情况下的图表的图。图16的图表6的横轴是表示时间的轴,纵轴是表示频率的轴。图表6是表示计算出准确的基音频率的情况的图。在图表6中,由于基音频率的上下宽度6a较小,所以判定为声音不清晰。图17是表示计算出半基音/双基音的情况下的图表的图。图17的图表 ...
【技术保护点】
1.一种声音评价程序,其特征在于,使计算机执行如下的处理:对声音信号进行解析来检测基音频率;基于检测到的所述基音频率的检测频率的分布,选择检测到的所述基音频率中的作为评价对象的评价对象区域;以及基于所述检测频率的分布和所选择的所述评价对象区域来评价声音。
【技术特征摘要】
【国外来华专利技术】2017.06.23 JP 2017-1235881.一种声音评价程序,其特征在于,使计算机执行如下的处理:对声音信号进行解析来检测基音频率;基于检测到的所述基音频率的检测频率的分布,选择检测到的所述基音频率中的作为评价对象的评价对象区域;以及基于所述检测频率的分布和所选择的所述评价对象区域来评价声音。2.根据权利要求1所述的声音评价程序,其特征在于,进一步执行处理:通过对与所述分布的中心部对应的基音频率乘以第一权重,对与所述分布的边缘部分对应的基音频率乘以第二权重,从而修正所述分布,所述第二权重小于所述第一权重,在所述评价的处理中,基于修正后的分布的扩展来评价所述讲话区间内的声音的印象。3.根据权利要求1或2所述的声音评价程序,其特征在于,在测量所述基音频率的处理中,检测各时刻的基音频率、一定时间内的平均的基音频率、上限的基音频率、下限的基音频率中的任一个。4.根据权利要求1、2或3所述的声音评价程序,其特征在于,在所述评价的处理中,计算与多个基音频率相关的方差、标准偏差、范围、平方和、四分位距中的任一个的统计量,并基于所述统计量来评价声音的印象。5.根据权利要求2所述的声音评价程序,其特征在于,进一步执行处理:基于对预先决定的规定区间内的声音信号进行解析所获得的基音频率,推定用户在平常时的检测频率的基准分布,在所述评价的处理中,基于所述基准分布和修正后的分布来评价声音的印象。6.根据权利要求5所述的声音评价程序,其特征在于,进一步执行处理:将所述基准分布和说话者信息建立对应地存储至存储装置,在所述评价的处理中,选择与说话者信息对应的基准分布,基于所选择的基准分布的扩展和修正后的分布的扩展来评价声音的印象。7.根据权利要求6所述的声音评价程序,其特征在于,在推定所述基准分布的处理中,在与所指定的说话者信息对应的基准分布被存储到所述存储装置的情况下,将存储装置中存储的与所指定的说话者信息对应的基准分布设定为推定所述基准分布的情况下的初始值。8.根据权利要求2所述的声音评价程序,其特征在于,在修正所述分布的处理中,基于预先决定的规定区间中的多个基音频率来确定所述分布的中心部以及所述分布的边缘部。9.根据权利要求1所述的声音评价程序,其特征在于,在所述评价的处理中,针对每个不同的说话者信息评价声音,并评价多个说话者的整个会话。10.根据权利要求1所述的声音评价程序,其特征在于,在所述评价的处理中,分别评价各时刻中的声音的印象,并计算与各评价结果相关的得分。11.根据权利要求2、3或4所述的声音评价程序,其特征在于,在所述评价的处理中,在所述分布的扩展较大的情况下,评价为声音的印象较好,在所述分布的扩展较小的情况下,评价为声音的印象较差。12.一种声音评价方法,其是计算机执行的声音评价方法,其特征在于,使计算机执行如下的处理:对声音信号进行解析来检测基音频率;基于检测到的所述基音频率的检测频率的分布来选择检测到的所述基音频率中的作为评价对象的评价对象区域;以及基于所述检测频率的分布和所选择的所述评价对象区域来评价声音。13.根据权利要求12所述的声音评价方法,其特征在于,进一步执行处理:通过对与所述分布的中心部对应的基音频率乘以第一权重,对与所述分布的边缘部分对应的基音频率乘以第二权重,从而修正所述分布,所述第二权重小于所述第一权重,在所述评价的处理中,基于修正后的分布的扩展来评价所述讲话区间内的声音的印象。14.根据权利要求12或13所述的声音评价方法,其特征在于,在检测所述基音频率的处理中,检测各时刻的基音频率、一定时间内的平均的基音频率、上限的基音频率、下限的基音频率中的任一个。15.根据权利要求12、13或14所述的声音评价方法,其特征在于,在所述评价的处理中,计算与多个基音频率相关的方差、标准偏差、范围、平方和、四分位距中的任一个的统计量,并基于所述统计量来评价声音的印象。16.根据权利要求13所述的声音评价方法,其特征在于,进一步执行处理:基于对预先决定的规定区间内的声音信号进行解析所获得的基音频率...
【专利技术属性】
技术研发人员:中山纱友梨,外川太郎,大谷猛,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。