声音评价程序、声音评价方法以及声音评价装置制造方法及图纸

技术编号:21176964 阅读:39 留言:0更新日期:2019-05-22 12:15
准确地评价声音。声音评价装置100对声音信号进行解析来检测基音频率。声音评价装置100基于检测到的基音频率的检测频率的分布来选择检测到的基音频率中的作为评价对象的评价对象区域。声音评价装置100基于检测频率的分布和所选择的评价对象区域来评价声音。

Sound Evaluation Procedure, Sound Evaluation Method and Sound Evaluation Device

Evaluate sound accurately. The sound evaluation apparatus 100 parses the sound signal to detect the pitch frequency. The sound evaluation device 100 selects the evaluation object area as the evaluation object in the detected pitch frequency based on the detection frequency distribution of the detected pitch frequency. The sound evaluation device 100 evaluates sound based on the distribution of detection frequency and the selected evaluation object area.

【技术实现步骤摘要】
【国外来华专利技术】声音评价程序、声音评价方法以及声音评价装置
本专利技术涉及声音评价程序等。
技术介绍
近年来,多数的企业倾向于重视顾客满足度,想要把握对应者和顾客的会话中的、应对者的印象、顾客的感情这样的需求日益提高。应对者的印象、顾客的感情大多出现在声音中。例如,在现有技术中,基于通话中的声音的基音频率的上下宽度来判定声音的印象。图15是用于说明现有技术的图。图15的图表5的横轴是表示时间的轴,纵轴是表示频率的轴。在现有技术中,将基音频率的上下宽度较大的判定为清晰(明亮),将基音频率的上下宽度较小的判定为不清晰(低沉)。基音频率的上下宽度是某个期间中的基音频率的最大值与最小值的差。例如,在现有技术中,由于在图表5的期间T1中上下宽度5a较大,所以判定为声音的印象清晰。在现有技术中,由于在图表5的期间T2中上下宽度5b较小,所以判定为声音的印象不清晰。现有技术文献专利文献专利文献1:日本特开2015-87557号公报专利文献2:日本特开2006-267465号公报然而,在上述的现有技术中,存在不能够准确地评价声音这个问题。在检测基音频率的处理中,有时在特性上错误地计算半基音、双基音。因此,如果如现有技术那样单纯地根据基音频率的上下宽度的大小来判定声音的清晰/不清晰的话,则有时不能够准确地评价声音。图16是表示计算准确的基音频率的情况下的图表的图。图16的图表6的横轴是表示时间的轴,纵轴是表示频率的轴。图表6是表示计算出准确的基音频率的情况的图。在图表6中,由于基音频率的上下宽度6a较小,所以判定为声音不清晰。图17是表示计算出半基音/双基音的情况下的图表的图。图17的图表7的横轴是表示时间的轴,纵轴是表示频率的轴。图表7表示错误地计算了半基音/双基音的情况。在图表7中,导致基音频率的上下宽度7a变大,虽然实际上声音不清晰,但判定为声音清晰。
技术实现思路
在一个方面,本专利技术的目的在于提供能够准确地评价声音的声音评价程序、声音评价方法以及声音评价装置。第一方面中,使计算机执行下述的处理。计算机对声音信号进行解析来检测基音频率。计算机基于检测到的基音频率的检测频率的分布来选择检测到的基音频率中的作为评价对象的评价对象区域。计算机基于检测频率的分布和选择的评价对象区域来评价声音。专利技术效果能够准确地评价声音。附图说明图1是表示本实施例1所涉及的声音评价装置的结构的功能框图。图2是表示本实施例1所涉及的声音评价部的结构的功能框图。图3是表示直方图的一个例子的图。图4是表示本实施例1所涉及的声音评价部的处理顺序的流程图。图5是用于说明声音评价装置的其它处理的图。图6是表示本实施例2所涉及的声音评价系统的结构的图。图7是表示本实施例2所涉及的声音评价装置的结构的功能框图。图8是表示本实施例2所涉及的声音评价部的结构的功能框图。图9是表示本实施例2所涉及的平常时分布表的数据构造的一个例子的图。图10是表示本实施例3所涉及的声音评价系统的结构的图。图11是表示本实施例3所涉及的收录设备的结构的功能框图。图12是表示本实施例3所涉及的声音评价装置的结构的功能框图。图13是表示本实施例3所涉及的声音评价部的结构的功能框图。图14是表示实现与声音评价装置同样的功能的计算机的硬件构成的一个例子的图。图15是用于说明现有技术的图。图16是表示计算出准确的基音频率的情况下的图表的图。图17是表示计算出半基音/双基音的情况下的图表的图。具体实施方式以下,基于附图,详细地对本申请公开的声音评价程序、声音评价方法以及声音评价装置的实施例进行说明。此外,并没有通过该实施例来限定该专利技术。实施例1图1是表示本实施例1所涉及的声音评价装置的结构的功能框图。如图1所示,该声音评价装置100与收集说话者(图示省略)的声音的麦克风10连接。麦克风10将收集到的声音的信号输出至声音评价装置100。在以下的说明中,将麦克风10收集到的声音的信号记载为“声音信号”。声音评价装置100具有AD(Analog-to-Digital)转换部101、声音文件部102、声音评价部103、评价结果储存部104、存储装置105、输出部106。AD转换部101是从麦克风10接收声音信号并执行AD转换的处理部。具体而言,AD转换部101将声音信号(模拟信号)转换为声音信号(数字信号)。AD转换部101将声音信号(数字信号)输出至声音文件部102、声音评价部103。在以下的说明中,将从AD转换部101输出的声音信号(数字信号)仅称为声音信号。声音文件部102是将声音信号通过规定的声音文件格式转换为声音文件的处理部。例如,声音文件包括将各时刻和声音信号的强度分别建立对应的信息。声音文件部102将声音文件储存至存储部105的声音文件表105a。在以下的说明中,为了便于说明,将声音文件所包含的时刻和声音信号的强度的关系的信息仅记载为声音信号。此外,声音文件部102从输入装置(图示省略)获取说话者信息,并将说话者信息添加至声音文件。例如,说话者信息是唯一地识别说话者的信息。声音评价部103是基于声音信号来评价说话者的声音的印象的处理部。例如,说话者的声音的印象的评价结果为“印象较好”、“普通”、“印象较差”中的之一。声音评价部103将说话者信息和评价结果的信息输出至评价结果储存部104。评价结果储存部104是将说话者信息和评价结果相对应地储存至存储装置105的评价结果表105b的处理部。存储装置105存储声音文件表105a以及评价结果表105b。存储装置105与RAM(RandomAccessMemory:随机存取存储器)、ROM(ReadOnlyMemory:只读存储器)、闪存(FlashMemory)等半导体存储元件、HDD(HardDiskDrive:硬盘驱动器)等存储装置对应。声音文件表105a是储存从声音文件部102输出的声音文件的表。评价结果表105b是将由评价结果储存部104储存的说话者信息和评价结果建立对应的表。输出部106是通过将存储装置105中储存的评价结果表105b输出至显示装置来使评价结果显示的处理部。另外,输出部106也可以将声音文件表105a中储存的声音文件输出至其它外部装置。此处,图1所示的AD转换部101、声音文件部102、声音评价部103、评价结果储存部104、输出部106与规定的控制部(图示省略)对应。例如,控制部能够通过CPU(CentralProcessingUnit:中央处理器)、MPU(MicroProcessingUnit:微处理器)等来实现。另外,控制部也能够通过ASIC(ApplicationSpecificIntegratedCircuit:专用集成电路)、FPGA(FieldProgrammableGateArray:现场可编程门阵列)等硬布线逻辑来实现。接着,对图1所示的声音评价部103的结构进行说明。图2是表示本实施例1所涉及的声音评价部的结构的功能框图。如图2所示,该声音评价部103具有基音检测部110、分布计算部111、扩展计算部112、存储部113、推定部114、评价部115。基音检测部110是通过对声音文件的声音信号进行频率解析来检测基音频率的处理部。基音频率与声音信号的基本频率对应。基音检测部110将基音频率的信息输出至分布计本文档来自技高网
...

【技术保护点】
1.一种声音评价程序,其特征在于,使计算机执行如下的处理:对声音信号进行解析来检测基音频率;基于检测到的所述基音频率的检测频率的分布,选择检测到的所述基音频率中的作为评价对象的评价对象区域;以及基于所述检测频率的分布和所选择的所述评价对象区域来评价声音。

【技术特征摘要】
【国外来华专利技术】2017.06.23 JP 2017-1235881.一种声音评价程序,其特征在于,使计算机执行如下的处理:对声音信号进行解析来检测基音频率;基于检测到的所述基音频率的检测频率的分布,选择检测到的所述基音频率中的作为评价对象的评价对象区域;以及基于所述检测频率的分布和所选择的所述评价对象区域来评价声音。2.根据权利要求1所述的声音评价程序,其特征在于,进一步执行处理:通过对与所述分布的中心部对应的基音频率乘以第一权重,对与所述分布的边缘部分对应的基音频率乘以第二权重,从而修正所述分布,所述第二权重小于所述第一权重,在所述评价的处理中,基于修正后的分布的扩展来评价所述讲话区间内的声音的印象。3.根据权利要求1或2所述的声音评价程序,其特征在于,在测量所述基音频率的处理中,检测各时刻的基音频率、一定时间内的平均的基音频率、上限的基音频率、下限的基音频率中的任一个。4.根据权利要求1、2或3所述的声音评价程序,其特征在于,在所述评价的处理中,计算与多个基音频率相关的方差、标准偏差、范围、平方和、四分位距中的任一个的统计量,并基于所述统计量来评价声音的印象。5.根据权利要求2所述的声音评价程序,其特征在于,进一步执行处理:基于对预先决定的规定区间内的声音信号进行解析所获得的基音频率,推定用户在平常时的检测频率的基准分布,在所述评价的处理中,基于所述基准分布和修正后的分布来评价声音的印象。6.根据权利要求5所述的声音评价程序,其特征在于,进一步执行处理:将所述基准分布和说话者信息建立对应地存储至存储装置,在所述评价的处理中,选择与说话者信息对应的基准分布,基于所选择的基准分布的扩展和修正后的分布的扩展来评价声音的印象。7.根据权利要求6所述的声音评价程序,其特征在于,在推定所述基准分布的处理中,在与所指定的说话者信息对应的基准分布被存储到所述存储装置的情况下,将存储装置中存储的与所指定的说话者信息对应的基准分布设定为推定所述基准分布的情况下的初始值。8.根据权利要求2所述的声音评价程序,其特征在于,在修正所述分布的处理中,基于预先决定的规定区间中的多个基音频率来确定所述分布的中心部以及所述分布的边缘部。9.根据权利要求1所述的声音评价程序,其特征在于,在所述评价的处理中,针对每个不同的说话者信息评价声音,并评价多个说话者的整个会话。10.根据权利要求1所述的声音评价程序,其特征在于,在所述评价的处理中,分别评价各时刻中的声音的印象,并计算与各评价结果相关的得分。11.根据权利要求2、3或4所述的声音评价程序,其特征在于,在所述评价的处理中,在所述分布的扩展较大的情况下,评价为声音的印象较好,在所述分布的扩展较小的情况下,评价为声音的印象较差。12.一种声音评价方法,其是计算机执行的声音评价方法,其特征在于,使计算机执行如下的处理:对声音信号进行解析来检测基音频率;基于检测到的所述基音频率的检测频率的分布来选择检测到的所述基音频率中的作为评价对象的评价对象区域;以及基于所述检测频率的分布和所选择的所述评价对象区域来评价声音。13.根据权利要求12所述的声音评价方法,其特征在于,进一步执行处理:通过对与所述分布的中心部对应的基音频率乘以第一权重,对与所述分布的边缘部分对应的基音频率乘以第二权重,从而修正所述分布,所述第二权重小于所述第一权重,在所述评价的处理中,基于修正后的分布的扩展来评价所述讲话区间内的声音的印象。14.根据权利要求12或13所述的声音评价方法,其特征在于,在检测所述基音频率的处理中,检测各时刻的基音频率、一定时间内的平均的基音频率、上限的基音频率、下限的基音频率中的任一个。15.根据权利要求12、13或14所述的声音评价方法,其特征在于,在所述评价的处理中,计算与多个基音频率相关的方差、标准偏差、范围、平方和、四分位距中的任一个的统计量,并基于所述统计量来评价声音的印象。16.根据权利要求13所述的声音评价方法,其特征在于,进一步执行处理:基于对预先决定的规定区间内的声音信号进行解析所获得的基音频率...

【专利技术属性】
技术研发人员:中山纱友梨外川太郎大谷猛
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1