信息处理装置、检测方法和检测程序制造方法及图纸

技术编号:34120891 阅读:61 留言:0更新日期:2022-07-14 13:00
信息处理装置(100)具有:取得部(110),其取得声音信号;以及控制部(120),其将声音信号分割成多个区间,根据声音信号计算多个区间各自的每区间时间的变动量即变动值,在多个区间中确定变动值为预先设定的阈值以下的区间,根据声音信号计算所确定的区间中的声音信号的功率,从所确定的区间中的声音信号的功率中确定最大值,将基于最大值的值设定为检测阈值,在伴随着时间经过的声音信号的功率中,检测检测阈值以上的区间作为检测对象区间。测阈值以上的区间作为检测对象区间。测阈值以上的区间作为检测对象区间。

【技术实现步骤摘要】
【国外来华专利技术】信息处理装置、检测方法和检测程序


[0001]本专利技术涉及信息处理装置、检测方法和检测程序。

技术介绍

[0002]公知有语音识别的技术。例如,已提出针对语音信号中的语音区间进行语音识别的技术(参照专利文献1)。
[0003]现有技术文献
[0004]专利文献
[0005]专利文献1:日本特开平10

288994号公报

技术实现思路

[0006]专利技术要解决的课题
[0007]但是,有时希望从声音信号中检测检测对象。例如,考虑使用基于噪声功率的阈值来检测检测对象的方法。这里,有时噪声功率急剧上升。在噪声功率超过阈值的情况下,在该方法中,无法高精度地检测检测对象。
[0008]本专利技术的目的在于,能够高精度地检测检测对象。
[0009]用于解决课题的手段
[0010]提供本专利技术的一个方式的信息处理装置。信息处理装置具有:取得部,其取得声音信号;以及控制部,其将所述声音信号分割成多个区间,根据所述声音信号计算所述多个区间各自的每区间时间的变动量即变动值,在所述多个区间中确定所述变动值为预先设定的阈值以下的区间,根据所述声音信号计算所确定的区间中的所述声音信号的功率,从所确定的区间中的所述声音信号的功率中确定最大值,将基于所述最大值的值设定为检测阈值,在伴随着时间经过的所述声音信号的功率中,检测所述检测阈值以上的区间作为检测对象区间。
[0011]专利技术效果
[0012]根据本专利技术,能够高精度地检测检测对象。
附图说明
[0013]图1是示出实施方式1的信息处理装置具有的硬件的结构的图。
[0014]图2是示出比较例的图。
[0015]图3是实施方式1的信息处理装置具有的功能框图。
[0016]图4是示出实施方式1的信息处理装置执行的处理的例子的流程图。
[0017]图5示出实施方式1的信息处理装置执行的处理的具体例。
[0018]图6是实施方式2的信息处理装置具有的功能框图。
[0019]图7是示出实施方式2的信息处理装置执行的处理的例子的流程图。
[0020]图8示出实施方式2的信息处理装置执行的处理的具体例。
[0021]图9是实施方式3的信息处理装置具有的功能框图。
[0022]图10是示出实施方式3的信息处理装置执行的处理的例子的流程图。
[0023]图11是实施方式4的信息处理装置具有的功能框图。
[0024]图12是示出实施方式4的信息处理装置执行的处理的例子的流程图(其一)。
[0025]图13是示出实施方式4的信息处理装置执行的处理的例子的流程图(其二)。
[0026]图14示出实施方式4的信息处理装置执行的处理的具体例(其一)。
[0027]图15示出实施方式4的信息处理装置执行的处理的具体例(其二)。
[0028]图16是示出实施方式4的变形例的流程图(其一)。
[0029]图17是示出实施方式4的变形例的流程图(其二)。
[0030]图18是实施方式5的信息处理装置具有的功能框图。
[0031]图19是示出实施方式5的信息处理装置执行的处理的例子的流程图(其一)。
[0032]图20是示出实施方式5的信息处理装置执行的处理的例子的流程图(其二)。
[0033]图21示出实施方式5的信息处理装置执行的处理的具体例(其一)。
[0034]图22示出实施方式5的信息处理装置执行的处理的具体例(其二)。
具体实施方式
[0035]下面,参照附图对实施方式进行说明。以下的实施方式只不过是例子,能够在本专利技术的范围内进行各种变更。
[0036]实施方式1
[0037]图1是示出实施方式1的信息处理装置具有的硬件的结构的图。信息处理装置100是执行检测方法的装置。信息处理装置100具有处理器101、易失性存储装置102和非易失性存储装置103。
[0038]处理器101对信息处理装置100整体进行控制。例如,处理器101是CPU(Central Processing Unit:中央处理单元)、FPGA(Field Programmable Gate Array:现场可编程门阵列)等。处理器101也可以是多处理器。信息处理装置100可以通过处理电路实现,或者也可以通过软件、固件或它们的组合来实现。另外,处理电路也可以是单一电路或复合电路。
[0039]易失性存储装置102是信息处理装置100的主存储装置。例如,易失性存储装置102是RAM(Random Access Memory:随机存取存储器)。非易失性存储装置103是信息处理装置100的辅助存储装置。例如,非易失性存储装置103是HDD(Hard Disk Drive:硬盘驱动器)或SSD(Solid State Drive:固态驱动器)。
[0040]图2是示出比较例的图。图2的上段示出声音的波形的曲线图。利用功率示出图2的上段的声音的声音信号的曲线图是图2的下段。图2的范围900表示噪声。
[0041]有时希望从声音信号中检测检测对象。在图2中,将检测对象设为语音。这里,噪声的功率往往低于语音的功率。因此,考虑使用阈值检测语音的方法。图2示出阈值901。例如,阈值901以上的区间被检测为检测对象区间。即,检测对象区间被检测为语音的区间。
[0042]这里,有时噪声的功率急剧上升。例如,图2示出噪声的功率在时刻t90以后急剧上升。例如,图2的范围902表示噪声。在噪声的功率急剧上升的情况下,时刻t90以后的区间被检测为检测对象区间。图2示出如下情况:噪声的功率超过阈值,因此,除了语音以外,噪声也成为检测对象。
[0043]这样,在图2的方法中,无法高精度地检测检测对象。因此,下面,对能够高精度地检测检测对象的方法进行说明。
[0044]图3是实施方式1的信息处理装置具有的功能框图。信息处理装置100具有取得部110、控制部120和输出部130。
[0045]取得部110、控制部120和输出部130的一部分或全部也可以通过处理器101实现。取得部110、控制部120和输出部130的一部分或全部也可以作为处理器101执行的程序的模块来实现。例如,处理器101执行的程序也称作检测程序。例如,检测程序记录于记录介质。
[0046]取得部110取得声音信号。例如,声音信号的声音是进行会议的会议室内的声音、电话的通话等。此外,例如,声音信号是基于录音数据的信号。
[0047]控制部120根据声音信号计算伴随着时间经过的声音信号的功率。换言之,控制部120根据声音信号计算声音信号的时间序列的功率。下面,声音信号的功率称作声音信号功率。另外,声音信号功率也可以通过信息处理装置100以外的装置来计算。
[0048]控制部120将声音信号分割成多个区间。控制部120可以均等地分割声音信号,也可以不均等地分割声音信号本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种信息处理装置,该信息处理装置具有:取得部,其取得声音信号;以及控制部,其将所述声音信号分割成多个区间,根据所述声音信号计算所述多个区间各自的每区间时间的变动量即变动值,在所述多个区间中确定所述变动值为预先设定的阈值以下的区间,根据所述声音信号计算所确定的区间中的所述声音信号的功率,从所确定的区间中的所述声音信号的功率中确定最大值,将基于所述最大值的值设定为检测阈值,在伴随着时间经过的所述声音信号的功率中,检测所述检测阈值以上的区间作为检测对象区间。2.根据权利要求1所述的信息处理装置,其中,所述控制部根据所述声音信号计算所述多个区间各自的语音相似度的程度即语音度,在所述多个区间中确定所述变动值为预先设定的阈值以下且所述语音度为预先设定的阈值以下的区间。3.根据权利要求1所述的信息处理装置,其中,所述控制部根据所述声音信号计算所述多个区间各自的语音相似度的程度即语音度,在所述多个区间中确定所述变动值为预先设定的阈值以下的区间,按照从小到大的顺序排列所确定的区间的所述语音度,按照从小到大的顺序选择预先设定的个数的区间,根据所述声音信号计算选择出的区间中的所述声音信号的功率,从选择出的区间中的所述声音信号的功率中确定最大值。4.根据权利要求1所述的信息处理装置,其中,所述控制部按照所确定的每个区间,将基于区间中的所述声音信号的功率的值设定为临时检测阈值,在伴随着时间经过的所述声音信号的功率中,检测所设定的临时检测阈值以上的区间的数量,从按照所确定的每个区间设定的临时检测阈值中检测区间的数量最大时的临时检测阈值作为所述检测阈值,检测使用所述检测阈值检测到时的区间作为所述检测对象区间。5.根据权利要求1所述的信息处理装置,其中,所述控制部根据所述声音信号计算所述多个区间各自的语音相似度的程度即语音度,在所述多个区间中确定所述变动值为预先设定的阈值以下的区间,按照从小到大的顺序排列所确定的区间的所述语音度,按照从小到大的顺序选择预先设定的个数的区间,根据所述声音信号计算选择出的区间中的所述声音信号的功率,按照选择出的每个区间,将基于区间中的所述声音信号的功率的值设定为临时检测阈值,在伴随着时间经过的所述声音信号的功率中,检测所设定的临时检测阈值以上的区间的数量,从按照选择出的每...

【专利技术属性】
技术研发人员:花泽利行
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1