声音分段设备和方法以及说话者识别系统技术方案

技术编号：8301234 阅读：231 留言：0更新日期：2013-02-07 05:23

本发明专利技术提供一种声音分段设备和方法以及说话者识别系统。该声音分段方法包括多级分段步骤，所述多级分段步骤包括当前声音段分段步骤。所述当前声音段分段步骤包括：确定步骤，确定当前声音段关于分割分数序列是否满足规定条件，所述分割分数序列指示每个候选分割点的信息熵；以及分割步骤，如果确定所述当前声音段满足所述规定条件，则将所述当前声音段分割为至少两个下一级声音段。通过将通过所述分割步骤获得的所述下一级声音段中的每一个作为所述下一级中的当前声音段，以迭代方式执行所述当前声音段分段步骤，直到每一级中的未被分割的声音段都不满足所述规定条件为止。得益于本发明专利技术，不必设置固定的观察窗并且可以降低计算量。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及声音分段设备和声音分段方法，以及说话者识别系统。
技术介绍
声音分段是将声音序列(音频序列)分段为多个声音段的技术。声音检测方法通常涉及声音分段处理和声音分类处理两者。在声音检测方法的一个典型例子中，非静音声音段被检测，并且，每个非静音声音段被分段为多个声音段。然后，对于每个如此获得的声音段，声音分类器对于类别集中的所有声音类别计算分类分数(分类分数表明一个声音段属于一个声音类别的似然性或概率)，并且最终输出具有最大分类分数的声音类别作为对于该声音段的声音检测结果。声音分段处理常常在声音检测方法中扮演重要的角色，这是因为声音分段处理的性能直接影响声音分类处理的结果因而直接影响声音检测方法的性能。例如，如果具有不同声音类别的两个或更多个声音段在声音分段处理中被分段为单个声音段，换句话说，如果具有第一声音类别的至少一个声音段在声音分段处理中被埋入在具有第二声音类别的另一个声音段中并且因而被漏检，则与被漏检的声音段对应的第一声音类别当然也在声音分类处理中被漏检，即使声音分类方法本身的性能是高的。另外，当具有第一声音类别的至少一个声音段在声音分段处理中被埋入在具有第二声音类别的另一个声音段中时，甚至有可能不仅漏检第一声音段，而且包含第一声音类别的声音段和第二声音类别的声音段这两者的声音段被分类到既不是第一类别又不是第二类别的类别中。为了防止漏检可能的声音段，在美国专利2008/0255854和2006/0212297中提出了一种声音分段方法，在该声音分段方法中，使用不同的声音分段算法而对于单个声音段得到多于一个的候选分割点。然后，该方法除去无效分...

【技术保护点】
一种声音分段方法，包括：多级分段步骤，所述多级分段步骤包括：当前声音段分段步骤，所述当前声音段分段步骤包括：确定步骤，确定当前声音段关于分割分数序列是否满足规定条件，所述分割分数序列指示每个候选分割点的信息熵；以及分割步骤，如果确定所述当前声音段满足所述规定条件，则将所述当前声音段分割为至少两个下一级声音段，其中，通过将通过所述分割步骤获得的所述下一级声音段中的每一个作为所述下一级中的当前声音段，以迭代方式执行所述当前声音段分段步骤，直到每一级中的未被分割的声音段都不满足所述规定条件为止。

【技术特征摘要】

【专利技术属性】
技术研发人员：郭莉莉，穆向禹，刘贺飞，
申请(专利权)人：佳能株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人