语音处理中基于高斯模型的动态时间弯曲系统和方法技术方案

技术编号：3046709 阅读：212 留言：0更新日期：2012-04-11 18:40

一种用于构建语音模型的方法，包括：　　　　用从多个讲话者获得的多个发音构建声音空间模型；　　　　　通过用从至少一个讲话者得到的注册语音与声音空间模型适配构建讲话者模型；　　　　识别与所述注册语音相关的临时结构；和　　　　以所述讲话者的注册语音为基础构建语音模型，同时将所述注册语音的临时结构保存在所述的语音模型中。（*该技术在2023年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术主要涉及在语音处理领域内用于表示语音的模型。更确切地说，本专利技术涉及一种建模技术，其优先采用独立文本统计学声音空间建模和临时序列建模来形成支持语音和讲话者自动识别领域的建模系统和方法，所述系统和方法包括定位(spotting mode)模式，并且比传统的统计建模技术明显减少了注册数据。
技术介绍
语音建模技术目前已广泛用于从语音识别到讲话者查验/辨别等不同的应用领域。当前大多数系统使用隐式马尔科夫模型(HMM)来解决大量词汇、连续语音识别等富有挑战性的问题。隐式马尔科夫模型以多种状态来表示语音，其中每种状态对应于不同的声音单元。使用前，从识别方式公知的人类语言实例中构建一组隐式马尔科夫模型。在训练时，进行统计分析以产生存储在隐式马尔科夫模型中的概率数据。将这些概率数据存储在预先确定的状态转换模型(HMM模型)中，所述模型存储从一种状态到下一种状态的遍历似然性以及在每一种状态下产生给定声音单元的似然性。通常，以浮点数的形式存储似然数据，所述浮点数代表平均值、方差和/或加权参数等高斯参数。就训练资料的需求而言，以隐式马尔科夫模型为基础的识别系统是非常昂贵的。它们对识别系统有很高的存储器要求和处理器速度要求。此外，传统的隐式马尔科夫模型识别系统往往采用额外的端点检测形式的预处理来鉴别实际输入的语音(即，为进行识别而应检验的信号部分)和背景噪音(即，应忽略的信号部分)。在可用少量注册数据的场合，常常使用称之为动态时间弯曲(DTW)的不同技术。动态时间弯曲过程试图在先前的训练模板模型和输入的序列之间寻找“最低成本”校正(alignment)。通常，这...

【技术保护点】

【技术特征摘要】
1.一种用于构建语音模型的方法，包括用从多个讲话者获得的多个发音构建声音空间模型；通过用从至少一个讲话者得到的注册语音与声音空间模型适配构建讲话者模型；识别与所述注册语音相关的临时结构；和以所述讲话者的注册语音为基础构建语音模型，同时将所述注册语音的临时结构保存在所述的语音模型中。2.根据权利要求1所述的方法，其中通过构建一组能变换成一组帧的帧相关模型而将所述注册语音的临时结构保存到所述语音模型中。3.根据权利要求2所述的方法，其中所述一组帧具有相关的时间基准，该基准是根据所述注册语音的时间建立的并且直接保存所述注册语音的时间。4.根据权利要求1所述的方法，其中所述声音空间模型、所述讲话者模型和所述临时结构共享一个共用的等级关系。5.根据权利要求1所述的方法，其中通过统计建模构建所述声音空间模型。6.根据权利要求1所述的方法，其中通过从多个讲话者获取语音、从获得的读音中抽取特征并用高斯参数表示所抽取的特征来构建所述声音空间模型。7.根据权利要求1所述的方法，其中用隐式马尔科夫模型表示所述声音空间模型。8.根据权利要求1所述的方法，其中用高斯混合模型表示所述声音空间模型。9.根据权利要求1所述的方法，其中通过统计建模来构建所述讲话者模型，并且通过使后面的适配最大化来完成适配声音空间模型的步骤。10.根据权利要求1所述的方法，其中通过统计建模来构建所述临时结构信息模型，所述统计建模采用了适合多种注册语音发音的讲话者模型和声音空间模型。11.根据权利要求10所述的方法，其中通过构建适合多种注册语音发音中每一种发音的临时结构信息模型、然后选择最佳的临时结构信息模型来进一步建立所述临时结构信息模型。12.根据权利要求10所述的方法，进一步包括根据所述注册语音的发音来适配所述临时结构信息模型。13.一种构建语音模型的方法，包括根据从多个讲话者获得的多个发音构建声音空间模型；通过利用从至少一个讲话者得到的注册语音进行声音空间模型适配来构建讲话者模型；通过将讲话者模型表示成多个帧相关模型而构建临时结构信息模型，所述多个帧相关模型对应于与所述注册语音相关的顺序时间间隔；和通过用所述注册语音、所述讲话者模型和所述声音空间模型进行临时结构信息模型适配来构建所述的语音模型。14.根据权利要求13所述的方法，进一步包括将所述声音空间模型表示成多个高斯参数。15.根据权利要求13所述的方法，进一步包括将...

【专利技术属性】
技术研发人员：杰弗朗索瓦·波纳斯特雷，菲利蒲·摩林，杰克劳德·约库阿，
申请(专利权)人：松下电器产业株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人