语音识别系统的自适应方法技术方案

技术编号：6852576 阅读：188 留言：0更新日期：2012-04-11 18:40

一种语音识别系统的自适应方法，所述方法包括：确定输入的语音信号的内容差异参数，以确定输入的语音信号在树形结构的高层、中间层和低层的数据累积程度；从适于使用树形结构的高层的类的第一自适应方法、中间层的类的第二自适应方法和低层的类的第三自适应方法中选择满足了数量累积条件的自适应方法，以执行自适应，其中，对语音识别系统的特征空间中的声音单元建立所述树形结构，从而以树形结构的形式对声音单元进行聚类。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别技术，更具体地讲，涉及语音识别的自适应方法。
技术介绍
近年来，语音识别技术已经取得了显著进步，在实验室环境下，识别精度已经高达 95%。近来，语音识别技术开始从实验室走向市场，并逐渐进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。然而，语音识别系统的性能受许多因素的影响，这些因素包括不同的说话人、说话方式、环境噪音、传输信道等。当需要被识别的语音与训练语音识别系统时的条件不同时，该语音不能被很好地识别。解决该问题的一个方案是利用尽可能多的数据进行训练，使得语音识别系统尽可能多地记住现实世界中存在的各种影响因素，从而提高识别精度。然而，要收集与各种影响因素有关的数据资源投入大，成本高。因此，寻找实现成本低，高效的解决方案一直是语音识别专业领域的研发课题之一。解决该问题的另一个方案是自适应技术。一个典型的自适应方案是用户在使用语音识别系统进行识别语音之前读取一些测试语句，从而语音识别系统根据这些测试语句的语音信号更新语音识别系统的参数来更好的适应该用户的语音。这样，同一用户在使用语音识别系统进行识别语音时，能够获得较高的识别精度。显然，上述两个方案中自适应技术所需的成本更小，并且更适于处理各种应用场景中的多种变化因素。图1和图2示出现有技术的两种自适应识别系统。在图1中，语音识别系统100包括前端处理单元110、特征提取单元120、解码单元130、网格重计分(lattice re-scoring)单元140和自适应单元150。前端处理单元110接收原始语音信号(例如，用户通过麦克风输入的原始语音信号)，并...

【技术保护点】
１．一种语音识别系统的自适应方法，包括：确定输入的语音信号的内容差异参数，以确定输入的语音信号在树形结构的高层、中间层和低层的数据累积程度；从适于使用树形结构的高层的类的第一自适应方法、中间层的类的第二自适应方法和低层的类的第三自适应方法中选择满足了数据累积条件的自适应方法，以执行自适应，其中，对语音识别系统的特征空间中的声音单元建立所述树形结构，从而以树形结构的形式对声音单元进行聚类。

【技术特征摘要】

【专利技术属性】
技术研发人员：史媛媛，
申请(专利权)人：三星电子株式会社，北京三星通信技术研究有限公司，
类型：发明
国别省市：KR

全部详细技术资料下载我是这个专利的主人