语音识别的设备和方法以及训练变换参数的设备和方法技术

技术编号：14895787 阅读：133 留言：0更新日期：2017-03-29 10:59

提供一种语音识别的设备和方法以及训练变换参数的设备和方法。一种语音识别设备包括：声学分数计算器，被配置为使用声学模型来计算语音输入的声学分数；声学分数变换器，被配置为通过使用变换参数，将计算的声学分数变换为与标准发音对应的声学分数；解码器，被配置为解码变换的声学分数以输出语音输入的识别结果。

全部详细技术资料下载

【技术实现步骤摘要】
本申请要求于2015年9月18日提交到韩国知识产权局的第10-2015-0132626号韩国专利申请的权益，该申请的全部公开出于各种目的通过引用包含于此。
下面的描述涉及用于语音识别的设备和方法。
技术介绍
语音识别技术使用声学模型通过使用从用户的语音信号提取的特征来计算针对用户语音的音素概率表。音素概率表通过解码处理被转换成最终识别结果。然而，因为人们具有不同的发音，所以即使当说出相同的短语时，也可基于谁正在说出短语来生成不同的音素表。发音中的轻微差异可通过语言模型来校正。然而，距离标准发音的重大偏差(诸如，由于地区方言的使用造成的重大偏差)可能无法通过语言模型来合适地校正，导致具有独特的发音特征的用户的不便。
技术实现思路
提供本
技术实现思路
从而以简化的形式介绍将在下面的具体实施方式中被进一步描述的构思的选择。本
技术实现思路
不意在标识所要求保护主题的关键特征或必要特征，也不意在作为帮助确定所要求保护的主题的范围而被使用。在一个总体方面中，一种语音识别设备，包括：声学分数计算器，被配置为使用声学模型来计算语音输入的声学分数；声学分数变换器，被配置为通过使用变换参数，...
语音识别的设备和方法以及训练变换参数的设备和方法

【技术保护点】
一种语音识别设备，包括：声学分数计算器，被配置为：使用声学模型来计算语音输入的声学分数；声学分数变换器，被配置为：通过使用变换参数，将计算的声学分数变换为与标准发音对应的声学分数；解码器，被配置为：解码变换的声学分数，以输出语音输入的识别结果。

【技术特征摘要】
2015.09.18 KR 10-2015-01326261.一种语音识别设备，包括：声学分数计算器，被配置为：使用声学模型来计算语音输入的声学分数；声学分数变换器，被配置为：通过使用变换参数，将计算的声学分数变换为与标准发音对应的声学分数；解码器，被配置为：解码变换的声学分数，以输出语音输入的识别结果。2.如权利要求1所述的设备，还包括：语言分数计算器，被配置为：使用语言模型来输出语音输入的语言分数，其中，解码器被配置为：对语言分数和变换的声学分数进行解码，并且输出识别结果。3.如权利要求1所述的设备，还包括：反馈采集器，被配置为基于用户反馈来采集关于识别结果的验证数据。4.如权利要求3所述的设备，还包括：训练器，被配置为基于由声学分数计算器计算的声学分数和采集的验证数据来重新训练变换参数，并且基于所述重新训练来更新变换参数。5.如权利要求4所述的设备，其中，训练器通过将计算的声学分数和采集的验证数据发送到训练设备并且通过从训练设备接收重新训练的变换参数，来更新变换参数。6.如权利要求1所述的设备，其中，声学分数变换器通过使用矩阵积算法、神经网络算法和线性回归算法中的至少一个，将变换参数应用于计算的声学分数。7.如权利要求6所述的设备，其中，被应用的变换参数基于用户的用户标识、群体标识、年龄、地理地区、方言和性别中的至少一个被预先确定。8.一种语音识别方法，包括：使用声学模型来计算语音输入的声学分数；通过使用变换参数，将计算的声学分数变换为针对标准发音的声学分数；解码变换的声学分数以输出语音输入的识别结果。9.如权利要求8所述的方法，还包括：使用语言模型来输出语音输入的语言分数，其中，解码变换的声学分数的步骤包括：对语言分数和变换的声学分数进行解码。10.如权利要求8所述的方法，还包括：基于用户反馈来采集关于识别结果的验证数据。11.如权利要求10所述的方法，还包括：基于由声学分数计算器计算的声学分数和采集的验证数据，来重新训练变换参数；基于所述重新训练来更新变换参数。12.如权利要求10所述的方法，还包括：将计算的声学分数和采集的验证数据发送到训练设备；从训练设备接收重新训练的变换参数；通过使用接收的变换参数来更新变换参数。13.如权利要求8所述的方法，其中，计算的步骤、变换的步骤和解码的步骤由一个或多个处理器来...

【专利技术属性】
技术研发人员：柳尚贤，金重会，朴莹旻，崔喜烈，洪锡珒，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：韩国;KR

全部详细技术资料下载我是这个专利的主人