语音识别方法和设备技术

技术编号：23534131 阅读：39 留言：0更新日期：2020-03-20 08:12

公开了一种语音识别方法和设备。语音识别设备可从将被识别的输入语音提取语音特征，基于提取的语音特征估计与输入语音的至少一部分对应的第一子词的第一序列，通过组合第一子词将第一序列转换为至少一个第二子词的第二序列，并基于第二序列识别输入语音的剩余部分。

Speech recognition method and equipment

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法和设备本申请要求于2018年9月13日提交到韩国知识产权局的第10-2018-0109459号韩国专利申请的权益，所述韩国专利申请的全部公开出于所有目的通过引用包含于此。
以下描述涉及语音识别技术。
技术介绍
语音识别系统可包括声学模型和语言模型。声学模型可提供关于语音信号最相似于哪个发音的信息，并且语言模型可提供关于特定句子被使用的频率的信息。声学模型和语言模型可通过神经网络来表示。声学模型的编码器可从输入生成编码的特征，并且声学模型的解码器可从编码的特征生成输出。输入可对应于语音，并且输出可包括与发音相关联的信息。编码器和解码器可一起端到端(end-to-end)地被实现。例如，基于字符的端到端声学模型可生成在长度上长的输出，因此其性能可能在速度方面受到限制。针对另一示例，由于大量的输出类别，基于词(word)的端到端声学模型不会被容易地实现。针对另一示例，与基于字符的端到端声学模型相比，由于相对较短的输出的长度，基于子词(subword)的端到端声学模型在速度方面可能是有效的，并且减少基于词的端到端声学模型的输出类别的数量。然而，在基于子词的端到端声学模型的情况下，由于可能不容易被基于子词的端到端声学模型识别的子词，可能发生训练与识别之间的不匹配。因此，存在进一步研究声学模型以提高准确性的期望。
技术实现思路
提供本
技术实现思路
以简化的形式介绍将在以下具体实施方式中进一步描述的构思的选择。本
技术实现思路
不意在标识要求权利的主题的关键特征或必要特征，也不意在...

【技术保护点】
1.一种语音识别方法，包括：/n从将被识别的输入语音提取语音特征；/n基于提取的语音特征估计与输入语音的至少一部分对应的第一子词的第一序列；/n通过组合第一子词将第一序列转换为至少一个第二子词的第二序列；以及/n基于第二序列识别输入语音的剩余部分。/n

【技术特征摘要】
20180913 KR 10-2018-01094591.一种语音识别方法，包括：
从将被识别的输入语音提取语音特征；
基于提取的语音特征估计与输入语音的至少一部分对应的第一子词的第一序列；
通过组合第一子词将第一序列转换为至少一个第二子词的第二序列；以及
基于第二序列识别输入语音的剩余部分。

2.根据权利要求1所述的语音识别方法，其中，估计第一序列的步骤包括：
使用通过神经网络实现的端到端编码器-解码器来估计包括在输入语音的所述至少一部分中的第一子词中的每个，
其中，端到端编码器-解码器的输出层包括与子词词典中的子词对应的节点。

3.根据权利要求2所述的语音识别方法，其中，子词词典基于使用频率来记录从词分离的子词。

4.根据权利要求1所述的语音识别方法，其中，将第一序列转换为第二序列的步骤包括：
基于第一子词生成与端到端编码器-解码器可识别的词对应的至少一个第二子词。

5.根据权利要求4所述的语音识别方法，其中，可识别的词是用于训练端到端编码器-解码器的词。

6.根据权利要求1所述的语音识别方法，其中，将第一序列转换为第二序列的步骤包括：
通过组合第一子词中的至少两个来生成子词词典中的第二子词。

7.根据权利要求1所述的语音识别方法，其中，将第一序列转换为第二序列的步骤包括：
响应于从第一子词产生的词完成，生成与完成的词对应的至少一个第二子词。

8.根据权利要求1所述的语音识别方法，其中，将第一序列转换为第二序列的步骤包括：
确定词是否通过第一子词中的最后生成的第一子词来完成；
响应于词完成，从子词词典辨识与第一子词的至少一个组合匹配的至少一个第二子词；以及
将第一子词转换为辨识的至少一个第二子词。

9.根据权利要求8所述的语音识别方法，其中，确定词是否通过最后生成的第一子词来完成的步骤包括：
基于关于最后生成的第一子词中是否存在间隔的信息来确定词是否完成。

10.根据权利要求1所述的语音识别方法，其中，将第一序列转换为第二序列的步骤包括：
使用文本子词解码器从第一序列生成文本；
通过使用文本子词编码器对所述文本进行编码来生成所述至少一个第二子词的第二序列；以及
响应于第一序列与第二序列彼此不同，将第一序列转换为第二序列。

11.根据权利要求10所述的语音识别方法，其中，与输入语音的至少一部分对应的子词的序列的估计在每个时间点被重复地执行，其中，第一序列在当前时间点被估计，
其中，将第一序列转换为第二序列的步骤包括：
通过从当前点减去通过从...

【专利技术属性】
技术研发人员：李敏重，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：韩国;KR

全部详细技术资料下载我是这个专利的主人