语音识别设备和方法技术

技术编号：15620704 阅读：141 留言：0更新日期：2017-06-14 04:35

提供一种语音识别设备和方法。一种语音识别设备，包括：预测器，被配置为基于已被之前搜索的单词序列预测跟随已被之前搜索的单词序列的单词的词类；解码器，被配置为搜索与语音信号对应的候选单词，使用已被搜索的候选单词扩展之前已被搜索的单词序列，并基于预测的词类调整扩展的单词序列的概率值。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别设备和方法本申请要求于2015年11月30日提交到韩国知识产权局的第10-2015-0168967号韩国专利申请的优先权，该申请的全部公开出于所有目的通过引用全部包含于此。
下面的描述涉及一种语音识别设备和方法。
技术介绍
与过去的现有技术不同，最近的语音识别技术已引起广泛的关注。这是因为语音识别技术的实现允许互联网信息、电子商务和在使用语音的各种普遍存在的环境中的操作的使用更加方便，并且甚至在用户难以使用他们的双手时也能满足用户的各种需要，诸如，启用互联网访问、实施商业事务以及使用其他服务。
技术实现思路
提供
技术实现思路
从而以简化的形式介绍构思的选择，其将在下面的具体实施方式中将被进一步描述。
技术实现思路
不意在确定所要求保护主题的关键特征或必要特征，也不意在用作辅助确定所要求保护的主题的范围。在一个总体方面中，一种语音识别设备，包括：预测器，被配置为基于之前已被搜索的单词序列预测跟随之前已被搜索的单词序列的单词的词类；解码器，被配置为搜索与语音信号对应的候选单词，使用已被搜索的候选单词扩展之前已被搜索的单词序列，并基于预测的词类调整扩展的单词序列的概率值。词类可为实体名或词性；实体名可为人名、位置名、组织名、日期、时间、书名、电影名、音乐名或TV节目名。预测器还可被配置为：使用词类预测模型预测跟随之前已被搜索的单词序列的单词的词类。词类预测模型可基于词典和语法以规则集的形式被构造，或者可使用命名的实体识别方案和词性标注方案的任何一个或两者通过机器学习被构造。词类预测模型可为基于递归神经网络(RNN)的模型。解码器还可被配置为：使用以加权有限状态转换...
语音识别设备和方法

【技术保护点】
一种语音识别设备，包括：预测器，被配置为基于之前已被搜索的单词序列预测跟随之前已被搜索的单词序列的单词的词类；解码器，被配置为搜索与语音信号对应的候选单词，使用已被搜索的候选单词扩展之前已被搜索的单词序列，并基于预测的词类调整扩展的单词序列的概率值。

【技术特征摘要】
2015.11.30 KR 10-2015-01689671.一种语音识别设备，包括：预测器，被配置为基于之前已被搜索的单词序列预测跟随之前已被搜索的单词序列的单词的词类；解码器，被配置为搜索与语音信号对应的候选单词，使用已被搜索的候选单词扩展之前已被搜索的单词序列，并基于预测的词类调整扩展的单词序列的概率值。2.如权利要求1所述的语音识别设备，其中，词类为实体名或词性；实体名为人名、位置名、组织名、日期、时间、书名、电影名、音乐名或TV节目名。3.如权利要求1所述的语音识别设备，其中，预测器还被配置为：使用词类预测模型预测跟随之前已被搜索的单词序列的单词的词类。4.如权利要求3所述的语音识别设备，其中，词类预测模型基于词典和语法以规则集的形式被构造，或者使用命名的实体识别方案和词性标注方案中的任何一个或两者通过机器学习被构造。5.如权利要求3所述的语音识别设备，其中，词类预测模型为基于递归神经网络(RNN)的模型。6.如权利要求1所述的语音识别设备，其中，解码器还被配置为：使用以加权有限状态转换器(WFST)的形式在数据结构中构造的发音词典和语言模型来搜索候选单词。7.如权利要求1所述的语音识别设备，其中，解码器还被配置为：从未来的搜索目标排除已被搜索的候选单词之中的不属于预测的词类的候选单词。8.如权利要求1所述的语音识别设备，其中，解码器还被配置为：在已被搜索的候选单词之中增加属于预测的词类的候选单词的概率值。9.如权利要求1所述的语音识别设备，其中，解码器还被配置为：在已被搜索的候选单词之中增加属于预测的词类的并包括在个性化的语言模型中的候选单词的概率值。10.如权利要求1所述的语音识别设备，其中，预测器还被配置为：预测跟随之前已被搜索的单词序列的单词的词类概率分布；解码器还被配置为：通过用每一候选单词的概率值乘以该候选单词所属的词类的预测的概率值，调整每一候选单词的概率值。11.一种语音识别方法，包括：基于之前已被搜索的单词序列预测跟随之前已被搜索的单词序列的单词的词类；搜索与语音信号对应的候选单词；使用已被搜索的候选单词扩展之前已被搜索的单词序列；基于预测的词类调整扩展的单词序列的概率值。12.如权利要求11所述的语音识别方法，其中，词类为实体名或词性；实体名为人名、位置名、组织名、日期、时间、书名、电影名、音乐名或TV节目名。13.如权利要求11所述的语音识别方法，其中，所述预测词类的步骤包括：使用词类预测模型预测跟随之前已被搜索的单词序列的单词的词类。14.如权利要求13所述的语音识别方法，其中，词类预测模型基于词典和语法以规则集的形式被构造，或者使用命名的实体识别方案和词性标注方案的任何一个或两者通过机器学习被构造。15.如权利要求13所述的语音识别方法，其中，词类预测模型为基于递归神经网络(RNN)的模型。16.如权利要求11所述的语音识别方法，其中，所述搜索候选单词的步骤包括：使用以加权有限状态转换器(WFST)的形式在数据结构中构造的发音词典和语言模型搜索候选单词。17.如权利要求11所述的语音识别方法，还包括：从未来的搜索目标排除已被搜索的候选单词之中的不属于预测的词类的候选单词。18.如...

【专利技术属性】
技术研发人员：李知炫，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：韩国,KR

全部详细技术资料下载我是这个专利的主人