当前位置: 首页 > 专利查询>索尼公司专利>正文

学习装置和方法以及程序制造方法及图纸

技术编号:25317091 阅读:66 留言:0更新日期:2020-08-18 22:33
本技术涉及一种学习设备和方法以及程序,其使得可以以足够的识别精度和响应速度来执行语音识别。一种学习设备,包括模型学习单元,其基于以下来学习用于识别处理的模型:从学习数据提取的特征量;以及当特征量被输入到解码器时来自解码器的输出,该解码器用于识别处理并构成条件变分自动编码器。本技术可应用于学习设备。

【技术实现步骤摘要】
【国外来华专利技术】学习装置和方法以及程序
本技术涉及学习装置和方法以及程序,并且更具体地涉及允许语音识别具有足够的识别精度和响应速度的学习装置和方法以及程序。
技术介绍
近年来,对语音识别系统的需求不断增长,并且注意力已经集中在学习在语音识别系统中起重要作用的声学模型的方法上。例如,作为学习声学模型的技术,已经提出了利用其属性未知的用户的语音作为训练数据的技术(例如,参见专利文献1)、使用不同语言的多个声学模型来学习目标语言的声学模型的技术(例如,参见专利文献2)等。引文列表专利文献专利文献1:日本专利申请公开第2015-18491号专利文献2:日本专利申请公开第2015-161927号
技术实现思路
本专利技术要解决的问题顺便提及,假定普通的声学模型可以在大规模计算机等上运行,并且没有特别考虑声学模型的尺寸以实现高识别性能。随着声学模型的尺寸或比例的增加,使用声学模型的识别处理时的计算量相应地增加,导致响应速度降低。然而,由于语音识别系统作为接口的有用性,因此也期望它们在小型设备等上高本文档来自技高网...

【技术保护点】
1.一种学习装置,包括/n模型学习单元,基于将从学习数据中提取的特征输入到用于构成条件变分自动编码器的识别处理的解码器时的所述解码器的输出和所述特征,来学习用于所述识别处理的模型。/n

【技术特征摘要】
【国外来华专利技术】20180110 JP 2018-0019041.一种学习装置,包括
模型学习单元,基于将从学习数据中提取的特征输入到用于构成条件变分自动编码器的识别处理的解码器时的所述解码器的输出和所述特征,来学习用于所述识别处理的模型。


2.根据权利要求1所述的学习装置,其中,
所述模型的规模小于所述解码器的规模。


3.根据权利要求2所述的学习装置,其中,
规模是所述模型的复杂度。


4.根据权利要求1所述的学习装置,其中,
所述数据是语音数据,并且所述模型是声学模型。


5.根据权利要求4所述的学习装置,其中,
所述声学模型包括神经网络。


6.根据权利要求1所述的学习装置,其中,
所述模型学习...

【专利技术属性】
技术研发人员:柏木阳佑
申请(专利权)人:索尼公司
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1