基于位置标记的语音识别模型制造技术

技术编号：11265813 阅读：100 留言：0更新日期：2015-04-08 11:42

公开了用于使用模型执行语音识别的方法、系统和包括编码在计算机存储介质上的计算机程序的装置，该模型基于其中说话者做出话语的建筑物内的位置。所述方法、系统和装置包括接收对应于话语的数据和获得用于其中话语被说出的建筑物内的区域的位置标记的动作。进一步的动作包括基于位置标记选择用于语音识别的一个或多个模型，其中每个所选择的一个或多个模型与基于位置标记的权重相关联。此外，动作还包括使用所选择的一个或多个模型和所选择的一个或多个模型的相应权重生成复合模型。所述动作还包括使用复合模型生成话语的转录。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】公开了用于使用模型执行语音识别的方法、系统和包括编码在计算机存储介质上的计算机程序的装置，该模型基于其中说话者做出话语的建筑物内的位置。所述方法、系统和装置包括接收对应于话语的数据和获得用于其中话语被说出的建筑物内的区域的位置标记的动作。进一步的动作包括基于位置标记选择用于语音识别的一个或多个模型，其中每个所选择的一个或多个模型与基于位置标记的权重相关联。此外，动作还包括使用所选择的一个或多个模型和所选择的一个或多个模型的相应权重生成复合模型。所述动作还包括使用复合模型生成话语的转录。【专利说明】基于位置标记的语音识别模型相关申请的夺叉引用本申请要求于2012年8月1日提交的序列号为61/678, 277和于2012年10月15 日提交的序列号为13/651,566的美国临时申请的权益，其整体如同完全记载于此一样通过引用的方式并入。
本说明书总体上涉及自动语音识别。
技术介绍
语音识别通常依赖于所说语言的语音识别模型。然而，对于给定的语言（或给定语言的方言），取决于在何处发出词语而不同地使用词语。例如，当人在他们的客厅中时，他们可能频繁地使用与电视节目和媒体播放器的控制相关的词语，而当人在他们的厨房中时，他们可能使用与食物类型或烹饪相关的词语。用于语音识别的典型语言模型通常没有考虑到在说出词语处的位置特定情境，特别是对于在建筑物（例如在家）内的词语使用的变化。
技术实现思路
一般而言，本说明书中所描述的主题的一方面可以包括自动语音识别引擎（ASR)，该自动语音识别引擎使用基于说话者在建筑物...

【技术保护点】
一种计算机实现的方法，包括：接收对应于话语的数据；获得用于其中所述话语被说出的建筑物内的区域的位置标记；基于所述位置标记选择用于语音识别的一个或多个模型，其中每个所选择的一个或多个模型与基于所述位置标记的权重相关联；使用所选择的一个或多个模型和所选择的一个或多个模型的相应权重来生成复合模型；使用所述复合模型生成所述话语的转录。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：G·陶布曼，B·斯特罗普，
申请(专利权)人：谷歌公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人