当前位置: 首页 > 专利查询>谷歌公司专利>正文

动态语言模型制造技术

技术编号:11280680 阅读:128 留言:0更新日期:2015-04-09 14:03
用于语音识别的方法、系统和设备,包括在计算机存储介质上编码的计算机程序。其中一种方法包括:接收用于语音识别的基本语言模型,基本语言模型包括具有基本概率值的第一词语序列;接收与查询场境相关联的话音搜索查询;当查询场境满足与定制语言模型相关联的一个或多个准则时,确定要使用定制语言模型;获得定制语言模型,定制语言模型包括具有经过调节的概率值的第一词语序列,经过调节的概率值是基本概率值被根据查询场境来调节的;以及基于一个或多个概率,将话音搜索查询转换为文本搜索查询,每个概率对应于一个或多个词语序列的群组中的词语序列,群组包括具有经过调节的概率值的第一词语序列。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】用于语音识别的方法、系统和设备,包括在计算机存储介质上编码的计算机程序。其中一种方法包括:接收用于语音识别的基本语言模型,基本语言模型包括具有基本概率值的第一词语序列;接收与查询场境相关联的话音搜索查询;当查询场境满足与定制语言模型相关联的一个或多个准则时,确定要使用定制语言模型;获得定制语言模型,定制语言模型包括具有经过调节的概率值的第一词语序列,经过调节的概率值是基本概率值被根据查询场境来调节的;以及基于一个或多个概率,将话音搜索查询转换为文本搜索查询,每个概率对应于一个或多个词语序列的群组中的词语序列,群组包括具有经过调节的概率值的第一词语序列。【专利说明】动态语言模型
本说明书涉及语音识别。
技术介绍
传统的话音(voice)搜索系统目的是将来自用户的话音输入转换为文本搜索查询。在典型的话音搜索系统中,话音接口接收用户的话音输入并将语音输入提供给语音(speech)识别引擎。语音识别引擎可以基于语言模型,将话音输入中的所说出的词语(spoken words)转换为文本搜索查询。然后,话音搜索系统将文本搜索查询提交给搜索引擎。因此,话音搜索系统允许用户在不键入文本搜索查询的情况下执行搜索。
技术实现思路
话音搜索系统应用定制语言模型将语音输入转换为文本搜索查询。话音搜索系统获得例如使用匿名搜索日志数据的集合构成的基本语言模型。话音搜索系统基于一个或多个定制准则(例如,地理位置、时间或气象)定制基本语言模型。在定制语言模型中,调节分配给与定制准则有关的一个或多个词语序列(word sequence)的概率值。 当话音搜索系统接收话音搜索查询时,话音搜索系统确定话音搜索查询的场境(context)。当场境成分满足定制准则时,话音搜索系统确定定制语言模型。然后,话音搜索系统使用定制语言模型将话音搜索查询转换为文本搜索查询。 一般而言,本说明书中所描述的主题的一个创新性方面可以在这样的方法中具体实施,所述方法包括以下动作:接收用于语音识别的基本语言模型,所述基本语言模型包括具有基本概率值的第一词语序列;接收话音搜索查询,所述话音搜索查询与查询场境相关联;当所述查询场境满足与定制语言模型相关联的一个或多个准则时,确定要使用所述定制语言模型;获得所述定制语言模型,所述定制语言模型包括具有经过调节的概率值的第一词语序列,所述经过调节的概率值是所述基本概率值被根据所述查询场境来调节的;以及基于一个或多个概率,将所述话音搜索查询转换为文本搜索查询,所述一个或多个概率的每一个对应于一个或多个词语序列的群组中的词语序列,所述一个或多个词语序列的群组包括所述具有经过调节的概率值的第一词语序列。该方案的其他实施例包括对应的计算机系统、装置以及记录在一个或多个计算机存储设备上的计算机程序,每个被配置为执行所述方法的动作。一个或多个计算机的系统可以被配置为借助于将在操作中使得系统执行动作的软件、固件、硬件或者它们的组合安装在系统上,执行特定的操作或动作。一个或多个计算机程序可以被配置为借助于包括指令来执行特定的操作或动作,当通过数据处理装置执行时,指令使得设备执行所述动作。 前述和其他实施例可以分别可选地包括一个或多个以下特征,单独或组合。获得所述定制语言模型包括基于所述查询场境从一个或多个定制语言模型中选择所述定制语言模型。获得所述定制语言模型包括使用一个或多个语言调节规则,基于接收的查询场境调节所述基本语言模型。 所述查询场境包括从其接收到所述话音搜索查询的用户设备的地理位置。所述方法包括确定所述词语序列与所述地理位置相关,其中所述经过调节的概率值包括所述基本概率值被基于所述词语序列与所述地理位置之间的关系程度来调节。所述词语序列包括位于所述地理位置或者接近所述地理位置的特征的名称;以及在所述查询场境中基于所述特征与所述地理位置之间的距离确定所述关系程度。所述词语序列包括以超过阈值的频率从所述地理位置接收的过去查询的词(term);以及基于所述频率确定所述关系程度。所述地理位置是一组或多组经玮度坐标限定的地理区域。所述查询场境包括用户提供的标识符,用于与所述话音搜索查询相关联。所述方法包括:确定与所述用户提供的标识符相关联的社团,所述社团包括与所述用户提供的标识符有关的一个或多个用户标识符;使用与所述社团中的所述用户标识符相关联的存储的查询日志,确定所述词语序列的出现频率;以及基于所述出现频率调节所述基本概率值。调节所述基本概率值进一步基于每个所述用户标识符与所述用户提供的标识符之间在所述社团中的关系程度。所述查询场境包括所述话音搜索查询的时间戳。获得所述定制语言模型包括:识别一个或多个电子文档,根据查询日志,所述一个或多个电子文档与搜索查询的数目相关联,所述搜索查询的数目满足阈值数目,所述搜索查询在所述时间戳的指定时间窗口中出现,所述一个或多个电子文档的每一个包括所述词语序列;以及基于所述搜索查询的数目调节所述基本概率值。所述一个或多个电子文档的每一个是新闻文章。所述方法包括:作为所述话音搜索查询的响应,提供所述文本搜索查询的一个或多个搜索结果,以用于在显示设备上显示。将所述话音搜索查询转换为文本搜索查询包括:基于所述定制语言模型中对应的经过调节的概率值,将所述话音搜索查询转换为包括所述第一词语序列的文本搜索查询。 本说明书中所述主题的特定实施例可以被实施为实现一个或多个以下优点。与传统的话音搜索系统相比,使用动态语言模型的话音搜索系统可以基于接收的话音输入提供更恰当的文本搜索查询。因为系统考虑了语音-文本转换中话音输入的特定环境,例如包括接收话音输入的时间、发出话音输入的位置和/或提供话音输入的用户的用户简档,根据特定环境可以定制所得的查询。因此,系统可以提供增强的用户体验。 下面的附图和说明书阐述动态语言建模技术的一个或多个实施例的细节。根据说明书和附图以及根据权利要求书,本技术的其他特征、目的和优点将显而易见。 【专利附图】【附图说明】 图1是提供用于提供话音搜索的示例系统的概述的框图。 图2是图示用于生成动态语言模型的示例规则的框图。 图3是图示动态语言模型的示例的基于地理的规则的视图。 图4是图示动态语言模型的示例的基于社团的规则的视图。 图5A和图5B是图示动态语言模型的示例实施方式的框图。 图6是使用定制语言模型的示例方法的流程图。 不同附图中相同的附图标记表示相同的元件。 【具体实施方式】 图1是提供用于提供话音搜索的示例系统的概述的框图。话音搜索系统102包括一个或多个计算机,计算机被编程为从用户接收用户的语音输入,使用动态语言模型将语音输入转换为文本搜索查询,接收响应于文本搜索查询的搜索结果,并响应于语音输入将搜索结果提供给用户。话音搜索系统102例如可以被实施在包括服务器的一个或多个计算机上,或者用户设备上。 话音搜索系统102包括被配置为从用户接收语音输入106的话音接口 104。话音接口 104例如可包括耦合到用户设备的声学-电学变换器或传感器(例如,麦克风)。语音输入106可包括口语词语序列。 话音搜索系统102包括语音识别子系统108。语音识别子系统108可以是话音搜索系统102的软件组件,其被配本文档来自技高网...
动态语言模型

【技术保护点】
一种方法,包括:接收用于语音识别的基本语言模型,所述基本语言模型包括具有基本概率值的第一词语序列;接收话音搜索查询,所述话音搜索查询与查询场境相关联;当所述查询场境满足与定制语言模型相关联的一个或多个准则时,确定要使用所述定制语言模型;获得所述定制语言模型,所述定制语言模型包括具有经过调节的概率值的所述第一词语序列,所述经过调节的概率值是所述基本概率值被根据所述查询场境来调节的;以及基于一个或多个概率,将所述话音搜索查询转换为文本搜索查询,所述一个或多个概率的每一个对应于一个或多个词语序列的群组中的词语序列,所述一个或多个词语序列的群组包括所述具有经过调节的概率值的第一词语序列。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:佩德罗·J·莫雷诺·门希瓦尔迈克尔·H·科恩
申请(专利权)人:谷歌公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1