用于语言模型自定义的灵活模式制造技术

技术编号:14004360 阅读:41 留言:0更新日期:2016-11-16 17:38
提供了对用于语音识别的语言模型组件的自定义。可以使得语言模式组件的列表可以由计算设备使用。接着,将用于对来自列表的多个语言模型组件进行组合的提示发送至识别服务提供者。该提示可以基于多个不同的领域。接着,可以从识别服务提供者处接收基于该提示的语言模型组件的自定义的组合。

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
诸如智能手机、台式机、笔记本电脑、平板电脑、游戏主控台等之类的许多计算设备都利用包含了自动语音识别(ASR)以在多个不同领域(例如,语音搜索和短消息听写)上使用的应用。为了改进语音识别的质量,常常利用语言模型(例如,购物、游戏、音乐、电影等)来促进对专注于不同领域的语音的识别。目前与语言模型的使用相关联的缺点包括ASR场景,其中不同的领域需要由识别服务提供者同时服务。在这些场景中,可能需要将许多潜在的大语言模型保存在存储器中,这可能会对服务提供者的资源造成负担。关于这些问题和其他问题而完成了本专利技术的各种实施例。
技术实现思路
提供了该
技术实现思路
以用简化的形式介绍在下文的具体实施方式中所进一步描述的概念的选择。该
技术实现思路
不旨在标识所要求保护的主题的关键特征或本质特征,也不旨在帮助确定所要求保护的主题的范围。实施例提供了对用于语音识别的语言模型组件的自定义。可以使语言模型组件的列表可由计算设备使用。接着,将用于对来自列表的多个语言模型组件进行组合的提示发送至识别服务提供者。该提示可以是基于多个不同领域的。接着,可以基于该提示而由计算设备来接收语言模型组件的经自定义的组合。从对以下的具体实施方式的阅读以及对附图的查看,这些和其他特征及优点将是显然的。应当理解的是,前述的一般描述和以下的详细描述都仅是说明性的而不对所要求保护的专利技术进行限制。附图说明图1是根据实施例的示出了用于对用于语音识别的语言模型组件进行自定义的系统的框图;图2是根据实施例的示出了可以由图1的系统所利用的各种提示的框图;图3是根据实施例的示出了可以在图1的系统中利用的各种领域的框图;图4是根据实施例的示出了用于对用于语音识别的语言模型组件进行自定义的例程的流程图;图5是利用其可以实现各种实施例的计算设备的简化框图;图6A是利用其可以实现各种实施例的移动计算设备的简化框图;图6B是利用其可以实现各种实施例的移动计算设备的简化框图;和图7是其中可以实现各种实施例的分布式计算系统的简化框图。具体实施方式实施例提供了对用于语音识别的语言模型组件的自定义。可以使语言模型组件的列表对计算设备可用。接着,将用于对来自列表的多个语言模型组件进行组合的提示发送至识别服务提供者。该提示可以是基于多个领域中的一个领域的。接着,可以基于该提示而由计算设备来接收对语言模型组件的经自定义的组合。在以下的具体描述中,对形成了本文的一部分并且作为图示而示出了具体的实施例或示例的附图进行了参考。可以组合这些实施例、利用其他实施例、并且进行结构改变而不脱离本专利技术的精神和范围。因此,以下的详细描述不应被看作限制性意义,并且本专利技术的范围是由所附的权利要求及其等同物所限定的。现在将参考附图来描述本专利技术的各种方面,在几幅图通篇中的相同的附图标记表示相同的元素。图1是根据实施例的示出了可以用于对用于语音识别的语言模型组件进行自定义的系统100的框图。系统100可以包括可以与被配置为从一个或多个用户(未示出)处接收音频和/或文本输入的计算设备150进行通信的识别服务提供者102。在一个实施例中,识别服务提供者102可以基于由在计算设备150上执行的应用170所提供的、用于针对具体的语音识别领域或场景而定制的语言模型组件的各种组合的“提示”160(即“提示”)(即指引)而被配置为针对对于语音识别的“即时(on-the-fly)”或在线语言模型插值。特别地,并且如将在本文中更加详细地描述的,由应用170所提供的提示160可以包括用于由识别服务提供者102进行的用于语言模型自定义的灵活模式。根据各种实施例,计算设备150可以包括而不限于:台式计算机、膝上型计算机、智能电话、视频游戏控制台、或电视机。计算设备150还可以包括用于检测语音和接收视频/图像的一个或多个记录设备(未示出)(例如,MICROSOFT KINECT、麦克风等)或者与其进行通信。计算设备150可以存储应用170,所述应用170可以被配置为提供可以由识别服务提供者102利用以对语言模型(LM)组件120进行自定义的提示160。根据实施例(并且如将在下文中所详细描述的),应用170可以被配置为生成包括LM组件120的LM组件列表165。在实施例中,LM组件120可以包括可以用于语音识别的组件125A-125N。在一些实施例中,基于具体的领域、场景、或情境,组件125A-125N的各种组合可以包括或被提供有权重130(例如,由应用开发者)。例如,包括针对主要用于游戏的领域或场景而定制的组件125A-125N的组合的语言模型可以具有以下的所应用的权重:游戏:0.5,电影,0.3以及音乐0.2)。其他组件类型(例如,购物等)及权重组合也是可能的。在一些实施例中,可以在对由服务提供者102基于包含在从应用170所接收的提示160中的指引而自定义的组件组合进行选择(即,语言模型105)时来利用LM组件120。特别地,语言模型105可以包括但不限于:预编译的组件组合110、基于主题的组件组合112、固定权重的组件组合114、以及其他组件组合116。例如,包括预编译的组件组合110的语言模型可以针对具体的领域(例如,短消息听写的语音搜索)而定制,包括基于主题的组件组合112的语言模型可以基于可用的项目的预编译列表,所述可用的项目基于与在系统100中当前可用的LM组件相对应的一个或多个主题/风格(例如,购物、游戏、音乐等),并且包括固定权重的组合组件114的语言模型可以包括针对开发者对特定的场景的直觉而定制的LM组件的现有固定权重组合(例如,权重130已被应用于LM组件)。如将在本文中更加详细地描述的,识别服务提供者102可以在针对各种识别情境或场景而选择合适的LM组件组合时利用提示160。在一个实施例中,提示160可以由应用170作为识别请求175(即,针对“即时”)的一部分的语言模型插值而提交至识别服务提供者102。在另一个实施例中,提示160可以由应用170作为离线初始化过程的一部分而提交至识别服务提供者102。根据实施例,应用170可以包括语音识别应用,例如来自华盛顿州Redmond市的MICROSOFT CORPORATION的BING VOICE SEARCH、WINDOWS PHONE SHORT MESSAGE DICTATION、以及XOBX MARKET PLACE VOICE SEARCH应用。然而应当理解的是,可以可替代地利用根据在本文中所描述的各种实施例的来自其他厂家的其他应用(包括操作系统)。图2是根据实施例的示出了可以由图1的系统100利用的各种提示160的框图。提示160可以包括预定义组合提示210、识别主题提示220、重新使用现有组合提示230、文本语料库提示240、以及音频语料库提示250。预定义组合提示210可以包括对覆盖宽泛的领域(例如,语音搜索、短消息听写等)的LM组件(例如,LM组件120)的预定义的选择(例如,由应用开发者)。预定义的选择可以包含,例如,由识别服务提供者102对针对“即时”的组件插值的LM组件的预编译的语言模型或现有的固定权重组合。识别主题提示220可以包含对来自与LM组件120相对应的可用的项目的预编译列表中的一个或多个主题/风格的手动选择。例如,如果LM组件本文档来自技高网...
用于语言模型自定义的灵活模式

【技术保护点】
一种对语言模型组件进行自定义的方法,包括:由计算设备呈现语言模型组件的列表;由所述计算设备发送用于对来自所述列表的多个语言模型组件进行组合的提示,所述提示是基于多个领域中的一个或多个领域的;以及由所述计算设备接收基于所述提示的对所述多个语言模型组件的自定义的组合。

【技术特征摘要】
【国外来华专利技术】2014.03.27 US 14/227,4921.一种对语言模型组件进行自定义的方法,包括:由计算设备呈现语言模型组件的列表;由所述计算设备发送用于对来自所述列表的多个语言模型组件进行组合的提示,所述提示是基于多个领域中的一个或多个领域的;以及由所述计算设备接收基于所述提示的对所述多个语言模型组件的自定义的组合。2.根据权利要求1所述的方法,还包括保持所述提示与所述多个语言模型组件中的一个或多个语言模型组件之间的连接。3.根据权利要求1所述的方法,其中,由所述计算设备发送用于对来自所述列表的多个语言模型组件进行组合的提示包括发送基于所述多个领域中的所述一个或多个领域的对预编译语言模型的选择。4.根据权利要求1所述的方法,其中,由所述计算设备发送用于对来自所述列表的多个语言模型组件进行组合的提示包括发送基于所述多个领域中的所述一个或多个领域的对所述多个语言模型组件的固定权重的组合的选择。5.一种用于对语言模型组件进行自定义的系统,包括:用于存储可执行程序代码的存储器;以及功能地耦合至所述存储器的处理器,所述处理器对包含在所述程序代码内的计算机可执行指令进行响应并且可操作以:呈现语言模型组件的列表;发送用于对来自所述列表的多个语言模型组件进行组合的提示,所述提示是基于多个领域中的一个或多个领域的;接收基于所述提示的对多个会话理解组件的自定义的组合;并且保持所述提示与所述多个语言模型组件中的一个或多个语言模型组件之间的连接。6.根...

【专利技术属性】
技术研发人员:M·列维特H·盖尔曼常双羽S·帕塔萨拉蒂B·杜莫林
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1