基于语音识别的拨号制造技术

技术编号:15529676 阅读:93 留言:0更新日期:2017-06-04 16:58
本发明专利技术提供一种基于语音识别的拨号方法和一种基于语音识别的拨号系统。所述方法包括:基于用户的语音输入、至少一个声学模型和至少一个语言模型而确定识别结果,其中所述至少一个声学模型和所述至少一个语言模型是基于电子装置中收集的信息而获得。所述系统包括:基于电子装置中收集的信息而获得至少一个声学模型和至少一个语言模型;以及基于用户的语音输入、所述至少一个声学模型和所述至少一个语言模型而确定识别结果。基于所述电子装置中收集的所述信息而更新所述声学模型和所述语言模型,这可以有助于所述基于语音识别的拨号。

Dialing based on speech recognition

The invention provides a dialing method based on speech recognition and a dialing system based on speech recognition. The method includes: user voice input, at least one of the at least one acoustic model and language model is determined based on the results of recognition, wherein the at least one acoustic model and the at least one language model is obtained on the basis of collecting information in electronic device. The system includes: obtaining at least one acoustic model and at least one language model based on the collected information in the electronic device; and based on voice input, the user of the at least one acoustic model and the at least one language model and determine the identification results. The acoustic model and the language model are updated based on the information collected in the electronic device, which can help the voice based dialing.

【技术实现步骤摘要】
【国外来华专利技术】基于语音识别的拨号
本专利技术总体涉及基于语音识别的拨号。
技术介绍
语音拨号是电子装置,诸如电话或安装在车辆上的音响单元中的有用功能,有了所述功能,电子装置可使用语音识别技术在电话簿内检索联系人姓名或电话号码。在一些现有的解决方案中,电子装置只支持用特定语言,诸如汉语、英语和日语来拨号,所述特定语言的对应的声学模型和语言模型已预先存储在电子装置中。
技术实现思路
在一个实施方案中,提供了基于语音识别的拨号方法。所述方法包括:基于用户的语音输入、至少一个声学模型和至少一个语言模型而确定识别结果,其中至少一个声学模型和至少一个语言模型是基于电子装置中收集的信息而获得。在一些实施方案中,电子装置中收集的信息可以包括用语言书写的内容,并且至少一个声学模型和至少一个语言模型对应于所述语言。在一些实施方案中,电子装置中收集的信息可以指示地点,并且至少一个声学模型和至少一个语言模型对应于所述地点内使用的语言。在一些实施方案中,所收集的信息可以包括电子装置中的电话簿中的内容。在一些实施方案中,电话簿中的内容可以包括联系人姓名和对应的电话号码。在一些实施方案中,所收集的信息还可以包括电子装置的操作系统的语言。在一些实施方案中,所收集的信息还可以包括电子装置的历史位置信息。在一些实施方案中,至少一个声学模型和至少一个语言模型可以被包含在不同的语音识别引擎中。在一些实施方案中,可以基于电子装置中收集的信息而获得至少一个语音识别引擎。在一些实施方案中,可以基于电子装置中收集的信息而确定用户在对电子装置说出语音输入时可能使用何种语言;并且可以基于所确定的语言而获得至少一个声学模型和至少一个语言模型。在一些实施方案中,可以将语音输入的识别结果与电话簿中的内容进行比较,并且可以将电话簿中与识别结果匹配的内容确定为是目标联系人姓名。目标联系人姓名表示包括在来自用户的语音输入中的联系人姓名,也就是说,目标联系人姓名是用户想要呼叫的人。在一些实施方案中,所确定的目标联系人姓名可以包括多个可能的联系人姓名,并且多个可能的联系人姓名中的一个可以被用户选择来拨打电话。在一个实施方案中,提供了基于语音识别的拨号系统。基于语音识别的拨号系统可以包括处理装置,所述处理装置用于:基于电子装置中收集的信息而获得至少一个声学模型和至少一个语言模型;并且基于用户的语音输入、至少一个声学模型和至少一个语言模型而确定识别结果。在一些实施方案中,电子装置中收集的信息可以包括用语言书写的内容,并且至少一个声学模型和至少一个语言模型对应于所述语言。在一些实施方案中,电子装置中收集的信息可以指示地点,并且至少一个声学模型和至少一个语言模型对应于所述地点内使用的语言。在一些实施方案中,所收集的信息可以包括电子装置中的电话簿中的内容。在一些实施方案中,电话簿中的内容可以包括联系人姓名和对应的电话号码。在一些实施方案中,所收集的信息还可以包括电子装置的操作系统的语言。在一些实施方案中,所收集的信息还可以包括电子装置的历史位置信息。在一些实施方案中,电子装置可以包括麦克风以便接收用户的语音输入。在一些实施方案中,处理装置可以安装在电子装置上。在一些实施方案中,电子装置可以是音响单元或手机。在一些实施方案中,处理装置可以还用于:基于电子装置中收集的信息而确定用户在对电子装置说出语音输入时可能使用何种语言;并且可以基于所确定的语言而下载至少一个声学模型和至少一个语言模型。在一些实施方案中,至少一个声学模型和至少一个语言模型被包含在不同的语音识别引擎中。在一些实施方案中,处理装置可以还用于基于电子装置中收集的信息而下载至少一个语音识别引擎。在一些实施方案中,处理装置可以还用于:将语音输入的识别结果与电话簿中的内容进行比较;并且将电话簿中与识别结果匹配的内容确定为是目标联系人姓名。目标联系人姓名表示包括在来自用户的语音输入中的联系人姓名,也就是说,目标联系人姓名是用户想要呼叫的人。在一些实施方案中,处理装置可以安装在服务器上。在一些实施方案中,电子装置可以用于向服务器发送所收集的信息,并且处理装置可以还用于:基于电子装置中收集的信息而确定用户对电子装置说出的可能的语言;并且基于可能的语言而获得至少一个声学模型和至少一个语言模型。在一些实施方案中,电子装置可以用于:基于电子装置中收集的信息而确定用户对电子装置说出的可能的语言,并向服务器发送包含可能的语言的列表,并且处理装置可以用于基于接收的可能的语言而获得至少一个声学模型和至少一个语言模型。在一些实施方案中,电子装置可以还用于向服务器发送用户的语音输入,并且服务器可以还用于向电子装置发送识别结果。在一些实施方案中,至少一个声学模型和至少一个语言模型被包含在不同的语音识别引擎中。在一些实施方案中,处理装置可以还用于:基于电子装置中收集的信息而获得至少一个语音识别引擎。附图说明本专利技术的前述和其他特征将从以下结合附图进行的描述和随附权利要求书中变得更充分地显而易见。应理解,这些图仅展示根据本专利技术的若干实施方案,并且因此不应被视为对本专利技术范围的限制,因而将通过使用附图来更明确且更详细地描述本专利技术。图1是一般语音识别系统的示意图;图2是根据实施方案的语音识别拨号方法100的流程图;图3是根据实施方案的语音识别拨号方法200的流程图;图4是根据实施方案的安装在第一车辆上的语音识别拨号系统300的示意性框图;以及图5是根据实施方案的语音识别拨号系统400的示意性框图。具体实施方式在以下具体实施方式中,参考了形成其一部分的附图。在附图中,除非上下文另外指出,否则类似的符号通常标识类似的部件。在具体实施方式、附图和权利要求书中描述的说明性实施方案并不意味着是限制性的。在不脱离此处提出的主题的精神或范围的情况下,可以利用其他实施方案并且可以作出其他改变。将容易理解的是,如本文大体所述和图中所示的本专利技术的各方面可以多种不同的配置加以布置、替换、组合和设计,所有这些不同的配置都被本专利技术明确涵盖并且成为本专利技术的一部分。语音拨号是电子装置中能为用户带来很大便利的功能。例如,当用户在驾驶过程中想要呼叫一个人时,他或她可能不能通过按压移动电话或音响单元上的对应的按键,而是通过对支持语音拨号的音响单元说出联系人姓名或电话号码来给那个人拨打电话。音响单元将基于语音识别技术而检索联系人姓名或电话号码。语音识别是将音频输入转换成文本的过程。一般而言,语音识别过程由被称为语音识别引擎的软件部件来执行。语音识别引擎的主要功能是处理音频输入,并且将所述音频输入翻译成电子装置可以读懂的文本。图1是一般语音识别系统的示意图。一般而言,语音识别引擎需要两种类型的文件来识别语音。一种类型是声学模型,所述声学模型通过以下方式来创建:获取语音的声学记录及其转录(获自语音库),并且(通过称为“训练”的过程)将它们“编译”成组成每个字词的声音的统计表示。另一种类型是语言模型。语言模型使用特定语法或一系列规则来定义能够被语音识别引擎识别的字词和短语。语言模型可以像字词列表一样简单,或者它可以有足够的灵活性以允许可以说出的话语具有可变性,以使得所述语言模型逼近自然语言能力。一旦语音识别引擎识别出说出的话语的最有可能的匹配,所述语音识别引擎就将其识别出的话语作为文本串返回。在实践中,语音识别引本文档来自技高网...
基于语音识别的拨号

【技术保护点】
一种基于语音识别的拨号方法,其特征在于,包括:基于用户的语音输入、至少一个声学模型和至少一个语言模型而确定识别结果,其中所述至少一个声学模型和所述至少一个语言模型是基于电子装置中收集的信息而获得。

【技术特征摘要】
【国外来华专利技术】1.一种基于语音识别的拨号方法,其特征在于,包括:基于用户的语音输入、至少一个声学模型和至少一个语言模型而确定识别结果,其中所述至少一个声学模型和所述至少一个语言模型是基于电子装置中收集的信息而获得。2.根据权利要求1所述的基于语音识别的拨号方法,其特征在于,所述电子装置中收集的所述信息包括用语言书写的内容,并且所述至少一个声学模型和所述至少一个语言模型对应于所述语言。3.根据权利要求1所述的基于语音识别的拨号方法,其特征在于,所述收集的信息包括所述电子装置中的电话簿中的内容。4.根据权利要求1所述的基于语音识别的拨号方法,其特征在于,所述收集的信息指示地点,并且所述至少一个声学模型和所述至少一个语言模型对应于所述地点内使用的语言。5.根据权利要求1所述的基于语音识别的拨号方法,其特征在于,所述收集的信息包括所述电子装置的历史位置信息。6.根据权利要求1所述的基于语音识别的拨号方法,其特征在于,基于所述电子装置中收集的所述信息而确定所述用户在对所述电子装置说出所述语音输入时可能使用何种语言;并且基于所述确定的语言而获得所述至少一个声学模型和所述至少一个语言模型。7.根据权利要求1所述的基于语音识别的拨号方法,其特征在于,将所述语音输入的所述识别结果与所述电子装置中的电话簿中的内容进行比较,并且将所述电话簿中与所述识别结果匹配的内容确定为是目标联系人姓名。8.根据权利要求1所述的基于语音识别的拨号方法,其特征在于,基于所述电子装置中收集的所述信息而获得语音识别引擎。9.一种基于语音识别的拨号系统,其特征在于,包括:处理装置,所述处理装置用于:基于电子装置中收集的信息而获得至少一个声学模型和至少一个语言模型;以及基于用户的语音输入、所述至少一个声学模型和所述至少一个语言模型而确定识别结果。10.根据权利要求9所述的基于语音识别的拨号系统,其特征在于,所述电子装置中收集的所述信息包括用语言书写的内容,并且所述至少一个声学模型和所述至少一个语言模型对应于所述语言。11.根据权利要求9所述的基于语音识别的拨...

【专利技术属性】
技术研发人员:马建军胡利萍理查德·艾伦·克赖费尔特
申请(专利权)人:哈曼国际工业有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1