语音识别方法及电子装置制造方法及图纸

技术编号:8774641 阅读:182 留言:0更新日期:2013-06-08 18:23
本发明专利技术提供一种语音识别方法以及电子装置。其中,所述的语音识别方法用于电子装置,该语音识别方法包括:透过电子装置的用户使用情况收集用户特定信息,其中,用户特定信息特定用于用户;记录用户的发言;使远程服务器产生记录的发言的远程语音识别结果;根据收集的用户特定信息产生记录的发言的再评分信息;以及根据再评分信息对远程语音识别结果进行再评分。本发明专利技术提供的语音识别方法可提供相较于“云语音识别结果”更为准确可靠的语音识别结果,改进用户体验。

【技术实现步骤摘要】

本专利技术有关于一种语音识别方法,更具体地,有关于一种语音识别方法及电子装置
技术介绍
缺乏足够计算功率(c omputing power)处理复杂任务是许多消费电子装置所面临的问题,其中,消费电子装置可例如智能电视(smart television)、平板计算机(tab letcomputer)及智能手机等。幸运地是,云计算(cloud computation)的概念已逐步地减轻了此固有限制。具体地,云计算概念允许消费电子装置作为客户端(client)进行工作并将复杂任务分配给云端的远程服务器(remoteserver)。例如语音识别(speech recognition)便是这种可分配任务。然而,远程服务器使用的大多数语言模型(language model)是为普通用户(average user)而设计。远程服务器不能或几乎不会为每个独立的用户而进行语言模型优化。如果没有对每个独立用户的自定义优化,消费电子装置可能无法向其用户提供最精确可靠的语音识别结果。
技术实现思路
有鉴于此,本专利技术提供一种语音识别方法及电子装置。本专利技术提供一种语音识别方法,用于电子装置,该语音识别方法包括:透过该电子装置的用户使用情况收集用户特定信息,其中,该用户特定信息特定用于该用户;记录该用户的发言;使远程服务器产生该记录的发言的远程语音识别结果;根据该收集的用户特定信息产生该记录的发言的再评分信息;以及根据该再评分信息对该远程语音识别结果进行再评分。本专利技术另提供一种语音识别方法,用于电子装置,该语音识别方法包括:记录该用户发言;从该记录的发言中提取噪声信息;使远程服务器产生该记录的发言的远程语音识别结果;以及根据该提取的噪声信息对该远程语音识别结果进行再评分。本专利技术再提供一种语音识别电子装置,包括:信息收集器,用于透过该电子装置的用户使用情况收集用户特定信息,其中,该用户特定信息特定用于该用户;录音器,用于记录该用户发言;以及再评分信息产生器,耦接于该信息收集器,该再评分信息产生器用于根据该收集的用户特定信息产生该记录的发言的再评分信息;其中,该电子装置用于使远程服务器产生该记录的发言的远程语音识别结果,以及根据该再评分信息对该远程语音识别结果进行再评分。本专利技术还提供一种语音识别电子装置,包括:录音器,用于记录该电子装置的用户发言;以及噪声信息提取器,耦接于该录音器,且该噪声信息提取器用于从该记录的发言中提取噪声信息;其中,该电子装置用于使远程服务器产生该记录的发言的远程语音识别结果;并用于根据该提取的噪声信息对该远程语音识别结果进行再评分。本专利技术提供的语音识别方法可提供相较于“云语音识别结果”更为准确可靠的语音识别结果,改进用户体验。附图说明图1为根据本专利技术一个实施例分布式语音识别系统的方块图;图2为根据本专利技术另一个实施例分布式语音识别系统的方块图;图3为图1/图2的电子装置执行语音识别方法的流程图;图4/图5为根据本专利技术实施例的分布式语音识别系统400/500的方块图;图6为图4/图5的电子装置执行语音识别方法的流程图;图7为根据本专利技术一个实施例的分布式语音识别系统的方块图;图8为根据本专利技术一个实施例的分布式语音识别系统的方块图;图9为图7/图8的电子装置执行语音识别方法的流程图;图10为根据本专利技术一个实施例分布式语音识别系统的方块图;图11为根据本专利技术一个实施例的分布式语音识别系统的方块图;图12为图10/图11的电子装置执行语音识别方法的流程图。具体实施例方式下面的详细描述将介绍本专利技术提出的分布式语音识别系统(distributed speechrecognition system)的若干实施例,其中的每个实施例包括电子装置和远程服务器。电子装置可以为消费电子装置,例如智能电视、平板计算机、智能手机或可以向其用户提供语音识别服务或基于语音识别的服务的任何电子装置。远程服务器可以位于云端并透过互联网与电子装置进行通信。对于语音识别,电子装置和远程服务器具有不同优势;上述多个实施例允许这两个装置中的每一个使用各自优势来促进语音识别。例如,远程服务器的优势之一在于它具有优越的计算功率且可使用复杂模型处理语音识别。而另一方面,电子装置的优势之一在于它与用户距离更近且因此可收集用于增强语音识别的一些辅助信息(auxiliaryinformation).而由于下述任何一个原因,远程服务器不能存取这些辅助信息。例如,辅助信息可包括私人性质的个人信息,因而电子装置避免与远程服务器共享个人信息。又例如,带宽限制和云存储空间限制也可能阻止电子装置与远程服务器共享这些辅助信息。图1为根据本专利技术一个实施例分布式语音识别系统100的方块图。分布式语音识别系统100包括电子装置120和远程服务器140。电子装置120包括信息收集器(information collector) 122、录音器 124、再评分信息产生器(rescoringinformationgenerator) 126 以及结果再评分模块(result rescoring module) 128。远程服务器 140包括远程语音识别器(remote speech recognizer) 142。图2为根据本专利技术另一个实施例分布式语音识别系统200的方块图。分布式语音识别系统200包括电子装置220和远程服务器240。图1和图2中实施例的不同点在于图2中是远程服务器240 (而不是电子装置220)包括结果再评分模块128。图3为图1/图2的电子装置120/220执行语音识别方法的流程图。首先,在步骤310中,信息收集器122透过电子装置120/220的用户使用情况(user’s usage)收集用户特定信息(user-specific information),其中,该用户特定信息特定用于该用户。电子装置120/220连接或未连接至互联网时都可执行此步骤,收集的用户特定信息可包括:用户的联系人列表(contact list)、用户日程表(calendar)中的若干最近事件、若干订阅的内容/服务,若干最近接收/编辑/发送的消息/邮件、若干最近访问的网址、若干最近使用的应用程序、若干最近下载/存取的电子书/歌曲/视频、若干社交网络服务(例如脸谱(Facebook)、推持(Twitter)、谷歌+ (Google+)和微博)的使用情况以及用户的声学特性(acoustic characteristic)等。用户特定信息可揭示用户的个人兴趣、习惯、情感、最常用词语等,因此当用户发言(make an utterance)以使分布式语音识别系统100/200进行识别时,用户特定信息可建议(suggest)用户可能使用的潜在词语(potential word)。换句话说,用户特定信息可包括可用于语音识别的有价值信息。在步骤320中,录音器124记录用户的发言。由于用户想要通过发言而不是通过打字(typing)/手写(writing)的方式向电子装置120/220输入字符串(text string),因此用户可进行发言。又例如,该发言可构成用户对电子装置120/220发出的命令。在步骤330中,电子装置120/220使远程服务器140/240产生该记录的发言的远程语音识别结果。例如,本文档来自技高网...

【技术保护点】
一种语音识别方法,用于电子装置,该语音识别方法包括:透过该电子装置的用户使用情况收集用户特定信息,其中,该用户特定信息特定用于该用户;记录该用户的发言;使远程服务器产生该记录的发言的远程语音识别结果;根据该收集的用户特定信息产生该记录的发言的再评分信息;以及根据该再评分信息对该远程语音识别结果进行再评分。

【技术特征摘要】
2011.12.02 US 61/566,224;2012.03.12 US 13/417,3431.一种语音识别方法,用于电子装置,该语音识别方法包括: 透过该电子装置的用户使用情况收集用户特定信息,其中,该用户特定信息特定用于该用户; 记录该用户的发言; 使远程服务器产生该记录的发言的远程语音识别结果; 根据该收集的用户特定信息产生该记录的发言的再评分信息;以及 根据该再评分信息对该远程语音识别结果进行再评分。2.如权利要求1所述的语音识别方法,其特征在于,该再评分信息包括本地语音识别结果,且该产生该再评分信息的步骤包括: 根据该收集的用户特定信息自适应本地语音识别模型;以及 使用该自适应后的本地语音识别模型产生该记录的发言的该本地语音识别结果。3.如权利要求1所述的语音识别方法,其特征在于,该语音识别方法更包括: 避免与该远程服务器共享至少一部分的该收集的用户特定信息。4.如权利要求1所述的语音识别方法,其特征在于,该收集的用户特定信息包括该远程服务器不能存取的信息。5.一种语音识别方法,用于电子装置,该语音识别方法包括: 记录该用户发言; 从该记录的发言中提取噪声信息; 使远程服务器产生该记录的发言的远程语音识别结果;以及 根据该提取的噪声信息对该远程语音识别结果进行再评分。6.如权利要求5所述的语音识别方法,其特征在于,该对该远程语音识别结果进行再评分的步骤包括: 使用该提取的噪声信息自适应本地语音识别模型; 使用该自适应后的本地语音识别模型产生该记录的发言的本地语音识别结果; 根据该本地语音识别结果对该远程语音识别结果进行再评分。7.如权利要求5所述的语音识别方法,其特征在于,该提取的噪声信息包括信噪比。8.一种语音识别电子装置,包括: ...

【专利技术属性】
技术研发人员:孙良哲郑尧文许肇凌林志鸿
申请(专利权)人:联发科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1