语音命令识别方法和电子装置制造方法及图纸

技术编号:9061252 阅读:126 留言:0更新日期:2013-08-22 00:25
本发明专利技术提供一种语音命令识别方法,其特征在于,包括:从浏览文件的多个与命令相关的文本字符串中选择多个候选文本字符串;为每个候选文本字符串准备候选语音字符串;接收语音命令;从多个候选语音字符串中搜索匹配所述语音命令的目标语音字符串,其中所述目标语音字符串对应于所述多个候选文本字符串中的目标文本字符串;以及执行与所述目标文本字符串相关的命令。通过利用本发明专利技术,可使浏览文件更加简便和直观。

【技术实现步骤摘要】
语音命令识别方法和电子装置
本专利技术有关于命令识别(commandrecognition),且尤其有关于语音命令识别(voicecommandrecognition)。
技术介绍
使用电子装置来浏览文件获取信息是很多人每天都要做的事情。上述电子装置如个人电脑(PersonalComupter,PC)、笔记本电脑(NotebookComputer,NB)、平板电脑(tabletcomputer)、智能手机、网络电视(InternetProtocolTelevision,IPTV)、机顶盒(set-topbox,STB)以及游戏机(videogameconsole)等;而上述文件如网页或其它包含信息的文件。文件,尤其是网页,可包含多个与命令相关的(command-associated)文本字符串(textstring)。无论是以文本格式还是在图像中出现,一个与命令相关的文本字符串可包含一个或多个连续的字母/字(letter/word)。每个与命令相关的文本字符串与至少一个命令相关,上述命令可为与超链接有关的(hyperlink-related)命令,如可使得电子装置打开另一文件,或者跳到当前浏览的文件或另一文件中的书签(bookmark)。在另一示范例中,另一类型的命令可使得电子装置显示菜单/图片、开始应用程序或者向拥有其所浏览文件的装置发送信息。一般来说,若一与命令相关的文本字符串位于文件的显示区域内,则用户在浏览文件时可看到该文本字符串。相反地,由于相关的命令通常仅出现在源代码中且并不显示出来,所以用户在浏览文件时一般不会看到相关命令的细节。图1是专利申请人在2012年1月10日所使用的USPTO专利网页的一部分的示意图,且图中有申请人加的斜体标注。该网页的网址是http://www.uspto.gov/patents/index.jsp,且标题栏区域包含多个与命令相关的文本字符串:“PATENTS”,“TRADEMARKS”,“IPLAW&POLICY”,...,“FAQs”以及“ABOUT”。举例来说,与命令相关的文本字符串“IPLAW&POLICY”与一有关超链接的命令相关,其中点击该有关超链接的命令可打开网页http://www.uspto.gov/ip/index.jsp。此外,图1所示网页的侧边栏区域也包括多个与命令相关的文本字符串:“PatentProcess”,“PatentClassification”,“PatentForms”,...,“EmployeeLocator”以及“ContactPatents”。举例来说,与命令相关的文本字符串“PatentForms”与一有关超链接的命令相关,其中点击该有关超链接的命令可打开网页http://www.uspto.gov/forms/index.jsp。此外,图1所示网页的正文区域包括多个图片:“SearchPatents”,“PAIR”,“EFS-Web”,...,“ACCELERATEDEXAMINATION”以及“ContactUs”。图片中所包含的文本字符串均为与命令相关的文本字符串。举例来说,与命令相关的文本字符串“PAIR”与一有关超链接的命令相关,其中点击该有关超链接的命令可打开网页http://www.uspto.gov/patents/process/status/index.jsp。当用户在浏览文件时对与某一命令相关的文本字符串进行操作时,原本浏览文件的电子装置将执行该命令。通常来说,用户可以通过将光标移动到该与命令相关的文本字符串上,或通过点击/触摸该与命令相关的文本字符串,来触发电子装置执行该命令。上述段落所提到的传统方法可满足部分人的需求,但是仍有很多人对一些其它的非传统方法感兴趣。上述传统方法可能更适于PC、NB、平板电脑和智能手机的用户,而对于IPTV、STB以及游戏机的用户来说,由于他们所用的装置并不具有传统的用户输入界面,因此传统方法有时难以适用。
技术实现思路
有鉴于此,本专利技术提供一种语音命令识别方法和电子装置。本专利技术一实施例提供一种语音命令识别方法,其特征在于,包括:从浏览文件的多个与命令相关的文本字符串中选择多个候选文本字符串;为每个候选文本字符串准备候选语音字符串;接收语音命令;从多个候选语音字符串中搜索匹配所述语音命令的目标语音字符串,其中所述目标语音字符串对应于所述多个候选文本字符串中的目标文本字符串;以及执行与所述目标文本字符串相关的命令。本专利技术另一实施例提供一种电子装置,其特征在于,包括:文本字符串选择器,用来从浏览文件的多个与命令相关的文本字符串中选择多个候选文本字符串;语音字符串提供者,用来为每个候选文本字符串准备候选语音字符串;麦克风,用来接收语音命令;以及语音识别器,用来在多个候选语音字符串中搜索匹配所述语音命令的目标语音字符串,所述目标语音字符串对应于所述多个候选文本字符串中的目标文本字符串;其中所述电子装置用来执行与所述目标文本字符串相关的命令。通过利用本专利技术,可使浏览文件更加简便和直观。附图说明图1是专利申请人在2012年1月10日所使用的USPTO专利网页的一部分的示意图。图2是根据本专利技术一实施例的电子装置的方块示意图。图3是根据本专利技术一实施例的方法的流程图。图4是根据本专利技术一实施例的电子装置的方块示意图。图5是根据本专利技术一实施例的电子装置的方块示意图。图6是加入附加标号索引后呈现在用户面前的画面。图7是加入示范性符号后显示在用户面前的画面。具体实施方式图2是根据本专利技术一实施例的电子装置的方块示意图。电子装置200的功能之一在于允许其用户浏览文件。浏览的文件可为网页或其它包含有信息的文件。明确来说,该文件包括多个与命令相关的字符串。无论是以文本格式还是在图像中出现,一个与命令相关的文本字符串可包含一个或多个连续的字母/字。显示装置将与命令相关的文本字符串显示出来后,该文本字符串对电子装置200的用户可见。其中,该显示装置可以位于电子装置200中,也可以位于电子装置200之外而与电子装置200相连接。举例来说,显示装置可为屏幕,或者为可将图片投射到投影屏幕上的投影仪。每个与命令相关的文本字符串均与至少一个命令相关,其中命令的详情一般不显示给用户。电子装置200的特性之一在于用户可通过语音命令使电子装置200执行相关命令。为了实现该功能,本实施例中的电子装置200可包括麦克风210、文件浏览器220、文本字符串选择器230、语音字符串提供者240以及语音识别器250。为了简单起见,图2省略了电子装置200的其它组件。除了麦克风210之外,图2中所示的所有组件均可通过专用硬件或一般用途处理器(generalpurposeprocessor)实现。尽管图2中的组件均被绘示为电子装置200的内部组件,但所有组件均可位于电子装置200的外部,并通过有线或无线连接来为电子装置200工作。举例来说,麦克风210可置于远端装置(如手机或远端控制)中,并可与电子装置200进行无线通信。此外,其它的四个组件均可位于“云”中以进行云计算(cloudcomputation)。图3是根据本专利技术一实施例的方法的流程图。图3中的方法300可由图2中的电子装置200执行。为了简单起本文档来自技高网
...
语音命令识别方法和电子装置

【技术保护点】
一种语音命令识别方法,其特征在于,包括:从浏览文件的多个与命令相关的文本字符串中选择多个候选文本字符串;为每个候选文本字符串准备候选语音字符串;接收语音命令;从多个候选语音字符串中搜索匹配所述语音命令的目标语音字符串,其中所述目标语音字符串对应于所述多个候选文本字符串中的目标文本字符串;以及执行与所述目标文本字符串相关的命令。

【技术特征摘要】
2012.02.21 US 13/400,5851.一种语音命令识别方法,其特征在于,包括:从浏览文件的多个与命令相关的文本字符串中选择多个候选文本字符串,其中所述多个与命令相关的文本字符串在显示装置上显示给用户;为每个候选文本字符串准备候选语音字符串,其中每个候选语音字符串代表对应的候选文本字符串在所述多个候选文本字符串中的顺序的发音,或者代表对应的候选文本字符串旁边所显示符号的发音;接收语音命令;从多个候选语音字符串中搜索匹配所述语音命令的目标语音字符串,其中所述目标语音字符串对应于所述多个候选文本字符串中的目标文本字符串;以及执行与所述目标文本字符串相关的命令。2.如权利要求1所述的语音命令识别方法,其特征在于,其中为每个候选文本字符串准备候选语音字符串的步骤包括:将每个候选文本字符串转换为候选语音字符串,其中所述候选语音字符串代表对应的候选文本字符串的发音。3.如权利要求1所述的语音命令识别方法,其特征在于,其中从浏览文件中的多个与命令相关的文本字符串中选择多个候选文本字符串的步骤包括:从所述浏览文件的显示区域内选择所述多个候选文本字符串;或者从所述浏览文件的用户定义区域中选择所述多个候选文本字符串;或者从所述浏览文件的凝视区域中选择所述多个候选文本字符串;或者从所述浏览文件的手势指定区域中选择所述多个候选文本字符串;或者从所述浏览文件的用户所确定的父对象的下级选择所述多个候选文本字符串。4.如权利要求1所述的语音命令识别方法,其特征在于,其中选择的候选文本字符串的一部分与接收到的语音命令的一部分相似。5.一种可通过语音命令使电子装置执行相关命令的电子装置,其...

【专利技术属性】
技术研发人员:郑尧文孙良哲许肇凌曹希康林志鸿
申请(专利权)人:联发科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1