信息的识别方法和装置制造方法及图纸

技术编号:8656486 阅读:185 留言:0更新日期:2013-05-02 00:14
本发明专利技术涉及一种信息的识别方法和装置。该方法包括:终端接收语音信息,从所述语音信息中提取语音特征;将所述语音特征与多个候选文本中每一个候选文本对应的音素串进行匹配计算,得到识别结果,所述识别结果包括至少一个命令词以及所述至少一个命令词对应的标签;根据所述至少一个命令词对应的标签,识别所述语音信息对应的操作指令。本发明专利技术实施例实现了终端将用户输入的语音信息对应的文本信息识别为操作指令。

【技术实现步骤摘要】

本专利技术涉及信息
,尤其涉及一种信息的识别方法和装置
技术介绍
语音识别技术是一种将人类的语音输入转换为计算机指令的一种技术,使用语音识别技术可以实现自然的人机互动。目前,随着语音识别技术的发展,很多终端可以实现语音拨号、语音导航、语音控制、语音检索、简单的听写录入等功能。在现有技术下,终端接收到输入语音信息后,可以将语音信息通过网络发送至云端服务器,由云端服务器完成语音信息的识别。然而,使用云端服务器识别语音信息,用户需要将一些个人信息上传到云端服务器,从而降低用户信息的安全性;另外,终端和云端服务器的交互需要使用网络,这增加了语音识别的局限性,而且消耗用户的网络流量,在网络拥挤时还会增加语音识别的时延,影响用户的体验效果。
技术实现思路
本专利技术实施例提供了一种信息的识别方法和装置,可以实现终端根据两命令词槽识别文法或多命令词槽识别文法来对语音信息进行命令词拆分,并根据拆分后的至少一个命令词来识别语音信息对应的操作指令,提供了一种信息的识别方法,同样的命令词数量可以识别出更多的语音输入内容,提高了用户的体验效果。第一方面,本专利技术实施例提供了一种信息的识别方法,所述方法包括接收语音信息,从所述语音信息中提取语音特征;将所述语音特征与多个候选文本中每一个候选文本对应的音素串进行匹配计算,得到识别结果,所述识别结果包括至少一个命令词以及所述至少一个命令词对应的标签;根据所述至少一个命令词对应的标签,识别所述语音信息对应的操作指令。在第一种可能的实现方式中,所述将所述语音特征与多个候选文本中每一个候选文本对应的音素串进行匹配计算具体包括对所述语音特征与所述多个候选文本中每一个候选文本对应的音素串进行音素距离计算,得到距离值;选择与所述语音特征之间的距离值最小的音素串对应的候选文本作为识别结果。结合第一方面,在第二种可能的实现方式中,所述根据所述至少一个命令词对应的标签,识别所述语音信息对应的操作指令具体包括根据所述至少一个命令词中所有命令词对应的标签的组合,识别所述语音信息对应的操作指令。结合第一方面,在第三种可能的实现方式中,所述接收语音信息,从所述语音信息中提取语音特征之前,还包括根据识别文法网络,在多个命令词槽中选择命令词生成所述多个候选文本。结合第一方面的第二种可能的实现方式,在第四种可能的实现方式中,所述根据所述至少一个命令词中所有命令词对应的标签的组合,识别所述语音信息对应的操作指令包括将所述识别结果中所述至少一个命令词中每一个命令词对应的标签进行组合,在本地数据库或网络服务器中查询所述标签的组合对应的操作指令。第二方面,本专利技术实施例提供了一种信息的识别装置,所述装置包括接收单元,用于接收语音信息,从所述语音信息中提取语音特征,将所述语音特征传输至匹配单元;匹配单元,用于接收所述接收单元传输的所述文本信息,将所述语音特征与多个候选文本中每一个候选文本对应的音素串进行匹配计算,得到识别结果,所述识别结果包括至少一个命令词以及所述至少一个命令词对应的标签,将所述标签传输至识别单元;识别单元,用于接收所述匹配单元传输的所述标签,根据所述至少一个命令词对应的标签,识别所述语音信息对应的操作指令。在第一种可能的实现方式中,所述匹配单元具体用于对所述语音特征与所述多个候选文本中每一个候选文本对应的音素串进行音素距离计算,得到距离值;选择与所述语音特征之间的距离值最小的音素模型对应的候选文本作为识别结果结合第二方面,在第二种可能的实现方式中,所述至少一个命令词中的每一个命令词使用一个标签来标识;所述识别单元具体用于根据所述至少一个命令词中所有命令词对应的标签的组合,识别所述语音信息对应的操作指令。结合第二方面,在第三种可能的实现方式中,所述装置还包括生成单元,用于根据识别文法网络,在多个命令词槽中选择命令词生成所述多个候选文本。结合第二方面或者第二方面的第二种可能的实现方式,在第四种可能的实现方式中,所述识别单元具体用于将所述识别结果中所述至少一个命令词中每一个命令词对应的标签进行组合,在本地数据库或网络服务器中查询所述标签的组合对应的操作指令本专利技术实施例中,终端接收语音信息,从所述语音信息中提取语音特征;将所述语音特征与多个候选文本中每一个候选文本对应的音素串进行匹配计算,得到识别结果,所述识别结果包括至少一个命令词以及所述至少一个命令词对应的标签;根据所述至少一个命令词对应的标签,识别所述语音信息对应的操作指令。由此,终端根据两命令词槽识别文法或多命令词槽识别文法来对语音信息进行命令词拆分,并根据拆分后的至少一个命令词来识别语音信息对应的操作指令,提供了一种信息的识别方法,同样的命令词数量可以识别出更多的语音输入内容,提高了用户的体验效果。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种信息的识别方法流程图;图2为本专利技术实施例提供的一种信息的识别装置示意图;图3为本专利技术实施例提供的一种终端示意图。具体实施例方式下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。图1为本专利技术实施例提供的一种信息的识别方法流程图。该实施例的执行主体是终端,其中详细描述了终端接收到用户的语音输入后,识别出操作指令的方法。如图1所示,该实施例包括以下步骤步骤101,接收语音信息,从所述语音信息中提取语音特征。当然,在终端进行语音输入之前,首先根据接收到的用户的操作指令,将终端置为语音信息输入状态,运行语音识别引擎。在运行语音识别引擎时,识别文法可以生成候选文本。终端接收到语音信息后,将语音信息转换成数字信息,并从数字信息中提取相应的语音特征。步骤102,将所述语音特征与多个候选文本中每一个候选文本对应的音素串进行匹配计算,得到识别结果,所述识别结果包括至少一个命令词以及所述至少一个命令词对应的标签。为了实现本专利技术的技术方案,在实际应用中,终端提供了一种多命令词槽的识别文法,与现有的“action (动作)+object (对象)”识别文法相比,多命令词槽的识别文法结构是将act ion部分拆分为不同的部分,通过各部分的不同的组合支持识别更多的语音输入内容,这样对于相同数量的语音输入内容,识别文法所需要提供的命令词数量可减少。例如,对于用户常用的命令词“拨打电话给”,“帮我拨打电话给”,“呼叫”,“帮我呼叫”等语音输入内容中,有一部分内容是几个语音输入内容共有的说法,如“拨打电话给”,“呼叫”。如果采用现有的文法识别结构,“拨打电话给”,“帮我拨打电话给”,“呼叫”,“帮我呼叫”等语音输入内容需要4个命令元素,而如果采用多命令词槽的识别文法,则可以只需要一个一级命令词“帮我”,两个二级命令词“拨打电话给”、“呼叫”,共需要3个命令词,节省了命令词的数量,并且多命令词槽的识别文法维护和扩充更加方便。本专利技术实施例提供的识别文法中,可将现有识别文法中的action部分拆分为两级或者多级,如可拆分为三级,其中一级命令词可以为修饰命令词,二级命令词可以为意愿命令词,三级命令词可以为动本文档来自技高网...

【技术保护点】
一种信息的识别方法,其特征在于,所述方法包括:接收语音信息,从所述语音信息中提取语音特征;将所述语音特征与多个候选文本中每一个候选文本对应的音素串进行匹配计算,得到识别结果,所述识别结果包括至少一个命令词以及所述至少一个命令词对应的标签;根据所述至少一个命令词对应的标签,识别所述语音信息对应的操作指令。

【技术特征摘要】
1.一种信息的识别方法,其特征在于,所述方法包括: 接收语音信息,从所述语音信息中提取语音特征; 将所述语音特征与多个候选文本中每一个候选文本对应的音素串进行匹配计算,得到识别结果,所述识别结果包括至少一个命令词以及所述至少一个命令词对应的标签; 根据所述至少一个命令词对应的标签,识别所述语音信息对应的操作指令。2.根据权利要求1所述的信息的识别方法,其特征在于,所述将所述语音特征与多个候选文本中每一个候选文本对应的音素串进行匹配计算具体包括: 对所述语音特征与所述多个候选文本中每一个候选文本对应的音素串进行音素距离计算,得到距离值; 选择与所述语音特征之间的距离值最小的音素串对应的候选文本作为识别结果。3.根据权利要求1所述的信息的识别方法,其特征在于,所述至少一个命令词中的每一个命令词使用一个标签来标识; 所述根据所述至少一个命令词对应的标签,识别所述语音信息对应的操作指令具体包括:根据所述至少一个命令词中所有命令词对应的标签的组合,识别所述语音信息对应的操作指令。4.根据权利要求1所述的信息的识别方法,其特征在于,所述将接收语音信息,从所述语音信息中提取语音特征之前,还包括:根据识别文法网络,在多个命令词槽中选择命令词生成所述多个候选文本。5.根据权利要求3所述的信息的识别方法,其特征在于,所述根据所述至少一个命令词中所有命令词对应的标签的组合,识别所述语音信息对应的操作指令包括:将所述识别结果中所述至少一个命令词中每一个命令词对应的标签进行组合,在本地数据库或网络服务器中查询所述标...

【专利技术属性】
技术研发人员:蒋洪睿王细勇梁俊斌郑伟军周均扬
申请(专利权)人:华为终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1