语音指令的识别方法、装置和智能终端制造方法及图纸

技术编号:20727832 阅读:26 留言:0更新日期:2019-03-30 18:29
本发明专利技术提出一种语音指令的识别方法、装置和智能终端,其中识别方法,包括:预先建立多个声学模型,任一声学模型用于识别一种子语言,子语言为任意一种语言的官方语言或方言;获取语音指令并判断语音指令中是否采用了多种子语言;当语音指令中采用了多种子语言时,根据语音指令的发音和/或语调确定语音指令中采用的目标子语言;采用目标子语言对应的目标声学模型确定语音指令的语义,从而解决了当用户夹杂使用多种子语言时无法识别语音指令的问题。

【技术实现步骤摘要】
语音指令的识别方法、装置和智能终端
本专利技术涉及语音控制领域,特别涉及一种语音指令的识别方法、装置和智能终端。
技术介绍
现在语音识别基本都是基于普通话识别,或者是纯粹的方言或者英文识别等。如果用户的语音指令以普通话和方言混合穿插的形式或者普通话和英文混合穿插的形式来发出,现在的语音识别系统会很难识别,直接导致识别不出用户的意图,这样的语音识别给人的感觉就不怎么友好。因此,当用户发出的语音指令中包含多种语言或包括多种方言时,准确识别语音指令的语义,以提高用户体验,是现有技术中亟待解决的问题。
技术实现思路
本专利技术提供了一种语音指令的识别方法、装置和智能终端,以在用户发出的语音指令中包括多种语言或包括多种方言时准确识别用户的意图,以提高用户体验。为了解决上述问题,作为本专利技术的一个方面,提供了一种语音指令的识别方法,包括:预先建立多个声学模型,任一声学模型用于识别一种子语言,子语言为任意一种语言的官方语言或方言;获取语音指令并判断语音指令中是否采用了多种子语言;当语音指令中采用了多种子语言时,根据语音指令的发音和/或语调确定语音指令中采用的目标子语言;采用目标子语言对应的目标声学模型确定语音指令的语义。可选的,声学模型为神经网络模型。可选的,判断语音指令中是否采用了多种子语言,包括:将语音指令传入各个声学模型进行识别;若各个声学模型对语音指令的识别率均低于预设识别率,则认定语音指令中采用了多种子语言。可选的,采用目标子语言对应的目标声学模型确定语音指令的语义,包括:将语音指令分为多个语音段,其中,任一语音段采用一种目标子语言;根据语音段采用的目标子语言确定语音段对应的目标声学模型;采用目标声学模型对对应的语音段进行识别,得到语音段对应的第一识别结果;根据第一识别结果确定语音指令的语义。可选的,根据第一识别结果确定语音指令的语义,包括:确定各个语音段在语音指令中的第一排序;按照第一排序对各个语音段对应的第一识别结果进行排列得到第二识别结果;用第二识别结果对应的语义作为语音指令的语义。本申请还提出一种语音指令的识别装置,包括:建模单元,用于预先建立多个声学模型,任一声学模型用于识别一种子语言,子语言为任意一种语言的官方语言或方言;获取单元,用于获取语音指令并判断语音指令中是否采用了多种子语言;语言识别单元,用于当语音指令中采用了多种子语言时,根据语音指令的发音和/或语调确定语音指令中采用的目标子语言;语义识别单元,用于采用目标子语言对应的目标声学模型确定语音指令的语义。可选的,声学模型为神经网络模型。可选的,获取单元判断语音指令中是否采用了多种子语言,包括:将语音指令传入各个声学模型进行识别;若各个声学模型对语音指令的识别率均低于预设识别率,则认定语音指令中采用了多种子语言。可选的,语义识别单元采用目标子语言对应的目标声学模型确定语音指令的语义,包括:将语音指令分为多个语音段,其中,任一语音段采用一种目标子语言;根据语音段采用的目标子语言确定语音段对应的目标声学模型;采用目标声学模型对对应的语音段进行识别,得到语音段对应的第一识别结果;根据第一识别结果确定语音指令的语义。可选的,语义识别单元根据第一识别结果确定语音指令的语义,包括:确定各个语音段在语音指令中的第一排序;按照第一排序对各个语音段对应的第一识别结果进行排列得到第二识别结果;用第二识别结果对应的语义作为语音指令的语义。本申请还提出一种智能终端,包括处理器、存储器以及存储在存储器上可在处理器上运行的程序,处理器执行程序时实现本申请提出的任一方法的步骤。本申请还提出另一种智能终端,包括本申请提出的任一的装置。本专利技术提出了一种语音指令的识别方法、装置和智能终端,根据语音指令的发音和/或语调确定所述语音指令中采用的目标子语言,并调用对应的声学模型对语音指令进行识别得到语音指令的语义,从而解决了当用户夹杂使用多种子语言时无法识别语音指令的问题。附图说明图1为本专利技术实施例中一种语音指令的识别方法的流程图;图2为本专利技术实施例中一种语音指令的识别装置的组成图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术具体实施例及相应的附图对本专利技术技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“目标”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。对于具有语音识别功能的终端,用户可以通过向终端发送语音指令以控制终端,或从终端获取到想要的数据,但是,现有的终端往往只能识别一种语言的官方语言或某一种方言,当用户同时使用多种语言发出语音指令或是采用多种方言发出语音指令时,终端往往无法准确的识别用户的意图,导致无法正确的对用户发出的语音指令做出反馈,降低了用户体验。如图1所示,本申请提出一种语音指令的识别方法,包括:S11:预先建立多个声学模型。具体的,本申请提出的方法可以用于手机、平板等终端,也可以用于服务器,可以在服务器上建立并保存多个声学模型,也可以在手机、平板等终端上建立多个声学模型,任一声学模型用于识别一种子语言,子语言为任意一种语言的官方语言或方言;声学模型是对声学、语言学、说话环境、说话人性别、口音等差异的标识,声学模型是指一组字序列构成的知识表示,声学模型是确定说话人性别、口音、语言的知识库,能够确定用户说的是什么词。具体而言,子语言例如可以是汉语中的普通话或四川话,即汉语的官方语言或方言,也可以是英格兰英语、苏格兰英语、美式英语等,还可以是大阪地区的日语、九州地区的日语等,即任意一种子语言可以是汉语的官方语言或方言、日语的官方语言或方言、英语的官方语言或方言等等,即子语言具有两种属性,一是语种、二是类别,语种是指语言的种类,例如:汉语、英语、日语、法语,类别包括:官方语言和方言,此处的方言需要具体指明对应的使用地区,例如四川方言、东北方言,若两个子语言的语种不同或是类别不同,则属于不同子语言,例如英语官方语言和汉语官方语言属于不同的子语言,普通话和四川话也属于不同的子语言,当两个子语言的语种相同且都是方言时,如果方言对应的使用地区不同,则也属于不同的子语言,例如四川话和东北话都属于汉语方言,但使用的地区不同,因此属于不同的子语言,在本申请中建立的各个声学模型为不同的子语言进行识别,在使用本申请提出的子语言时,将语音数据作为输入值,输出值时输入的语音数据的语义,此处的语义可以以任意一种文字进行表示,语音数据所采用的语种的文字进行表示。S12:获取语音指令并判断语音指令中是否采用了多种子语言。具体的,此处是手机、平板等终端通过麦克风接收用户发本文档来自技高网...

【技术保护点】
1.一种语音指令的识别方法,其特征在于,包括:预先建立多个声学模型,任一所述声学模型用于识别一种子语言,所述子语言为任意一种语言的官方语言或方言;获取语音指令并判断所述语音指令中是否采用了多种所述子语言;当语音指令中采用了多种所述子语言时,根据语音指令的发音和/或语调确定所述语音指令中采用的目标子语言;采用所述目标子语言对应的目标声学模型确定所述语音指令的语义。

【技术特征摘要】
1.一种语音指令的识别方法,其特征在于,包括:预先建立多个声学模型,任一所述声学模型用于识别一种子语言,所述子语言为任意一种语言的官方语言或方言;获取语音指令并判断所述语音指令中是否采用了多种所述子语言;当语音指令中采用了多种所述子语言时,根据语音指令的发音和/或语调确定所述语音指令中采用的目标子语言;采用所述目标子语言对应的目标声学模型确定所述语音指令的语义。2.根据权利要求1所述的语音指令的识别方法,其特征在于,所述声学模型为神经网络模型。3.根据权利要求1-2任一项所述的语音指令的识别方法,其特征在于,判断所述语音指令中是否采用了多种所述子语言,包括:将所述语音指令传入各个所述声学模型进行识别;若各个所述声学模型对所述语音指令的识别率均低于预设识别率,则认定所述语音指令中采用了多种子语言。4.根据权利要求1-3任一项所述的语音指令的识别方法,其特征在于,采用所述目标子语言对应的目标声学模型确定所述语音指令的语义,包括:将所述语音指令分为多个语音段,其中,任一所述语音段采用一种所述目标子语言;根据所述语音段采用的目标子语言确定所述语音段对应的目标声学模型;采用所述目标声学模型对对应的语音段进行识别,得到所述语音段对应的第一识别结果;根据所述第一识别结果确定所述语音指令的语义。5.根据权利要求4所述的语音指令的识别方法,其特征在于,根据所述第一识别结果确定所述语音指令的语义,包括:确定各个所述语音段在所述语音指令中的第一排序;按照所述第一排序对各个所述语音段对应的所述第一识别结果进行排列得到第二识别结果;用所述第二识别结果对应的语义作为所述语音指令的语义。6.一种语音指令的识别装置,其特征在于,包括:建模单元,用于预先建立多个声学模型,任一所述声学模型用于识别一种子语言,所述子语言为任意一种语言的官方语言或方言;获取单...

【专利技术属性】
技术研发人员:文皓张新毛跃辉韩雪陶梦春
申请(专利权)人:珠海格力电器股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1