语音识别方法及装置制造方法及图纸

技术编号:20330295 阅读:31 留言:0更新日期:2019-02-13 06:28
本发明专利技术公开了一种语音识别方法,包括如下步骤:获取用户界面内容;将用户界面内容进行注册;在接收到用户语音指令时,根据注册的内容确定对用户语音指令的识别结果。本发明专利技术还公开了一种语音识别装置,根据本发明专利技术的方法和装置可以实现在语音交互的过程中增强语音识别的精度的效果,并且极大的增加了用户的体验感。

【技术实现步骤摘要】
语音识别方法及装置
本专利技术涉及语音识别
,特别是一种语音识别方法及装置。
技术介绍
随着语音交互技术的愈发成熟,目前针对基于语音交互的产品或方法,由于存在多音字、多种结果或者不常见用语等特殊情况,容易产生识别精度不高的问题,比如用户发出的语音指令为“芙蓉街”,语音识别的时候用户期望识别成“芙蓉街”,但是实际语音识别可能识别成“阜荣街”,和客户预期的识别结果就有出入,导致识别精度不高的问题。
技术实现思路
专利技术人经实践和经验总结发现,用户进行语音指令,有时候是基于应用界面发出的。而且,专利技术人进一步想到,随着语音交互技术的快速发展,由于其能方便地为用户提供服务,可见即可说已经成为一种不可阻挡的发展趋势。在这种趋势下,第三方应用的操作趋势由目前的手动操作,发展成基于语音指令进行操作,将成为主流。为此,专利技术人想到了解决上述问题的新构思:从其它应用(如APP)的用户界面对应的内容进行注册,这样针对用户界面发出的语音指令,会根据界面分词进行匹配,根据匹配结果作为识别结果。这样可以提供语音识别的精度,增强用户的体验感。根据本专利技术的第一方面,提供了一种语音识别方法,包括如下步骤:获取用户界面内容;将用户界面内容进行注册;在接收到用户语音指令时,根据注册的内容确定对用户语音指令的识别结果。根据本专利技术的第二方面,提供了一种语音识别装置,包括界面内容获取模块,用于获取用户界面内容;界面内容提取模块,用于将用户界面内容进行注册;语音识别模块,用于在接收到用户语音指令时,根据注册的内容确定对用户语音指令的识别结果。根据本专利技术的第三个方面,提供了一种电子设备,其包括:至少一个处理器,以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述方法的步骤。根据本专利技术的第四个方面,提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。根据本专利技术提供的方法及装置,可以实现在语音交互的过程中增强语音识别的精度的效果,并且极大的增加了用户的体验感。附图说明图1为本专利技术一实施方式的语音识别方法流程图;图2为本专利技术又一实施方式的语音识别方法流程图;图3为本专利技术一实施方式的语音识别装置原理框图;图4为本专利技术一实施方式的电子设备的框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。本专利技术可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计算环境中实践本专利技术,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。在本专利技术中,“模块”、“装置”、“系统”等指应用于计算机的相关实体,如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说,例如,元件可以、但不限于是运行于处理器的过程、处理器、对象、可执行元件、执行线程、程序和/或计算机。还有,运行于服务器上的应用程序或脚本程序、服务器都可以是元件。一个或多个元件可在执行的过程和/或线程中,并且元件可以在一台计算机上本地化和/或分布在两台或多台计算机之间,并可以由各种计算机可读介质运行。元件还可以根据具有一个或多个数据包的信号,例如,来自一个与本地系统、分布式系统中另一元件交互的,和/或在因特网的网络通过信号与其它系统交互的数据的信号通过本地和/或远程过程来进行通信。最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”,不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本专利技术实施例的语音识别方法可以应用于任何配置了语音功能的终端设备,例如,智能手机、平板电脑、智能家居等终端设备,本专利技术对此不作限制,从而能够使得用户在使用这些终端设备的过程中获得更及时准确的响应,提升用户体验。下面结合附图对本专利技术作进一步详细的说明。图1示意性地显示了根据本专利技术一实施方式的语音识别方法流程图,如图1所示,本实施例包括如下步骤:步骤S101:获取用户界面内容。用户界面为终端设备上安装的各个APP的用户界面,获取方式可以通过各个app用户界面的api接口获取。步骤S102:将用户界面内容进行注册。对各个用户界面内容分别进行分词提取,分词提取是一门成熟的技术,可以参照现有技术实现,例如“你好小驰”里面的分词有“你好”“小驰”,以词组为单元进行提取。将提取出来的分词确定为该用户界面的界面分词。之后,将确定的界面分词在识别引擎中通过识别引擎的接口进行注册。步骤S103:在接收到用户语音指令时,根据注册的内容确定对用户语音指令的识别结果。具体实现为:对接收到的用户语音指令进行语音识别,语音识别的方式可以参照现有技术,获取第一识别结果,其中第一识别结果是根据传统或现有的语音识别方式得到的识别结果。将第一识别结果与上个步骤已经注册的界面分词进行相似度匹配,如果匹配成功就将该第一识别结果作为最终识别结果,示例性地,用户发出的语音指令为“芙蓉街”,通过现有的语音识别会得到第一识别结果为“阜荣街”,将“阜荣街”与注册的界面分词基于发音进行匹配,就会匹配到“芙蓉街”的界面分词,这种情况下,就将第一识别结果的最终识别结果修正为“芙蓉街”,即在匹配到相同或相似发音的界面分词时,优选选用界面分词作为识别结果。如果匹配失败,将根据现有的语音识别方式将第一识别结果作为最终识别结果。示例性地,如果没有匹配到相似的界面分词,就将第一识别结果“阜荣街”作为识别结果。本专利技术实施例对于用户在相应用户界面进行语音交互的场景,可以快速且精准的匹配到用户的语音识别结果,提高识别精度,避免因多音字、生僻字等特殊情况而产生的问题,且能够有效实现“所见即所述”的目的,使得所有的用户界面操作都可以通过语音交互实现,丰富用户的语音交互体验,且使得用户使用各种用户界面进行操作的方式更加丰富且友好。图2示意性地显示了根据本专利技术又一实施方式的语音识别方法流程图,如图2所示,本实施例包括:步骤S201:获取用户界面内容。其具体的实现方式可以参照步骤S101的实现方式。步骤S202:为获取的用户界面内容配置用户界面标识。具体实现为:根据用户界面所属的APP为获取的用户界面内容配置用于唯一标识该用户界面的标识符,标识符的内容可以是包含有用于标识App的字段和用于标识本文档来自技高网...

【技术保护点】
1.语音识别方法,其特征在于,包括:获取用户界面内容;将所述用户界面内容进行注册;在接收到用户语音指令时,根据注册的内容确定对用户语音指令的识别结果。

【技术特征摘要】
1.语音识别方法,其特征在于,包括:获取用户界面内容;将所述用户界面内容进行注册;在接收到用户语音指令时,根据注册的内容确定对用户语音指令的识别结果。2.根据权利要求1所述的方法,其特征在于,所述将所述用户界面内容进行注册包括:对用户界面内容进行分词提取,确定界面分词;将界面分词在识别引擎中进行注册。3.根据权利要求2所述的方法,其特征在于,在接收到用户语音指令时,根据注册的内容确定对用户语音指令的识别结果包括:对接收到的用户语音指令进行语音识别,获取第一识别结果;将第一识别结果与注册的界面分词进行匹配,根据匹配结果确定第一识别结果的最终识别结果。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:为获取的用户界面内容配置用户界面标识;所述将所述用户界面内容进行注册包括:对各用户界面内容进行分词提取,确定界面分词;将界面分词在识别引擎中进行注册,并为之关联对应的用户界面标识。5.根据权利要求4所述的方法,其特征在于,所述在接收到用户语音指令时,根据注册的内容确定对用户语音指令的识别结果包括在接收到用户语音指令时,获取当前所在用户界面;根据当前所在用户界面的用户界面标识获取当前用户界面的已注册界面分词;对接收到的用户语音指令进行语音识别,获取第一识别结果...

【专利技术属性】
技术研发人员:吴有宝林婷
申请(专利权)人:苏州思必驰信息科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1