基于大数据的预测性语音识别方法及装置制造方法及图纸

技术编号:20223154 阅读:20 留言:0更新日期:2019-01-28 21:16
本发明专利技术公开了一种基于大数据的预测性语音识别方法,包括如下步骤:接收第一识别结果;判断第一识别结果是否为识别出的首个汉字,如果是首个汉字,根据置信度确定第一识别结果的最终识别结果;如果非首个汉字,根据第一识别结果的置信度和对在先最终识别结果的大数据分析结果,确定第一识别结果的最终识别结果。本发明专利技术还公开了一种基于大数据的预测语音识别装置,根据本发明专利技术的方法和装置可以通过对识别中间结果进行置信度分析,并基于大数据对该识别结果进行二次分析,可以获得准确率高的识别结果,大大的提高了用户的体验感。

【技术实现步骤摘要】
基于大数据的预测性语音识别方法及装置
本专利技术涉及语音识别
,特别是一种基于大数据的预测性语音识别方法及装置。
技术介绍
目前语音交互技术已经愈发的成熟,在语音交互时,语音识别过程往往需要对识别出的各个字打分,每个字对应不同的分数,将打分最高的字作为识别结果。这种打分的方式准确率不高,并且仅由该打分方式作出识别结果,不够客观,影响用户体验。
技术实现思路
为了解决上述问题,专利技术人构思了基于大数据的角度出发,对语音识别的中间识别结果作优化处理,优化中间识别过程,使得识别结果更加准确、合理,极大提升了用户体验。根据本专利技术的第一方面,提供了一种基于大数据的预测性语音识别方法,包括如下步骤:接收第一识别结果;判断第一识别结果是否为识别出的首个汉字,如果是首个汉字,根据置信度确定第一识别结果的最终识别结果;如果非首个汉字,根据第一识别结果的置信度和对在先最终识别结果的大数据分析结果,确定第一识别结果的最终识别结果。根据本专利技术的第二方面,提供了一种基于大数据的预测性语音识别装置,包括中间结果获取模块,用于接收第一识别结果;预测识别模块,包括判定单元,用于判断第一识别结果是否为识别出的首个汉字,在判断为首汉字时调用首汉字预测单元进行相应处理,否则调用后续汉字预测单元进行相应处理;首汉字预测单元,用于根据置信度确定第一识别结果的最终识别结果;后续汉字预测单元,用于根据第一识别结果的置信度和对在先最终识别结果的大数据分析结果,确定第一识别结果的最终识别结果。根据本专利技术的第三个方面,提供了一种电子设备,其包括:至少一个处理器,以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述方法的步骤。根据本专利技术的第四个方面,提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。根据本专利技术提供了方法及装置,通过对识别中间结果进行置信度分析,并基于大数据对该识别结果进行二次分析,可以获得准确率高的识别结果,大大的提高了用户的体验感。附图说明图1为本专利技术一实施方式的基于大数据的预测性语音识别方法流程图;图2为本专利技术一实施方式的基于大数据的预测性语音识别装置原理框图;图3为为本专利技术一种实施方式的电子设备的框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。本专利技术可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计算环境中实践本专利技术,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。在本专利技术中,“模块”、“装置”、“系统”等指应用于计算机的相关实体,如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说,例如,元件可以、但不限于是运行于处理器的过程、处理器、对象、可执行元件、执行线程、程序和/或计算机。还有,运行于服务器上的应用程序或脚本程序、服务器都可以是元件。一个或多个元件可在执行的过程和/或线程中,并且元件可以在一台计算机上本地化和/或分布在两台或多台计算机之间,并可以由各种计算机可读介质运行。元件还可以根据具有一个或多个数据包的信号,例如,来自一个与本地系统、分布式系统中另一元件交互的,和/或在因特网的网络通过信号与其它系统交互的数据的信号通过本地和/或远程过程来进行通信。最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”,不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本专利技术实施例的基于大数据的预测性语音识别方法可以应用于任何配置了语音功能的终端设备,例如,智能手机、平板电脑、智能家居等终端设备,本专利技术对此不作限制,从而能够使得用户在使用这些终端设备的过程中获得更及时准确的响应,提升用户体验。下面结合附图对本专利技术作进一步详细的说明。图1示意性地显示了根据本专利技术一实施方式的基于大数据的预测性语音识别方法流程图,如图1所示,本实施例包括如下步骤:步骤S101:接收第一识别结果。在开始语音交互后,启动语音监听对用户发出的语音进行识别,根据现有技术语音识别对接收到的语音进行识别,获取第一识别结果。需要说明的是,现有技术对语音的识别是进行逐个汉字的识别,然后依次确定每个字的识别结果的,因而,本专利技术实施例的方法是对识别出的每一个字进行二次识别分析,以确定对该汉字的最终识别结果。步骤S102:判断第一识别结果是否为识别出的首个汉字,从而确定最终识别结果。如果是首个汉字,则启动步骤S103:根据置信度确定第一识别结果的最终识别结果,第一个字的识别会根据现有技术中声学分和语言分打分,对打分最高的字作为首个汉字,置信度根据经验值例如选取以70%作为置信阈值进行判断,一般的识别结果在解析过程中会得出对应的置信度,为了提供识别的准确度也可以适当的调高置信度。如果达到了置信度就直接将这个识别结果输出作为最终识别结果。如果不是首个汉字的识别结果,则启动步骤S104:会先根据第一识别结果的置信度和对在先最终识别结果的大数据分析结果,确定第一识别结果的最终识别结果。具体实现为:首选判断第一识别结果的置信度是否达到置信度阈值,如果达到置信度阈值,则将第一识别结果作为最终识别结果,即上述步骤。如果低于置信度阈值,则对在先最终识别结果进行大数据分析,基于分析结果确定第一识别结果的最终识别结果,从而实现预测的功能。对于将在先最终识别结果进行大数据分析的方式,示例性地可以为,预先获取大数据的数据库,其中,大数据的数据库可以是选用在线的词典库,也可以是用户自己配置生成的词典库,只要大数据的数据库满足“在大数据中存储有多种词典”,其包含有根据机器经验统计语音识别匹配词典、根据惯常的语音交互的结果进行统计的词库等特征即可,其中,词典库中优选配置为存储有汉字、汉字发音、汉字词组及词组标签,词组标签包括常用、非常用和使用次数。常用和非常用标识该词或词组是否为常用词,使用次数标识该词或词组在日常被用户使用的次数。基于大数据的词典,对在先最终识别结果(即中间识别结果或识别出的上一个汉字的最终识别结果,示例性地,对于接收到的用户语音指令“打开音乐…”中,“打”、””“打开”、“打开音”均为中间识别结果,“开”的上一个汉字的最终识别结果为首汉字“打本文档来自技高网...

【技术保护点】
1.基于大数据的预测性语音识别方法,其特征在于,包括:接收第一识别结果;判断第一识别结果是否为识别出的首个汉字,如果是首个汉字,根据置信度确定第一识别结果的最终识别结果;如果非首个汉字,根据第一识别结果的置信度和对在先最终识别结果的大数据分析结果,确定第一识别结果的最终识别结果。

【技术特征摘要】
1.基于大数据的预测性语音识别方法,其特征在于,包括:接收第一识别结果;判断第一识别结果是否为识别出的首个汉字,如果是首个汉字,根据置信度确定第一识别结果的最终识别结果;如果非首个汉字,根据第一识别结果的置信度和对在先最终识别结果的大数据分析结果,确定第一识别结果的最终识别结果。2.根据权利要求1所述的方法,其特征在于,所述根据第一识别结果的置信度和对在先最终识别结果的大数据分析结果,确定第一识别结果的最终识别结果包括:判断第一识别结果的置信度是否达到置信度阈值,若达到置信度阈值,则将第一识别结果作为最终识别结果;若低于置信度阈值,则对在先最终识别结果进行大数据分析,基于分析结果确定第一识别结果的最终识别结果。3.根据权利要求2所述的方法,其特征在于,所述若低于置信度阈值,则对在先最终识别结果进行大数据分析,基于分析结果确定第一识别结果的最终识别结果包括:基于大数据获取与在先最终识别结果匹配的排列组合;根据所述排列组合中最后一个汉字与第一识别结果的相似度确定最终识别结果。4.根据权利要求3所述的方法,其特征在于,所述相似度根据使用次数和发音首字母确定。5.根据权利要求3所述的方法,其特征在于,在根据所述排列组合中最后一个汉字与第一识别结果的相似度确定最终识别结果之前还包括:从所述排列组合中剔除不常用组合,形成高匹配度的排列组合。6.基于大数据的预测性语音识别装置,其特征在于,包括中间结果获取模块,用于接...

【专利技术属性】
技术研发人员:吴有宝胡明国
申请(专利权)人:苏州思必驰信息科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1