用于语音识别文本的方法、设备、客户端装置及电子设备制造方法及图纸

技术编号:18401166 阅读:45 留言:0更新日期:2018-07-08 20:40
公开了一种用于语音识别文本的方法、设备、客户端装置及电子设备。该方法包括:接收来自用户的语音输入;对所述语音输入进行识别,以提供至少两个备选关联词;接收来自用户的指令语音;对所述指令语音进行识别,以得到语音指令,其中,所述语音指令用于确定所述至少两个备选关联词中的目标关联词;以及,基于所述语音指令确定目标关联词,作为所识别的文本。根据本发明专利技术,可以提升语音识别文本的准确性。

Method, device, client device and electronic device for speech recognition text

A method, device, client device and electronic device for speech recognition text are disclosed. The method includes receiving voice input from the user; identifying the speech input to provide at least two alternative words; receiving instruction voice from the user; recognition of the instruction voice to obtain voice instructions, wherein the speech instruction is used to determine the at least two alternative words. The target Related words in the target language; and, based on the voice instructions, determine the target association words as the identified text. According to the invention, the accuracy of the speech recognition text can be improved.

【技术实现步骤摘要】
用于语音识别文本的方法、设备、客户端装置及电子设备
本专利技术涉及语音识别
,更具体地,涉及一种用于语音识别文本的方法、设备、客户端装置及电子设备。
技术介绍
随着智能终端的硬件不断升级和系统不断完善,它提供用户交互的手段和方式也越来越多。此外,随着移动互联网使用量的爆发式增长,用户使用手机应用(APP)来解决日常生活需求的场景也越来越多。语音识别技术在手机应用上的应用也越来越广泛。例如,许多搜索引擎、移动浏览器、电商类的APP等都能够支持将用户录入的语音转换为文本以进行搜索的功能。在很多语言中,存在许多发音相同或近似而意思不同的词。尤其在中文中,同音词/近似音词的比例比较高。为了较为准确地从同音词/近似音词集合中识别出用户期望的词,在现有技术中,通常采用的方案是,基于用户完整语段的语义,选择一个最合适的词作为识别出的文本显示给用户。然而,在许多情况下,现有技术的方案不是有效的。例如,当用户仅录入单个词或者录入的语音出现断词时,现有技术的方案无法从同音词/近似音词集合中识别出符合用户期望的词,语音识别的准确率较低。因此,专利技术人认为,有必要对上述现有技术中存在的问题进行改进。
技术实现思路
本专利技术的一个目的是提供一种用于语音识别文本的方法的新技术方案。根据本公开的第一方面,提供了一种用于语音识别文本的方法,包括:接收来自用户的语音输入;对所述语音输入进行识别,以提供至少两个备选关联词;接收来自用户的指令语音;对所述指令语音进行识别,以得到语音指令,其中,所述语音指令用于确定所述至少两个备选关联词中的目标关联词;以及基于所述语音指令确定目标关联词,作为所识别的文本。可选地,对所述语音输入进行识别还包括:对所述语音输入进行识别,以得到该语音输入的语音指纹,其中,所述语音指纹是与所述语音输入相关联的发音特征标识;查询关联词词库以得到与所述语音指纹相关联的至少两个备选关联词;以及向用户显示所述至少两个备选关联词。可选地,所述方法还包括:基于所确定的目标关联词,调整与所述语音指纹相关联的至少两个备选关联词的位置顺序。可选地,所述指令语音是单音节语音。可选地,所述语音指令是有限指令集合内的指令。可选地,所述备选关联词的数量小于等于10,每个备选关联词与数字1-10中的一个数字对应,以及所述语音指令是数字1-10中的一个。可选地,接收来自用户的指令语音还包括:接收用户的指示语音,其中,所述指示语音包括多个音节并且包括单音节语音的指令语音,以及其中,对所述指令语音进行识别还包括:确定所述指示语音中的指令语音;以及基于单音节的方式对所述指令语音进行识别,以得到语音指令。可选地,所述还包括:当在预定时间内没有接收到来自用户的指令语音时,提示用户输入指令语音。根据本公开的第二方面,提供了一种用于语音识别文本的设备,包括:用于接收来自用户的语音输入的装置;用于对所述语音输入进行识别以提供至少两个备选关联词的装置;用于接收来自用户的指令语音的装置;用于对所述指令语音进行识别以得到语音指令的装置,其中,所述语音指令用于确定所述至少两个备选关联词中的目标关联词;以及用于基于所述语音指令确定目标关联词作为所识别的文本的装置。根据本公开的第三方面,提供了一种客户端装置,包括根据实施例的用于语音识别文本的设备,或者被设计成用于执行根据实施例的用于语音识别文本的方法中的操作。根据本公开的第四方面,提供了一种电子设备,包括根据实施例的客户端装置,或者包括存储器和处理器,其中,所述存储器存储可执行指令,所述可执行指令在所述电子设备运行时控制所述处理器执行根据实施例的用于语音识别文本的方法中的操作。根据本公开的一个实施例,可以提升语音识别文本的准确性。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明被结合在说明书中并构成说明书的一部分的附图示出了本专利技术的实施例,并且连同其说明一起用于解释本专利技术的原理。图1示出了根据本公开的一个实施例的方法的示意性流程图。图2示出了根据本公开的步骤1200的一个例子的方法的示意性流程图。图3示出了根据本公开的另一个实施例的客户端装置的示意性框图;图4示出了根据本公开的另一个实施例的电子设备的示意性框图;图5a~图5b示出了根据本公开的实施例的一个例子的显示界面的示意图。具体实施方式现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。下面,参照附图描述根据本公开的各个实施例和例子。<方法>图1示出了根据本公开的一个实施例的方法的示意性流程图。如图1所示,在步骤1100,接收来自用户的语音输入。例如,具有语音识别功能的客户端装置(客户端应用)接收来自用户的交互操作,以进入到语音识别的交互界面,并在该交互界面接收用户的语音输入。步骤1200,对所述语音输入进行识别,以提供至少两个备选关联词。例如,备选关联词是指具有相同语音指纹的词,并可以被预先存储在关联词词库中。语音指纹是词的发音特征标识。例如,对于中文(普通话语系),词的拼音可以作为语音指纹。例如,一个语音指纹的例子是“jianpu”。在普通话语系中,与该语音指纹关联的词可以包括以下词:简谱、简朴、俭朴,等等。在一个例子中,可以利用如图2所示的方式实现所述步骤S1200。如图2所示,在步骤1201,对所述语音输入进行识别,以得到该语音输入的语音指纹。所述语音指纹是与所述语音输入相关联的发音特征标识。例如,与语音输入相关联的发音特征标识是语音输入的拼音,它可以作为识别到的语音指纹。步骤1202,查询关联词词库以得到与所述语音指纹相关联的至少两个备选关联词。例如,在关联词词库中,可以将与语音指纹对应的多个关联词以列表的形式进行存储。在关联词词库的初始状态下,词的顺序可以是根据词在日常社会交流中的使用频率由高到低排序,其中,使用频率高的词位置靠前。可以将关联词在列表中的顺序作为显示时的位置顺序。例如,如果备选关联词在列表中的位置是第一位,则在向用户显示时,与该备选关联词对应的数字为“1”。当得到语音输入的语音指纹后,若关联词词库中存在与该语音指纹对应的至少两个关联词,则将所述至少两个关联词作为备选关联词。本领域技术人员应当理解,如果关联词词库中仅存在一个与语音指纹相关联的备选关联词,则可以直接将该备选关联词作为语音识别的文本。步骤1203,向用户显示所述至少两个备选关联词。这里,可以将所显示的备选关联词的数量设置得小于等于10。如果关联词词库中的备选关联词的数量大于10,则在显示时,仅选取前10个词作为备选关联本文档来自技高网...

【技术保护点】
1.一种用于语音识别文本的方法,包括:接收来自用户的语音输入;对所述语音输入进行识别,以提供至少两个备选关联词;接收来自用户的指令语音;对所述指令语音进行识别,以得到语音指令,其中,所述语音指令用于确定所述至少两个备选关联词中的目标关联词;以及基于所述语音指令确定目标关联词,作为所识别的文本。

【技术特征摘要】
1.一种用于语音识别文本的方法,包括:接收来自用户的语音输入;对所述语音输入进行识别,以提供至少两个备选关联词;接收来自用户的指令语音;对所述指令语音进行识别,以得到语音指令,其中,所述语音指令用于确定所述至少两个备选关联词中的目标关联词;以及基于所述语音指令确定目标关联词,作为所识别的文本。2.根据权利要求1所述的方法,其中,对所述语音输入进行识别还包括:对所述语音输入进行识别,以得到该语音输入的语音指纹,其中,所述语音指纹是与所述语音输入相关联的发音特征标识;查询关联词词库以得到与所述语音指纹相关联的至少两个备选关联词;以及向用户显示所述至少两个备选关联词。3.根据权利要求2所述的方法,还包括:基于所确定的目标关联词,调整与所述语音指纹相关联的至少两个备选关联词的位置顺序。4.根据权利要求1所述的方法,其中,所述指令语音是单音节语音。5.根据权利要求4所述的方法,其中,所述语音指令是有限指令集合内的指令。6.根据权利要求5所述的方法,其中,所述备选关联词的数量小于等于10,每个备选关联词与数字1-10中的一个数字对应,以及所述语音指令是数字1-10中的一个。7.根据权利要求4所述的方法,其中,接收来自用户的指令语音还包括:接...

【专利技术属性】
技术研发人员:吴伟勇
申请(专利权)人:广州市动景计算机科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1