本发明专利技术提供了一种语音唤醒方法、装置、电子设备、存储介质及产品。该方法包括:当接收到目标语音时,每间隔预设时间将目标语音中的一个音频段输入至预设的声学模型,得到每个音频段对应的路径标识信息和路径置信度;基于每个音频段对应的路径标识信息和路径置信度,确定目标语音对应的目标文本路径;在字典图中对目标文本路径进行查询,得到目标文本路径对应的文本信息;在文本信息存在预设的唤醒词的情况下,执行唤醒操作。本发明专利技术实施例中,通过将目标语音中的每个音频段每间隔预设时间输入至声学模型进行解码操作,确保得到的每个文本路径对应的音频段是连续的语句,以此避免触发误唤醒操作或未执行唤醒操作,提高语音唤醒的效率。率。率。
【技术实现步骤摘要】
语音唤醒方法、装置、电子设备、存储介质及产品
[0001]本专利技术涉及音频处理
,特别是涉及一种语音唤醒方法、装置、电子设备、存储介质及产品。
技术介绍
[0002]人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。随着人工智能技术的不断发展,人工智能唤醒的应用越来越广泛,越来越多的智能设备,例如智能音箱、智能电视等都配置了语音唤醒功能。
[0003]现有的语音唤醒方法为,智能设备持续接收用户发送的语音,对上述语音执行同一解码操作,并将语音每间隔预设时长分割为一个音频段,然后以每一个音频段为一个单元进行解码,得到每个音频段对应的文本信息,进而检测每个音频段对应的文本信息中是否存在唤醒词。
[0004]然而,上述对输入语音进行强行分段的方式可能导致设备中的解码模块接收到的音频段不是连续的语句,从而导致设备误唤醒或者设备未执行唤醒操作,这降低了智能设备执行唤醒操作的准确性。
技术实现思路
[0005]本专利技术实施例的目的在于提供一种语音唤醒方法、装置、电子设备、存储介质及产品,解决执行唤醒操作的效率较低的技术问题。具体技术方案如下:
[0006]在本专利技术实施例的第一方面,首先提供了一种语音唤醒方法,包括:
[0007]当接收到目标语音时,每间隔预设时间将所述目标语音中的一个音频段输入至预设的声学模型,得到每个音频段对应的路径标识信息和路径置信度;所述路径标识信息用于表征对应的音频段在预设的字典图中的文本路径,所述路径置信度为对应的音频段的文本路径的概率值,所述目标语音包括至少一个音频段;
[0008]基于所述每个音频段对应的路径标识信息和路径置信度,确定所述目标语音对应的目标文本路径;
[0009]在所述字典图中对所述目标文本路径进行查询,得到所述目标文本路径对应的文本信息;
[0010]在所述文本信息存在预设的唤醒词的情况下,执行唤醒操作。
[0011]在本专利技术实施例的第二方面,还提供了一种语音唤醒装置,包括:
[0012]处理模块,用于当接收到目标语音时,每间隔预设时间将所述目标语音中的一个音频段输入至预设的声学模型,得到每个音频段对应的路径标识信息和路径置信度;所述路径标识信息用于表征对应的音频段在预设的字典图中的文本路径,所述路径置信度为对应的音频段的文本路径的概率值,所述目标语音包括至少一个音频段;
[0013]确定模块,用于基于所述每个音频段对应的路径标识信息和路径置信度,确定所
述目标语音对应的目标文本路径;
[0014]查询模块,用于在所述字典图中对所述目标文本路径进行查询,得到所述目标文本路径对应的文本信息;
[0015]执行模块,用于在所述文本信息存在预设的唤醒词的情况下,执行唤醒操作。
[0016]在本专利技术实施例的第三方面,还提供了一种电子设备,所述电子设备中存储有计算机程序,当其在计算机上运行时,使得计算机执行上述任一实施例所述的语音唤醒方法。
[0017]在本专利技术实施例的第四方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一实施例所述的语音唤醒方法。
[0018]在本专利技术实施的第五方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一实施例所述的语音唤醒方法。
[0019]本专利技术实施例中,当接收到目标语音时,每间隔预设时间将目标语音中的一个音频段输入至预设的声学模型,得到每个音频段对应的路径标识信息和路径置信度,其中,路径标识信息用于表征对应的音频段在预设的字典图中的文本路径。,通过将目标语音中的每个音频段每间隔预设时间输入至声学模型进行解码操作,确保得到的每个文本路径对应的音频段是连续的语句,以此避免触发误唤醒操作或未执行唤醒操作,提高语音唤醒的效率。进一步的,根据每个音频段对应的路径标识信息和路径置信度,确定目标文本路径,在字典图中对目标文本路径进行查询,得到目标文本路径对应的文本信息,在文本信息存在预设的唤醒词的情况下,执行唤醒操作。由于上述目标文本路径是基于每个音频段对应的路径置信度确定的具备较高路径置信度的文本路径,因此可以提高执行唤醒操作的准确率。
附图说明
[0020]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
[0021]图1为本专利技术实施例中语音唤醒方法的流程示意图;
[0022]图2为本专利技术实施例中语音唤醒装置的结构示意图;
[0023]图3为本专利技术实施例中一种电子设备的结构示意图。
具体实施方式
[0024]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行描述。
[0025]为便于理解整体技术方案,以下对本专利技术的相关
技术实现思路
进行说明。
[0026]在相关技术中,语音唤醒设备包括声学模型和解码器,将用户输入的语音持续的输入至声学模型中,使用该声学模型对输入语音进行处理,得到输入语音对应的路径标识信息,并对输入语音进行分段。随后,将上述路径标识信息输入至解码器中进行解码,使用解码器在预设的字典图中对该路径标识信息进行查询,得到每个语音段对应的文本信息,进而在文本信息存在唤醒词的情况下,执行唤醒操作。
[0027]然而,在上述过程中,只使用声学模型对输入语音执行一次处理,且将语音强行分段,这会导致分段得到的音频段对应的文本信息可能不是连续的语句,从而导致设备误唤
醒或者设备未执行唤醒操作,这降低了智能设备执行唤醒操作的效率。
[0028]为了解决上述可能存在的技术问题,本专利技术实施例提供了一种语音唤醒方法,将输入语音划分为至少两个音频段,并每间隔预设时间将每个音频段按照输入顺序输入至声学模型中,得到每个音频段对应的路径标识信息,以此确保每个音频段对应的文本信息是连续的语句,避免触发误唤醒操作或未执行唤醒操作,提高语音唤醒的效率。
[0029]请参阅图1,图1为本专利技术实施例中语音唤醒方法的流程图。本专利技术实施例提供的语音唤醒方法包括:
[0030]S101,当接收到目标语音时,每间隔预设时间将所述目标语音中的一个音频段输入至预设的声学模型,得到每个音频段对应的路径标识信息和路径置信度。
[0031]本专利技术实施例提供的语音唤醒方法可以应用于语音唤醒设备,上述目标语音可以是用户输入的语音,或者语音唤醒设备从外部下载的语音。
[0032]本步骤中,在接收到目标语音的情况下,每间隔预设时间将所述目标语音中的一个音频段输入至预设的声学模型,得到每个音频段对应的路径标识信息和路径置信度。其中,该路径标识信息与音频段一一对应,且路径置信度与音频段一一对应。可选地,可以按照目标语音的输入顺序,将目标语音的每个音频段输入至声学模型。
[0033]上述声学模型可以是马尔科本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种语音唤醒方法,其特征在于,所述方法包括:当接收到目标语音时,每间隔预设时间将所述目标语音中的一个音频段输入至预设的声学模型,得到每个音频段对应的路径标识信息和路径置信度;所述路径标识信息用于表征对应的音频段在预设的字典图中的文本路径,所述路径置信度为对应的音频段的文本路径的概率值,所述目标语音包括至少一个音频段;基于所述每个音频段对应的路径标识信息和路径置信度,确定所述目标语音对应的目标文本路径;在所述字典图中对所述目标文本路径进行查询,得到所述目标文本路径对应的文本信息;在所述文本信息存在预设的唤醒词的情况下,执行唤醒操作。2.根据权利要求1所述的方法,其特征在于,所述基于所述每个音频段对应的路径标识信息和路径置信度,确定所述目标语音对应的目标文本路径包括:在只存在1个最大路径置信度的情况下,将所述最大路径置信度对应的音频段的文本路径确定为所述目标文本路径。3.根据权利要求1所述的方法,其特征在于,所述基于所述每个音频段对应的路径标识信息和路径置信度,确定所述目标语音对应的目标文本路径包括:在存在至少2个最大路径置信度的情况下,将每个最大路径置信度对应的音频段,确定为候选音频段;获取每个候选音频段对应的文本路径包括的文本节点的数量;将文本节点数量最少的文本路径,确定为所述目标文本路径。4.根据权利要求1所述的方法,其特征在于,所述基于所述每个音频段对应的路径标识信息和路径置信度,确定所述目标语音对应的目标文本路径包括:对音频段集合中的各个目标音频段进行路径置信度补偿,得到每个目标音频段补偿后的路径置信度;所述目标音频段对应的文本路径包括的文本节点数量大于或小于预设节点数量阈值;将最大路径置信度对应的音频段的文本路径,确定为所述目标文本路径。5.根据权利要求4所述的方法,其特征在于,所述音频段集合包括第一目标音频段和第二目标音频段,所述第一目标音频段包括的文本节点数量小于预设节点数量阈值,所述第二目标音频段包括的文本节点数量大于预设节点数量阈值;所述对音频段集合中的各个目标音频段进行路径置信度补偿,得到每个目标音频段补偿后的路径置信度包括:对于任意一个第一目标音频段,将所述第一目标音频段的路径置信度加上第一置信度,得到所述第一目标音频...
【专利技术属性】
技术研发人员:陈孝良,李良斌,
申请(专利权)人:山东声智物联科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。