分布式语音控制方法及电子设备技术

技术编号:37404552 阅读:8 留言:0更新日期:2023-04-30 09:31
一种分布式语音控制方法及电子设备,涉及终端技术领域,可以提升语音控制的效率。该方法包括:第一终端响应于用户输入的语音信息,将所述语音信息输入第一模型,并通过所述第一模型获得所述语音信息对应的特征信息;所述第一终端向第二终端发送所述特征信息,以使得所述第二终端中将所述特征信息输入第二模型,并通过所述第二模型确定所述语音信息对应的操作信息,以及根据所述操作信息执行相应操作,所述第一模型存在于所述第一终端,所述第二模型存在于所述第二终端。型存在于所述第二终端。型存在于所述第二终端。

【技术实现步骤摘要】
分布式语音控制方法及电子设备


[0001]本申请涉及终端
,尤其涉及分布式语音控制方法及电子设备。

技术介绍

[0002]随着智能设备的普及,越来越多用户可以在各种智慧场景使用各种智能设备。其中,智慧场景包括语音控制场景。在语音控制场景中,可以通过某个电子设备对该分布式语音控制的其他设备进行语音控制。比如,在图1所示场景中,用户向手机输入语音信息“打开电视”,手机解析该语音信息所表示的操作信息(即用户想要打开电视),并生成控制信号,将控制信号发给电视,以便控制电视打开。
[0003]在一些方案中,手机可以借助机器学习模型解析用户的语音信息。但是,由于不同设备可能来自不同厂商,因此,在有新类型或来自新厂商的设备与手机建立无线连接的情况下,手机厂商通常需要重新训练机器学习模型,以便模型能够正确解析用于控制该新类型或新厂商的设备的语音信息。可见,现有技术中,频繁重新训练模型将导致手机厂商开发量大,手机厂商需要后期不断重新训练和维护整个模型。并且,手机中运行的模型复杂,负载较重,导致处理时延较高,语音控制的效率较低。

技术实现思路

[0004]本申请提供分布式语音控制方法及电子设备,可以提升语音控制的效率。
[0005]为了实现上述目的,本申请实施例提供了以下技术方案:
[0006]第一方面提供一种分布式语音控制方法,可以应用于第一终端或能够实现第一终端功能的组件(比如芯片系统)中,第一终端响应于用户输入的语音信息,将语音信息输入第一模型,并通过第一模型获得语音信息对应的特征信息,所述第一模型存在于所述第一终端;第一终端向第二终端发送特征信息,以使第二终端中将特征信息输入第二模型,并通过第二模型确定语音信息对应的操作信息,以及根据操作信息执行相应操作,所述第二模型存在于所述第二终端。
[0007]与现有技术中,第一终端(比如手机)需完成由语音的特征提取到操作信息识别的过程,导致第一终端的计算量大,语音控制的效率低相比,本申请的技术方案,在诸如智能家居设备的语音控制场景中,将特征信息的提取与操作信息的识别过程解耦。比如,可以将用于语音控制的完整模型至少拆分为第一模型和第二模型。其中,第一模型存在于第一终端中,第一终端可以通过第一模型提取语音信息对应的特征信息。第二模型存在于第二终端中,第二终端可以通过第二模型(比如手机控制的各智能家居设备)识别操作信息。由于第一终端不再执行语音控制中的全部步骤,比如不再进行操作信息识别的操作,因此,计算量有所降低,能够提升第一终端的运行速度,进而提高语音控制的效率。
[0008]在一种可能的设计中,第一模型是基于至少一个第一样本数据训练得到的模型,第一样本数据包括:第一语音信息,第一语音信息的特征信息是已知的,和/或,
[0009]第二模型是基于至少一个第二样本数据训练得到的模型,第二样本数据包括:第
一特征信息,第一特征信息对应的操作信息是已知的。
[0010]在一种可能的设计中,第一终端、至少一个第二终端在同一局域网中;
[0011]或者,第一终端、至少一个第二终端在不同局域网中。
[0012]在一种可能的设计中,第一终端向第二终端发送特征信息,包括:第一终端向第二终端广播特征信息。
[0013]在一种可能的设计中,语音信息对应的特征信息,包括语音信息对应的声谱、声谱的音素。
[0014]第二方面提供一种分布式语音控制方法,方法包括:
[0015]第二终端从第一终端接收语音信息对应的特征信息;特征信息是第一终端将语音信息输入第一模型,并通过第一模型获得的,所述第一模型存在于所述第一终端;
[0016]第二终端将特征信息输入第二模型,并通过第二模型确定语音信息对应的操作信息,所述第二模型存在于所述第二终端;
[0017]第二终端根据操作信息执行相应操作。
[0018]在一种可能的设计中,第二终端根据操作信息执行相应操作,包括:
[0019]若确定语音信息对应的操作信息为第二终端匹配的操作信息,则第二终端根据语音信息对应的操作信息执行目标操作;和/或,
[0020]若确定语音信息对应的操作信息不是第二终端匹配的操作信息,则第二终端丢弃操作信息。
[0021]在一种可能的设计中,第一模型是基于至少一个第一样本数据训练得到的模型,第一样本数据包括:第一语音信息,第一语音信息的特征信息是已知的;和/或,第二模型是基于至少一个第二样本数据训练得到的模型,第二样本数据包括:第一特征信息,第一特征信息对应的操作信息是已知的。
[0022]在一种可能的设计中,第一终端与第二终端在同一局域网中,或者,第一终端与第二终端在不同局域网中。
[0023]在一种可能的设计中,语音信息对应的特征信息,包括语音信息对应的声谱、声谱的音素。
[0024]第三方面提供一种语音识别方法,可以应用于第一终端或实现第一终端功能的组件(比如芯片系统)中。以第一终端实现该方法为例,该方法包括:
[0025]第一终端接收用户输入的第一语言的第一语音信息;
[0026]所述第一终端响应于所述第一语音信息,将所述第一语音信息输入第一模型,并通过所述第一模型获得所述第一语音信息对应的特征信息;所述第一模型存在于所述第一终端;
[0027]所述第一终端向第二终端发送所述特征信息,以使得所述第二终端将所述特征信息输入第二模型,并通过所述第二模型确定所述第一语音信息对应的字幕信息,所述第二模型存在于所述第二终端。
[0028]在一种可能的设计中,所述第一模型是基于至少一个第一样本数据训练得到的模型,第一样本数据包括:第一语音信息,所述第一语音信息的特征信息是已知的;和/或,所述第二模型是基于至少一个第二样本数据训练得到的模型,第二样本数据包括:第一特征信息,所述第一特征信息对应的操作信息是已知的。
[0029]在一种可能的设计中,所述字幕信息为第二语言的字幕信息。
[0030]在一种可能的设计中,所述第一语言与所述第二语言不同。
[0031]该方法可应用在语音转字幕的场景中,比如远程会议中,第二终端可能需要将使用第一终端的说话者的语音信息生成字幕,并显示在屏幕上,以便于更清晰的了解、获知使用第一终端的说话者的讲话内容。进一步的,在第二终端开启语音翻译功能的情况下,第二终端可以根据第一语音信息的特征信息,将使用第一终端的说话者的第一语音信息(比如英文的语音信息)翻译为相应语种(比如中文)的字幕,进而能够让使用第二终端的用户更加了解对端说话者的讲话含义。
[0032]此外,由于语音转字幕的操作由第一终端和第二终端共同实现,第一终端无需负责将语音信息转化为相应操作信息,因此,第一终端的计算量有所降低,能够提升第一终端的运行速度,进而提升语音转字幕的效率。
[0033]在一种可能的设计中,所述第二终端包括开启语音翻译功能的终端。
[0034]在一种可能的设计中,所述第一终端向第二终端发送所述特征信息,包括:所述第一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分布式语音控制方法,其特征在于,所述方法包括:第一终端响应于用户输入的语音信息,将所述语音信息输入第一模型,并通过所述第一模型获得所述语音信息对应的特征信息,所述第一模型存在于所述第一终端;所述第一终端向第二终端发送所述特征信息,以使得所述第二终端将所述特征信息输入第二模型,并通过所述第二模型确定所述语音信息对应的操作信息,以及根据所述操作信息执行相应操作,所述第二模型存在于所述第二终端。2.根据权利要求1所述的方法,其特征在于,所述第一模型是基于至少一个第一样本数据训练得到的模型,第一样本数据包括:第一语音信息,所述第一语音信息的特征信息是已知的;和/或,所述第二模型是基于至少一个第二样本数据训练得到的模型,第二样本数据包括:第一特征信息,所述第一特征信息对应的操作信息是已知的。3.根据权利要求1或2所述的方法,其特征在于,所述第一终端向第二终端发送所述特征信息,包括:所述第一终端广播所述特征信息。4.一种分布式语音控制方法,其特征在于,所述方法包括:第二终端从第一终端接收语音信息对应的特征信息;所述特征信息是所述第一终端将所述语音信息输入第一模型,并通过所述第一模型获得的,所述第一模型存在于所述第一终端;所述第二终端将所述特征信息输入第二模型,并通过所述第二模型确定所述语音信息对应的操作信息,所述第二模型存在于所述第二终端;所述第二终端根据所述操作信息执行相应操作。5.根据权利要求4所述的方法,其特征在于,所述第二终端根据所述操作信息执行相应操作,包括:若确定所述语音信息对应的操作信息...

【专利技术属性】
技术研发人员:孟亚洲兰国兴白立勋俞清华石巍巍
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1