语音交互方法及相应的设备、服务器、存储介质技术

技术编号:37708728 阅读:13 留言:0更新日期:2023-06-01 23:59
本申请提供了一种语音交互方法及相应的设备、服务器、存储介质。语音交互方法包括:在多人语音交互之前或多人语音交互过程中,响应于加密开启指令进入语音加密状态;在语音加密状态中,基于密钥对获取到的语音信号进行加密,生成加密语音信号;向与语音输出设备连接的终端设备或服务器传输加密语音信号。依据本申请的技术方案,可以有效地防止多人语音交互过程中的语音内容被泄露,提高多人语音交互的安全性。安全性。安全性。

【技术实现步骤摘要】
语音交互方法及相应的设备、服务器、存储介质


[0001]本申请涉及语音交互
,尤其涉及一种语音交互方法及相应的设备、服务器、存储介质。

技术介绍

[0002]随着钉钉等云视频会议软件的普及,多个用户之间的语音通话、会议等更加方便,与此同时,用户的语音隐私被泄露的可能性大大增加,例如,操作系统和某些恶意软件可能会获取到语音通话的内容。相关技术在VoIP(Voice over Internet Protocol,一种语音通话技术)软件中提供了加密功能,但该加密功能是数据级别、传输层的加密,无法对抗操作系统层面和恶意软件对麦克风输入的获取。

技术实现思路

[0003]本申请实施例提供一种语音交互方法及相应的设备、服务器、存储介质,以解决现有技术存在的技术问题。
[0004]第一方面,本申请实施例提供了一种语音输出设备,包括:
[0005]第一控制开关,位于语音输出设备的外侧,用于在被触发时生成加密开启指令;
[0006]加密控制模块,与第一控制开关电连接,用于在多人语音交互之前或多人语音交互过程中,响应于加密开启指令时进入语音加密状态,在语音加密状态中基于密钥对获取到的语音信号进行加密,生成加密语音信号;
[0007]第一通信模块,与加密控制模块电连接,用于向与语音输出设备连接的终端设备或服务器传输加密语音信号;终端设备用于向服务器转发加密语音信号,服务器用于向交互对象的语音接收设备转发加密语音信号。
[0008]第二方面,本申请实施例提供了一种服务器,包括:<br/>[0009]第二通信模块,用于接收本申请实施例第一方面提供的语音输出设备或终端设备传输的加密语音信号,向交互对象的语音接收设备转发加密语音信号。
[0010]第三方面,本申请实施例提供了一种语音接收设备,包括:
[0011]第三通信模块,用于接收本申请实施例第二方面提供的服务器发送的加密语音信号;
[0012]解密控制模块,用于基于密钥对加密语音信号进行解密。
[0013]第四方面,本申请实施例提供了一种语音交互方法,可应用于语音输出设备,该方法包括:
[0014]在多人语音交互之前或多人语音交互过程中,响应于加密开启指令进入语音加密状态;
[0015]在语音加密状态中,基于密钥对获取到的语音信号进行加密,生成加密语音信号;
[0016]向与语音输出设备连接的终端设备或服务器传输加密语音信号;终端设备用于向服务器转发加密语音信号,服务器用于向交互对象的语音接收设备转发加密语音信号。
[0017]第五方面,本申请实施例提供了一种语音交互方法,可应用于服务器,该方法包括:
[0018]接收本申请实施例第一方面提供的语音输出设备或终端设备传输的加密语音信号;
[0019]向交互对象的语音接收设备转发加密语音信号。
[0020]第六方面,本申请实施例提供了一种语音交互方法,可应用于语音接收设备,该方法包括:
[0021]接收本申请实施例第二方面提供的服务器发送的加密语音信号;
[0022]基于密钥对加密语音信号进行解密;密钥为本申请实施例第四方面提供的语音交互方法中所使用的密钥。
[0023]第七方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现本申请任一实施例提供的语音交互方法。
[0024]与现有技术相比,本申请具有如下优点:
[0025]依据本申请实施例的技术方案,可通过语音输出设备、服务器和语音接收设备实现语音交互,可在音频域上对多人语音交互中的语音内容进行加密,操作系统、恶意软件等只能获取到加密后的语音数据,无法解密因而无法获取原始语音内容,从而可有效保护用户的通话隐,在保密通话、保密会议等场景中提高语音交互的安全性;是否进入语音加密状态的控制操作,可在多人语音交互之前,也可在多人语音交互的过程中执行,控制的灵活性较强;加密操作可以基于软硬件结合的形式实现。
[0026]上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
[0027]在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请的一些实施方式,而不应将其视为是对本申请范围的限制。
[0028]图1为本申请实施例提供的语音交互方案的一个应用场景示意图;
[0029]图2为本申请实施例提供的语音交互方案的另一个应用场景示意图;
[0030]图3为本申请实施例提供的一种语音输出设备的结构框架示意图;
[0031]图4为本申请实施例提供的一种服务器的结构框架示意图;
[0032]图5为本申请实施例提供的一种语音接收设备的结构框架示意图;
[0033]图6为本申请实施例中各设备之间的交互示意图;
[0034]图7为本申请实施例提供的一种语音交互方法的流程示意图;
[0035]图8为本申请实施例中频谱倒置的一种原理示意图;
[0036]图9为本申请实施例中频谱倒置的另一种原理示意图;
[0037]图10为本申请实施例中更新频谱切断点的原理示意图;
[0038]图11为本申请实施例提供的又一种语音交互方法的流程示意图;
[0039]图12为本申请实施例提供的另一种语音交互方法的流程示意图;以及
[0040]图13为本申请实施例提供的又一种语音交互方法的流程示意图。
具体实施方式
[0041]在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本申请的构思或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的,而非限制性的。
[0042]随着钉钉等VoIP软件的普及,多个用户之间的语音通话、会议等交互更加方便,在此基础上衍生出了更多的交互需求,例如对通话内容进行加密以防止窃听,部分用户需要在多个用户通话的过程中偶尔进行单独沟通以沟通更为保密的内容,需要既能实现单独沟通又不影响整体沟通的功能,以提高通话效率、会议效率。基于以上需求,相关技术提出了一些解决方案,但这些解决方案通常是数据级别、传输层对通话内容加密,无法对抗操作系统层面和恶意软件对麦克风输入的获取,且用户无法感知到隐私保护的提升,VoIP软件的服务器端仍然可能有解密的密钥,从而可在中转时窃听。此外,通话内容还可能被服务器端的ASR(Automatic Speech Recognition,自动语音识别)系统识别成文字,从而被窃听到关键词进而推送广告。
[0043]基于以上现状,本申请实施例提供了一种语音交互方案,包括语音交互设备、服务器和可在该语音交互设备上执行的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音输出设备,其特征在于,包括:第一控制开关,位于所述语音输出设备的外侧,用于在被触发时生成加密开启指令;加密控制模块,与所述第一控制开关电连接,用于在多人语音交互之前或所述多人语音交互过程中,响应于所述加密开启指令时进入语音加密状态,在所述语音加密状态中基于密钥对获取到的语音信号进行加密,生成加密语音信号;第一通信模块,与所述加密控制模块电连接,用于向与所述语音输出设备连接的终端设备或服务器传输所述加密语音信号;所述终端设备用于向所述服务器转发所述加密语音信号,所述服务器用于向交互对象的语音接收设备转发所述加密语音信号。2.根据权利要求1所述的语音输出设备,其特征在于,所述第一控制开关具有多个档位,每个档位在被触发时生成一个级别的加密开启指令,每个级别的加密开启指令与一个级别的语音加密状态相关联;所述加密控制模块,还用于在接收到的一个级别的加密开启指令时进入该级别的加密开启指令所关联的一个级别的语音加密状态,在该语音加密状态中生成语音传输规则信息;所述第一通信模块,还用于向所述终端设备或所述服务器传输所述语音传输规则信息;所述语音传输规则信息包括指定权限等级,所述指定权限等级为与当前语音加密状态相关联的权限等级。3.根据权利要求2所述的语音输出设备,其特征在于,还包括:输出模块,用于针对当前语音加密状态输出多个语音交互的交互对象列表,在被执行选择操作时生成选择指令;所述加密控制模块,还用于响应于所述选择指令确定所选择的交互对象作为所述指定权限等级的交互对象,并基于所述指定权限等级的交互对象生成所述语音传输规则信息。4.根据权利要求1

3中任一项所述的语音输出设备,其特征在于,还包括:第二控制开关,用于在被触发时生成密钥更新指令;所述加密控制模块,用于响应于所述密钥更新指令时更新所述密钥。5.一种服务器,其特征在于,包括:第二通信模块,用于接收权利要求1

4中任一项所述的语音输出设备或终端设备传输的加密语音信号,向交互对象的语音接收设备转发所述加密语音信号。6.根据权利要求5所述的服务器,其特征在于,所述第二通信模块还用于接收所述语音输出设备或所述终端设备传输的语音传输规则信息;在向交互对象的语音接收设备转发所述加密语音信号时,所述第二通信模块用于向所述语音传输规则信息中指定权限等级对应的交互对象的语音接收设备传输所述加密语音信号,或向各权限等级对应的交互对象的语音接收设备传输所述加密语音信号并向所述指定权限等级对应的交互对象的语音接收设备发送密钥。7.根据权利要求5或6所述的服务器,其特征在于,所述第二通信模块还用于:获取所述语音输出设备或所述终端设备上传的交互对象列表;所述交互对象列表中包括多个交互对象和所述多个交互对象的组织架构信息;所述服务器还包括:处理模块,与所述第二通信模块电连接,用于根据所述交互对象列表中各交互对象的组织架构信息确定所述交互对象列表中的各交互对象相应的权限等级。
8.一种语音接收设备,其特征在于,包括:第三通信模块,用于接收权利要求5

7中任一项所述的服务器发送的加密语音信号;解密控制模块,用于基于密钥对所述加密语音信号进行解密。9.一种语音交互方法,其特征在于,应用于语音输出设备,所述方法包括:在多人语音交互之前或所述多人语音交互过程中,响应于加密开启指令进入语音加密状态;在所述语音加密状态中,基于密钥对获取到的语音信号进行加密,生成加密语音信号;向与所述语音输出设备连接的终端设备或服务器传输所述加密语音信号;所述终端设备用于向所述服务器转发所述加密语音信号,所述服务器用于向交互对象的语音接收设备转发所述加密语音信号。10.根据权利要求9所述的语音交互方法,其特征在于,所述加密开启指令包括多个级别的加密开启指令;所述响应于加密开启指令进入语音加密状态,包括:响应于接收到的一个级别的加密开启指令,进入该级别的加密开启指令所关联的一个级别的语音加密状态;在该语音加密状态中生成语音传输规则信息;所述语音传输规则信息包括指定权限等级,所述指定权限等级为与当前语音加密状态相关联的权限等级。11.根据权利要求10所述的语音交互方法,其特征在于,还包括:针对当前语音加密状态输出多人语音交互...

【专利技术属性】
技术研发人员:王康
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1