在线翻译过程中的语音数据处理方法及装置制造方法及图纸

技术编号:34798614 阅读:18 留言:0更新日期:2022-09-03 20:04
本申请实施例提供一种在线翻译过程中的语音数据处理方法及装置,应用于终端进行语音通信,涉及通信技术领域,能够节省在线翻译的流量消耗。该方法包括:终端获取第一语音数据包,该第一语音数据包包括预设时间段内的语音数据;并且终端确定第一语音数据包中不存在有效语音数据,终端停止向翻译服务器上传语音数据。据。据。

【技术实现步骤摘要】
在线翻译过程中的语音数据处理方法及装置
[0001]本申请是分案申请,原申请的申请号是201811199111.4,原申请日是2018年10月15日,原申请的全部内容通过引用结合在本申请中。


[0002]本申请实施例涉及通信
,尤其涉及一种在线翻译过程中的语音数据处理方法及装置。

技术介绍

[0003]通过终端进行通话的两个用户,当通话双方的母语不同时,可以进行在线翻译将各自的语音翻译成对方的母语,以消除通话双方的语言障碍。
[0004]目前,在双方通话的过程中,终端1采集到的语音数据中包括无效的语音数据(例如通话过程中用户在一段时间内未讲话时终端采集的音频数据)时,终端仍然将该语音数据上传至翻译服务器以使得翻译服务器对该语音数据进行翻译,由于提供翻译服务的提供商通常按照语音数据的流量或时长进行收费,因此当终端将无效的语音数据上传至翻译服务器会导致终端消耗更多的流量,从而增加通话成本。

技术实现思路

[0005]本申请实施例提供一种在线翻译过程中的语音数据处理方法及装置,能够节省在线翻译的流量消耗。
[0006]为达到上述目的,本申请实施例采用如下技术方案:
[0007]第一方面,本申请实施例提供一种在线翻译过程中的语音数据处理方法,应用于终端进行语音通信的场景中,该方法包括:终端获取第一语音数据包,该第一语音数据包包括预设时间段内的语音数据;并且终端确定该第一语音数据包中不存在有效语音数据时,终端停止向翻译服务器上传语音数据。
[0008]本申请实施例提供的在线翻译过程中的语音数据处理方法,在两个终端进行语音通信的过程中,对于其中的一个终端,该终端获取第一语音数据包之后,可以确定第一语音数据包中是否存在有效语音数据,若第一语音数据包中不存在有效语音数据,则终端停止向翻译服务器上传语音数据,由于终端可以确定是否停止向翻译服务器上传语音数据,因此,能够使得终端更加智能化,并且在第一语音数据包不存在有效语音数据时,终端无需再向翻译服务器上传语音数据,如此,能够节省在线翻译的流量消耗。
[0009]在一种可能的设计中,上述终端确定该第一语音数据包中是否存在有效语音数据的方法可以包括:终端根据该第一语音数据包的第一属性值,确定第一语音数据包是否满足预设条件,该预设条件包括以下条件中的一个或多个:离散性条件、连续性条件、紧致性条件;第一语音数据包的第一属性值不满足该预设条件,则终端确定第一语音数据包中不存在有效语音数据;第一语音数据包的第一属性值满足上述预设条件,则终端确定第一语音数据包中存在有效语音数据。
[0010]一种可能的设计中,本申请实施例提供的在线翻译过程中的语音数据处理方法还包括:终端确定第一语音数据包中存在有效语音数据,并且终端继续向翻译服务器上传语音数据,从而翻译服务器继续对终端上传的语音数据进行翻译,保证终端顺利地进行语音通信。
[0011]一种可能的设计中,终端停止向翻译服务器发送语音数据之后,当终端获取到新的语音数据包(称为第二语音数据包)时,终端确定该第二语音数据包中存在有效语音数据,则终端恢复与翻译服务器之间的连接,并且开始向翻译服务器上传该第二语音数据包。
[0012]一种可能的设计中,本申请实施例提供的在线翻译过程中的语音数据处理方法还包括:终端向翻译服务器发送第一语音数据包;并且终端从翻译服务器接收该第一语音数据包的翻译结果;终端确定第一语音数据包满足第一条件,则终端停止向翻译服务器上传语音数据;其中,上述第一条件包括以下条件中的一个或多个:上述第一语音数据包中不存在有效语音数据;第一语音数据包的翻译结果为空。本申请实施例中,终端确定第一语音数据包中不存在有效语音数据(即第一语音数据包的第一属性值不满足预设条件)时,终端还可以结合翻译服务器返回的翻译结果,确定是否停止向翻译服务器上传语音数据。
[0013]一种可能的设计中,当第一语音数据包中不存在有效语音数据,并且翻译服务器返回的翻译结果为空(即没有翻译结果),进一步说明第一语音数据包中不存在有效语音数据,如此,能够提升检测有效语音数据的正确率;进一步的,终端不再向翻译服务器上传语音数据,能够节省在线翻译的流量消耗,降低用户的通话费用。
[0014]一种可能的设计中,上述终端停止向翻译服务器上传语音数据的方法可以包括:终端显示第一提示框;并且终端接收用户对该第一提示框的第一操作,响应于第一操作,断开与翻译服务器之间的连接。本申请实施例中,终端确定第一语音数据包中不存在有效语音数据时,终端可以向用户提示是否需要断开与翻译服务器之间的连接,如此,可以提升用户体验。
[0015]一种可能的设计中,上述终端停止向翻译服务器上传语音数据的方法可以包括:终端保持与翻译服务器之间的连接,并且终端停止向翻译服务器发送语音数据。本申请实施例中,当终端确定该第一语音数据包中不存在有效语音数据时,终端可以继续保持与翻译服务器之间的连接,但终端停止向翻译服务器上传语音数据。在这种情况下,终端还是会继续获取用户发出的语音数据包,并且确定新获取的语音数据包的第一属性值是否满足预设条件。
[0016]一种可能的设计中,上述预设条件包括离散性条件、连续性条件以及紧致性条件;若第一语音数据包的第一属性值不满足离散性条件,且不满足连续性条件,且不满足紧致性条件,则终端确定第一语音数据包中不存在有效语音数据。本申请实施例中,当第一语音数据包的第一属性值不满足上述离散性条件,且不满足连续性条件,且不满足紧致性条件时,终端可以更加准确地确定该第一语音数据包中不存在有效语音数据。
[0017]一种可能的设计中,第一语音数据包的第一属性值包括第一语音数据包的各个数据帧的信噪比。
[0018]一种可能的设计中,上述离散性条件包括:第一语音数据包的第一属性值的方差大于方差阈值。本申请实施例中,上述第一语音数据包的第一属性值的方差大于方差阈值(即满足离散性条件)时,说明第一语音数据包的第一属性值具有离散性,进一步说明第一
语音数据包中存在有效语音数据(即用户有发出语音);第一语音数据包的第一属性值的方差小于或者等于方差阈值(即不满足离散性条件)时,说明第一语音数据包的第一属性值不具备离散性,进一步说明第一语音数据包中不存在有效语音数据(即用户未发出语音)。
[0019]一种可能的设计中,上述连续性条件包括:第一语音数据包的第一属性值连续性计数大于连续性阈值,该连续性阈值满足:T
c
=θ
c
×
F
s
,其中,T
c
为连续性阈值,θ
c
为连续性系数,F
s
为第一语音数据包的采样频率。本申请实施例中,第一语音数据包的第一属性值的连续性计数大于连续性阈值(即满足连续性条件)时,说明第一属性值具有连续性,进一步说明第一语音数据包中存在有效语音数据(即用户有发出语音);第一属性值的连续性计数小于或者等于连续性阈值(即不满足连续性条件)时,说明第一属性值不具备连续性,进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种在线翻译过程中的语音数据处理方法,其特征在于,应用于终端进行语音通信,所述方法包括:终端获取第一语音数据包,所述第一语音数据包包括预设时间段内的语音数据;所述终端确定所述第一语音数据包中不存在有效语音数据,所述终端停止向翻译服务器上传语音数据。2.根据权利要求1所述的方法,其特征在于,所述终端确定所述第一语音数据包中是否存在有效语音数据,包括:所述终端确定所述第一语音数据包的第一属性值是否满足预设条件,所述预设条件包括以下条件中的一个或多个:离散性条件、连续性条件、紧致性条件;所述第一语音数据包的第一属性值不满足所述预设条件,则所述终端确定所述第一语音数据包中不存在有效语音数据;或者所述第一语音数据包的第一属性值满足所述预设条件,则所述终端确定所述第一语音数据包中存在有效语音数据。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:所述终端确定所述第一语音数据包中存在有效语音数据;所述终端继续向所述翻译服务器上传语音数据。4.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:所述终端向所述翻译服务器发送所述第一语音数据包;所述终端从所述翻译服务器接收所述第一语音数据包的翻译结果;所述终端确定所述第一语音数据包满足第一条件,则所述终端停止向所述翻译服务器上传语音数据;其中,所述第一条件包括以下条件中的一个或多个:所述第一语音数据包中不存在有效语音数据;所述第一语音数据包的翻译结果为空。5.根据权利要求1至4任一项所述的方法,其特征在于,所述终端停止向翻译服务器上传语音数据,包括:所述终端显示第一提示框;所述终端接收用户对所述第一提示框的第一操作,响应于所述第一操作,断开与所述翻译服务器之间的连接。6.根据权利要求1至4任一项所述的方法,其特征在于,所述终端停止向翻译服务器上传语音数据,包括:所述终端保持与所述翻译服务器之间的连接,并且所述终端停止向所述翻译服务器发送语音数据。7.根据权利要求2至6所述的方法,其特征在于,所述预设条件包括离散性条件、连续性条件以及紧致性条件;若所述第一属性值不满足所述离散性条件,且不满足所述连续性条件,且不满足所述紧致性条件,则所述终端确定所述第一语音数据包中不存在有效语音数据。8.根据权利要求2至7任一项所述的方法,其特征在于,所述第一语音数据包的第一属性值包括所述第一语音数据包的各个数据帧的信噪比。9.根据权利要求2至8任一项所述的方法,其特征在于,
所述离散性条件包括:所述第一语音数据包的第一属性值的方差大于方差阈值。10.根据权利要求2至8任一项所述的方法,其特征在于,所述连续性条件包括:所述第一语音数据包的第一属性值的连续性计数大于连续性阈值,所述连续性阈值满足:T
c
=θ
c
×
F
s
,其中,T
c
为所述连续性阈值,θ
c
为连续性系数,F
s
为所述第一语音数据包的采样频率;其中,所述第一语音数据包的第一属性值包括N个,N为大于或者等于1的整数,确定所述第一属性值的连续性计数,包括:终端确定第i个第一属性值是否大于第一属性值的阈值,1≤i≤N

1;若所述第i个第一属性值大于第一属性值的阈值,则所述终端将所述第一属性值的连续性计数增加1;若所述第i个第一属性值小于或者等于所述第一属性值的阈值,则所述第一属性值的离散性计数增加1;在所述离散性计数小于或者等于离散性阈值的情况下,确定第i+1个第一属性值是否大于所述第一属性值的阈值,所述离散性阈值满足:T
d
=θ
d
×
F
s
,其中,T
d
为所述离散性阈值,θ
d
为离散性系数,F
s
为所述第一语音数据包的采样频率;若所述离散性计数大于所述离散性阈值,则将所述连续性计数和离散性计数清零,所述终端从第i+1个第一属性值开始重新确定所述连续性计数。11.根据权利要求2至8任一项所述的方法,其特征在于,所述紧致性条件包括:所述第一语音数据包的第一属性值的紧致性计数大于紧致性阈值,所述紧致性阈值满足:T
i
=θ
i
×
N,其中,T
i
为所述紧致性阈值,θ
i
为紧致性系数,N为所述第一语音数据包中包括的第一属性值的数量,所述紧致性计数为大于第一属性值的阈值的第一属性值的数量。12.一种终端,其特征在于,所述终端包括:一个或多个处理器、存储器、通信接口以及麦克风;所述存储器、所述通信接口与所述处理器耦合;所述麦克风用于捕获语音数据;所述存储器用于存储计算机程序代码;所述计算机程序代码包括计...

【专利技术属性】
技术研发人员:张鑫闫伟
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1