在线翻译过程中的语音数据处理方法及装置制造方法及图纸

技术编号：34798614 阅读：18 留言：0更新日期：2022-09-03 20:04

本申请实施例提供一种在线翻译过程中的语音数据处理方法及装置，应用于终端进行语音通信，涉及通信技术领域，能够节省在线翻译的流量消耗。该方法包括：终端获取第一语音数据包，该第一语音数据包包括预设时间段内的语音数据；并且终端确定第一语音数据包中不存在有效语音数据，终端停止向翻译服务器上传语音数据。据。据。

全部详细技术资料下载

【技术实现步骤摘要】
在线翻译过程中的语音数据处理方法及装置
[0001]本申请是分案申请，原申请的申请号是201811199111.4，原申请日是2018年10月15日，原申请的全部内容通过引用结合在本申请中。

[0002]本申请实施例涉及通信
，尤其涉及一种在线翻译过程中的语音数据处理方法及装置。

技术介绍

[0003]通过终端进行通话的两个用户，当通话双方的母语不同时，可以进行在线翻译将各自的语音翻译成对方的母语，以消除通话双方的语言障碍。
[0004]目前，在双方通话的过程中，终端1采集到的语音数据中包括无效的语音数据(例如通话过程中用户在一段时间内未讲话时终端采集的音频数据)时，终端仍然将该语音数据上传至翻译服务器以使得翻译服务器对该语音数据进行翻译，由于提供翻译服务的提供商通常按照语音数据的流量或时长进行收费，因此当终端将无效的语音数据上传至翻译服务器会导致终端消耗更多的流量，从而增加通话成本。

技术实现思路

[0005]本申请实施例提供一种在线翻译过程中的语音数据处理方法及装置，能够节省在线翻译的流量消耗。
[0006]为达到上述目的，本申请实施例采用如下技术方案：
[0007]第一方面，本申请实施例提供一种在线翻译过程中的语音数据处理方法，应用于终端进行语音通信的场景中，该方法包括：终端获取第一语音数据包，该第一语音数据包包括预设时间段内的语音数据；并且终端确定该第一语音数据包中不存在有效语音数据时，终端停止向翻译服务器上传语音数据。
[0008]本申请实施例提...

【技术保护点】

【技术特征摘要】
1.一种在线翻译过程中的语音数据处理方法，其特征在于，应用于终端进行语音通信，所述方法包括：终端获取第一语音数据包，所述第一语音数据包包括预设时间段内的语音数据；所述终端确定所述第一语音数据包中不存在有效语音数据，所述终端停止向翻译服务器上传语音数据。2.根据权利要求1所述的方法，其特征在于，所述终端确定所述第一语音数据包中是否存在有效语音数据，包括：所述终端确定所述第一语音数据包的第一属性值是否满足预设条件，所述预设条件包括以下条件中的一个或多个：离散性条件、连续性条件、紧致性条件；所述第一语音数据包的第一属性值不满足所述预设条件，则所述终端确定所述第一语音数据包中不存在有效语音数据；或者所述第一语音数据包的第一属性值满足所述预设条件，则所述终端确定所述第一语音数据包中存在有效语音数据。3.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：所述终端确定所述第一语音数据包中存在有效语音数据；所述终端继续向所述翻译服务器上传语音数据。4.根据权利要求1至3任一项所述的方法，其特征在于，所述方法还包括：所述终端向所述翻译服务器发送所述第一语音数据包；所述终端从所述翻译服务器接收所述第一语音数据包的翻译结果；所述终端确定所述第一语音数据包满足第一条件，则所述终端停止向所述翻译服务器上传语音数据；其中，所述第一条件包括以下条件中的一个或多个：所述第一语音数据包中不存在有效语音数据；所述第一语音数据包的翻译结果为空。5.根据权利要求1至4任一项所述的方法，其特征在于，所述终端停止向翻译服务器上传语音数据，包括：所述终端显示第一提示框；所述终端接收用户对所述第一提示框的第一操作，响应于所述第一操作，断开与所述翻译服务器之间的连接。6.根据权利要求1至4任一项所述的方法，其特征在于，所述终端停止向翻译服务器上传语音数据，包括：所述终端保持与所述翻译服务器之间的连接，并且所述终端停止向所述翻译服务器发送语音数据。7.根据权利要求2至6所述的方法，其特征在于，所述预设条件包括离散性条件、连续性条件以及紧致性条件；若所述第一属性值不满足所述离散性条件，且不满足所述连续性条件，且不满足所述紧致性条件，则所述终端确定所述第一语音数据包中不存在有效语音数据。8.根据权利要求2至7任一项所述的方法，其特征在于，所述第一语音数据包的第一属性值包括所述第一语音数据包的各个数据帧的信噪比。9.根据权利要求2至8任一项所述的方法，其特征在于，
所述离散性条件包括：所述第一语音数据包的第一属性值的方差大于方差阈值。10.根据权利要求2至8任一项所述的方法，其特征在于，所述连续性条件包括：所述第一语音数据包的第一属性值的连续性计数大于连续性阈值，所述连续性阈值满足：T
c
＝θ
c
×
F
s
，其中，T
c
为所述连续性阈值，θ
c
为连续性系数，F
s
为所述第一语音数据包的采样频率；其中，所述第一语音数据包的第一属性值包括N个，N为大于或者等于1的整数，确定所述第一属性值的连续性计数，包括：终端确定第i个第一属性值是否大于第一属性值的阈值，1≤i≤N
‑
1；若所述第i个第一属性值大于第一属性值的阈值，则所述终端将所述第一属性值的连续性计数增加1；若所述第i个第一属性值小于或者等于所述第一属性值的阈值，则所述第一属性值的离散性计数增加1；在所述离散性计数小于或者等于离散性阈值的情况下，确定第i+1个第一属性值是否大于所述第一属性值的阈值，所述离散性阈值满足：T
d
＝θ
d
×
F
s
，其中，T
d
为所述离散性阈值，θ
d
为离散性系数，F
s
为所述第一语音数据包的采样频率；若所述离散性计数大于所述离散性阈值，则将所述连续性计数和离散性计数清零，所述终端从第i+1个第一属性值开始重新确定所述连续性计数。11.根据权利要求2至8任一项所述的方法，其特征在于，所述紧致性条件包括：所述第一语音数据包的第一属性值的紧致性计数大于紧致性阈值，所述紧致性阈值满足：T
i
＝θ
i
×
N，其中，T
i
为所述紧致性阈值，θ
i
为紧致性系数，N为所述第一语音数据包中包括的第一属性值的数量，所述紧致性计数为大于第一属性值的阈值的第一属性值的数量。12.一种终端，其特征在于，所述终端包括：一个或多个处理器、存储器、通信接口以及麦克风；所述存储器、所述通信接口与所述处理器耦合；所述麦克风用于捕获语音数据；所述存储器用于存储计算机程序代码；所述计算机程序代码包括计...

【专利技术属性】
技术研发人员：张鑫，闫伟，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人