通话字幕处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：40974815 阅读：28 留言：0更新日期：2024-04-18 21:23

本申请实施例公开了一种通话字幕处理方法、装置、电子设备及存储介质，通过获取接入目标通话的任意一个通话成员传输的通话音频数据包，将通话音频数据包传输至接入目标通话的字幕服务端，字幕服务端对通话音频数据包进行语音识别得到字幕数据包，得到的字幕数据包被传输至各个通话成员。生成字幕数据包的过程无须其他通话成员的参与，有效降低网络负载，提升通话字幕的实时性，并且由于字幕服务端被管理服务端配置为目标通话的隐藏成员，其他通话成员并不会感知到字幕服务端的存在，从而在提升通话字幕的实时性的同时，保留原有的通话体验，提升通话字幕处理的通用性，可广泛应用于云技术、人工智能等场景。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及互联网，特别是涉及一种通话字幕处理方法、装置、电子设备及存储介质。

技术介绍

1、随着终端技术的发展和网络带宽的提升，越来越多的用户选择使用音视频通话系统进行远程沟通，在一些场景中，往往需要在通话过程中同时显示通话字幕。相关技术中，在通话过程中生成通话字幕时，终端需要将音频数据发送至语音识别服务器进行语音识别，进而生成通话字幕，这种处理方式会增加网络负载，降低了通话字幕的实时性。

技术实现思路

1、以下是对本申请详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

2、本申请实施例提供了一种通话字幕处理方法、装置、电子设备及存储介质，能够提升通话字幕的实时性。

3、一方面，本申请实施例提供了一种通话字幕处理方法，包括：

4、获取接入目标通话的任意一个通话成员传输的通话音频数据包；

5、将所述通话音频数据包传输至接入所述目标通话的字幕服务端，其中，所述字幕服务端是由所述目标通话的管理服务端激活并接入所述目标通话的，所述字幕服...

【技术保护点】

1.一种通话字幕处理方法，其特征在于，包括：

2.根据权利要求1所述的通话字幕处理方法，其特征在于，所述将所述字幕数据包传输至所述通话成员，包括：

3.根据权利要求2所述的通话字幕处理方法，其特征在于，各个所述字幕数据包均配置有各自对应的包序号，所述将丢失的所述字幕数据包重新传输至所述通话成员，包括：

4.根据权利要求3所述的通话字幕处理方法，其特征在于，所述当所述传输时间间隔大于或者等于预设的时长阈值，将丢失的所述字幕数据包重新传输至所述通话成员之前，所述通话字幕处理方法还包括：

5.根据权利要求1所述的通话字幕处理方法，其特征在于，所述...

【技术特征摘要】

1.一种通话字幕处理方法，其特征在于，包括：

2.根据权利要求1所述的通话字幕处理方法，其特征在于，所述将所述字幕数据包传输至所述通话成员，包括：

5.根据权利要求1所述的通话字幕处理方法，其特征在于，所述通话成员分别创建有各自对应的第二数据链路，所述第二数据链路用于供当前的所述通话成员接收其余的所述通话成员传输的所述通话音频数据包，所述将所述字幕数据包传输至所述通话成员，包括：

6.根据权利要求5所述的通话字幕处理方法，其特征在于，所述将所述通话音频数据包以及对应的所述字幕数据包组合为合并数据包，包括：

7.根据权利要求1所述的通话字幕处理方法，其特征在于，...

【专利技术属性】
技术研发人员：薛政，周煜，郭泽辉，黄晓萍，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人