音频处理方法、装置、电子设备及介质制造方法及图纸

技术编号：33251609 阅读：52 留言：0更新日期：2022-04-30 22:50

本申请实施例提供了一种音频处理方法、装置、电子设备及介质，涉及云技术及人工智能技术领域。该方法包括：获取待处理音频；确定所述待处理音频的至少一个初始分段时间点；确定所述待处理音频中各所述初始分段时间点各自对应的至少一个静音片段；根据各所述初始分段时间点各自对应的至少一个静音片段，确定各所述初始分段时间点对应的目标分段时间点；根据各所述目标分段时间点，得到所述待处理音频的各音频片段；对各所述音频片段进行语音识别，并基于各所述音频片段的语音识别结果得到对应于目标语言的文本。本申请实施例提高了语音识别结果的准确性。别结果的准确性。别结果的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
音频处理方法、装置、电子设备及介质

[0001]本申请涉及云技术及人工智能
，具体而言，本申请涉及一种音频处理方法、装置、电子设备及介质。

技术介绍

[0002]大多数的媒体信息是录制得到的，需要将媒体信息中的音频信息处理为文本信息，用于形成记录文件或者制作字幕等。现在技术中在对媒体信息中的音频信息进行处理时，先将媒体信息中的音频信息分为均衡的几段，再对各段音频信息分别进行处理，会导致处理得到的内容不准确的问题。

技术实现思路

[0003]本申请提实施例供了一种能够有效提高音频识别准确性的音频处理方法、装置、电子设备及介质。
[0004]第一方面，本申请实施例提供了一种音频处理方法，该方法包括：
[0005]获取待处理音频；
[0006]确定待处理音频的至少一个初始分段时间点；
[0007]确定待处理音频中各所述初始分段时间点各自对应的至少一个静音片段；
[0008]根据各初始分段时间点各自对应的至少一个静音片段，确定各初始分段时间点对应的目标分段时间点；
>[0009]根据各本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法，其特征在于，包括：获取待处理音频；确定所述待处理音频的至少一个初始分段时间点；确定所述待处理音频中各所述初始分段时间点各自对应的至少一个静音片段；根据各所述初始分段时间点各自对应的至少一个静音片段，确定各所述初始分段时间点对应的目标分段时间点；根据各所述目标分段时间点，得到所述待处理音频的各音频片段；对各所述音频片段进行语音识别，并基于各所述音频片段的语音识别结果得到对应于目标语言的文本。2.根据权利要求1所述的方法，其特征在于，所述对各所述音频片段进行语音识别，并基于各所述音频片段的语音识别结果得到对应于目标语言的文本，包括：通过多线程并行对各所述音频片段进行语音识别，并基于各所述音频片段的语音识别结果得到对应于目标语言的文本。3.根据权利要求1所述的方法，其特征在于，对于任一所述初始分段时间点，所述初始分段时间点对应的至少一个静音片段包括待处理音频中所述初始分段时间点相邻的设定数量的静音片段，或者待处理音频中以所述初始分段时间点为基准时间点的预设时长内的静音片段。4.根据权利要求1所述的方法，其特征在于，所述根据各所述初始分段时间点各自对应的至少一个静音片段，确定各所述初始分段时间点对应的目标分段时间点，包括：对于任一所述初始分段时间点，根据所述初始分段时间点对应的至少一个静音片段中时长最长的静音片段，确定所述初始分段时间点对应的目标分段时间点。5.根据权利要求1所述的方法，其特征在于，所述确定所述待处理音频的至少一个初始分段时间点，包括：根据以下信息中的至少一项，确定所述待处理音频的至少一个初始分段时间点：语音识别倍速，分段数目，预设分段时长。6.根据权利要求5所述的方法，其特征在于，各所述初始分段时间点为所述待处理音频的均分时间点；所述确定所述待处理音频中各所述初始分段时间点各自对应的至少一个静音片段之前，还包括：确定各所述初始分段时间点对应的初始分段的时长；若所述初始分段的时长小于所述预设时长，则根据所述预设时长调整各所述初始分段时间点。7.根据权利要求1所述的方法，其特征在于，所述对各所述音频片段进行语音识别，并基于各所述音频片段的语音识别结果得到对应于目标语言的文本之后，还包括：将所述文本通过客户端展示给用户。8.根据权利要求7所述的方法，其特征在于，若所述待处理音频为视频中的音频；所述将所述文本通过客户端展示给用户，包括：通过所述客户端，将所述文本以字幕的方式与所述视频的画...

【专利技术属性】
技术研发人员：张甲盛，王海忠，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人