音频处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40326314 阅读:12 留言:0更新日期:2024-02-09 14:20
本发明专利技术提供一种音频处理方法、装置、电子设备及存储介质,涉及通信技术领域。该音频处理方法包括:获取待处理音频信息,所述待处理音频信息包括主音轨音频文件和至少两个子音轨音频文件;获取所述至少两个子音轨音频文件中的每一个第一语音片段在主音轨中的时间戳信息,所述主音轨为所述主音轨音频文件所对应的音轨;基于每一第一语音片段的时间戳信息以及对应的说话人标签信息,生成音频日志信息。这样可以提升音频日志信息的准确性。

【技术实现步骤摘要】

本专利技术实施例涉及通信,尤其涉及一种音频处理方法、装置、电子设备及存储介质


技术介绍

1、目前,针对视频会议、语音会议等会议场景,尤其是视频会议场景下,可通过获得说话人的面部信息和语音信息,并根据声道信息,将会议语音转化为会议日志并标注出不同的说话人,以提升会后总结效率。然而,在实际应用中,由于未必能采集到每一个会议发言人的面部信息,导致难以确定所有会议发言人的身份信息,进而难以生成得到准确的会议日志。


技术实现思路

1、本专利技术实施例提供一种音频处理方法、装置、电子设备及存储介质,以解决相关技术中的会议日志存在的准确性差的问题。

2、为解决上述问题,本专利技术是这样实现的:

3、第一方面,本专利技术实施例提供了一种音频处理方法,所述方法包括:

4、获取待处理音频信息,所述待处理音频信息包括主音轨音频文件和至少两个子音轨音频文件;

5、获取所述至少两个子音轨音频文件中的每一个第一语音片段在主音轨中的时间戳信息,所述主音轨为所述主音轨音频文件所对应的音轨;<本文档来自技高网...

【技术保护点】

1.一种音频处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取所述至少两个子音轨音频文件中的每一个语音片段在主音轨中的时间戳信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于每一第一语音片段的时间戳信息以及对应的说话人标签信息,生成音频日志信息,包括:

4.根据权利要求3所述的方法,其特征在于,所述至少两个子音轨音频文件包括目标子音轨音频文件,所述目标子音轨音频文件包括至少两个说话人的语音信息;

5.根据权利要求2所述的方法,其特征在于,所述将所述多个第一语音片段与所述多个第二语音片段进行...

【技术特征摘要】

1.一种音频处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取所述至少两个子音轨音频文件中的每一个语音片段在主音轨中的时间戳信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于每一第一语音片段的时间戳信息以及对应的说话人标签信息,生成音频日志信息,包括:

4.根据权利要求3所述的方法,其特征在于,所述至少两个子音轨音频文件包括目标子音轨音频文件,所述目标子音轨音频文件包括至少两个说话人的语音信息;

5.根据权利要求2所述的方法,其特征在于,所述将所述多个第一语音片段与所述多个第二语音片段进行对齐处理,得到每一个第一语音片段在主音轨中的时间戳信息,包括:

6.一种音频处理装置,其特征在于,所述装置包括:

7.根据权利要求6所述的装置,其特征在于,所述...

【专利技术属性】
技术研发人员:张润清蔡敦波张燚钧杜宇健黄智国
申请(专利权)人:中移苏州软件技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1