基于长短音频的语音标注方法及系统技术方案

技术编号：46619008 阅读：2 留言：0更新日期：2025-10-14 21:14

本申请涉及智能识别技术领域，尤其涉及一种基于长短音频的语音标注方法及系统，其中方法包括：获取包含长音频的音频数据并对音频数据进行预处理；基于语音端点检测的方法对音频数据中的长音频进行分割，生成包含语义的短音频；基于Transformer的深度学习模型对包含语义的短音频进行标注，生成第一标注结果；对包含语义的短音频进行人工标注，生成第二标注结果；通过一致性检验以及融合策略的方法，基于第一标注结果和第二标注结果生成最终标注结果。本申请能够通过一致性检验和融合策略，将两次标注的结果整合为最终标注结果，以确保标注结果的一致性和可靠性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及智能识别，尤其涉及一种基于长短音频的语音标注方法及系统。

技术介绍

1、随着语音识别技术的不断进步和普及，语音数据在各种应用场景中得到了广泛应用，从语音助手到语音搜索再到智能家居控制等。这种趋势使得对语音数据的标注需求日益增长，特别是对于长短语音片段的准确标注变得尤为重要。长短语音片段的标注在语音识别、语音合成、情感分析等领域有着广泛的应用，但传统的手动标注方法效率低下，且容易出现标注不一致等问题，因此需要一种高效准确的基于长短音频的语音标注方法来应对这一挑战。

2、目前，基于长短音频的语音标注主要依赖于人工标注和自动标注两种方法。人工标注通常通过专业标注人员手动听取音频并进行标注，具有较高的准确性，但速度慢且成本高昂。自动标注则是利用机器学习和信号处理等技术，尝试自动化地完成语音标注，虽然能够提高效率，但在处理复杂场景和辨别语音特征方面仍存在一定挑战。

3、在现有的基于长短音频的语音标注方法中，一个主要问题是标注数据的一致性和准确性。尽管人工标注能够提供较高的准确性，但在大规模数据标注过程中，不可避免...

【技术保护点】

1.一种基于长短音频的语音标注方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于长短音频的语音标注方法，其特征在于，所述获取包含长音频的音频数据并对音频数据进行预处理包括：

3.根据权利要求1所述的基于长短音频的语音标注方法，其特征在于，所述基于语音端点检测的方法对音频数据中的长音频进行分割，生成包含语义的短音频包括：

4.根据权利要求3所述的基于长短音频的语音标注方法，其特征在于，所述基于语音端点检测的方法对音频数据中的长音频进行分割，生成包含语义的短音频还包括：

5.根据权利要求1所述的基于长短音频的语音标注方法，其特征在于...

【技术特征摘要】

1.一种基于长短音频的语音标注方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于长短音频的语音标注方法，其特征在于，所述获取包含长音频的音频数据并对音频数据进行预处理包括：

5.根据权利要求1所述的基于长短音频的语音标注方法，其特征在于，所述基于transformer的深度学习模型对包含语义的短音频进行标注，生成第一标注结果包括：

6.根据权...

【专利技术属性】
技术研发人员：向万余，许诺，于沁雯，滕鑫鑫，
申请(专利权)人：苏州核数聚信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人