音频数据标注方法、装置、设备及介质制造方法及图纸

技术编号:44165145 阅读:28 留言:0更新日期:2025-01-29 10:38
本发明专利技术涉及人工智能技术领域和金融科技领域,公开了一种音频数据标注方法,通过获取音频数据,利用性别分类器确定性别属性,利用口音分类器确定口音属性,分析音频质量以获取信噪比和早晚期反射比值,分析音高特征以获取说话者平均音高和音高标准差,计算音素数量与音频长度的比值以确定说话速度属性。针对每种属性生成对应的关键字,并基于这些关键字生成音频数据的标注信息。本发明专利技术通过分析音频数据的多种属性,生成对应的关键字,显著提高了音频数据标注的效率和准确性。离散化处理将连续属性(如说话速度、信噪比等)转换为简单的类别名称,简化了复杂数据的处理,使系统在分类、检索和扩展性方面更加高效。

【技术实现步骤摘要】

本专利技术涉及人工智能和金融科技领域,尤其涉及一种音频数据标注方法、装置、设备及存储介质。


技术介绍

1、随着金融科技的不断发展,语音技术在金融服务中的应用日益广泛,包括智能客服、语音身份认证、自动化交易指令等。现有的语音识别和合成技术能够处理基础的语音任务,但在应对多样化音频数据时,存在明显的不足。

2、现有的语音识别和合成系统虽然能够识别标准语言的发音,但在处理不同地域用户的口音时,准确性和自然性明显下降。由于口音具有离散和连续两种特性,传统的离散标签标注方法难以全面、准确地反映出不同口音的特征,导致语音识别的效果差异较大,特别是在金融场景中,不同用户的口音差异可能会影响服务的质量。

3、同时,现有技术难以有效标注音频数据中的多种特征,如音高、语速等特征。这些特征对语音识别和合成具有重要影响,但由于现有系统缺乏对这些细节特征的精细化处理能力,导致在某些复杂场景下语音处理的效果不理想,不能满足金融领域对高精度语音处理的需求。


技术实现思路

1、本专利技术的主要目的在于提供一种音频数据本文档来自技高网...

【技术保护点】

1.一种音频数据标注方法,其特征在于,包括以下步骤:

2.如权利要求1所述的音频数据标注方法,其特征在于,将说话速度属性、信噪比属性、早晚期反射比值属性、说话者平均音高属性和音高标准差属性映射为对应预设的离散类别名称,将所述预设的离散类别名称分别作为对应属性的关键字,包括:

3.如权利要求1所述的音频数据标注方法,其特征在于,分析所述音频数据的音频质量,获取信噪比属性,包括:

4.如权利要求1中所述的音频数据标注方法,其特征在于,分析所述音频数据的音频质量,获取早晚期反射比值属性,包括:

5.如权利要求1所述的音频数据标注方法,其特征在于,...

【技术特征摘要】

1.一种音频数据标注方法,其特征在于,包括以下步骤:

2.如权利要求1所述的音频数据标注方法,其特征在于,将说话速度属性、信噪比属性、早晚期反射比值属性、说话者平均音高属性和音高标准差属性映射为对应预设的离散类别名称,将所述预设的离散类别名称分别作为对应属性的关键字,包括:

3.如权利要求1所述的音频数据标注方法,其特征在于,分析所述音频数据的音频质量,获取信噪比属性,包括:

4.如权利要求1中所述的音频数据标注方法,其特征在于,分析所述音频数据的音频质量,获取早晚期反射比值属性,包括:

5.如权利要求1所述的音频数据标注方法,其特征在于,分析所述音频数据的音高特征,获取说话者平均音高属性和音高标准差属性,包括:

6.如权利要求1所述的音频数据标...

【专利技术属性】
技术研发人员:熊承远李俊杰陈闽川王少军
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1