【技术实现步骤摘要】
本专利技术涉及人工智能和金融科技领域,尤其涉及一种音频数据标注方法、装置、设备及存储介质。
技术介绍
1、随着金融科技的不断发展,语音技术在金融服务中的应用日益广泛,包括智能客服、语音身份认证、自动化交易指令等。现有的语音识别和合成技术能够处理基础的语音任务,但在应对多样化音频数据时,存在明显的不足。
2、现有的语音识别和合成系统虽然能够识别标准语言的发音,但在处理不同地域用户的口音时,准确性和自然性明显下降。由于口音具有离散和连续两种特性,传统的离散标签标注方法难以全面、准确地反映出不同口音的特征,导致语音识别的效果差异较大,特别是在金融场景中,不同用户的口音差异可能会影响服务的质量。
3、同时,现有技术难以有效标注音频数据中的多种特征,如音高、语速等特征。这些特征对语音识别和合成具有重要影响,但由于现有系统缺乏对这些细节特征的精细化处理能力,导致在某些复杂场景下语音处理的效果不理想,不能满足金融领域对高精度语音处理的需求。
技术实现思路
1、本专利技术的主要目的
...【技术保护点】
1.一种音频数据标注方法,其特征在于,包括以下步骤:
2.如权利要求1所述的音频数据标注方法,其特征在于,将说话速度属性、信噪比属性、早晚期反射比值属性、说话者平均音高属性和音高标准差属性映射为对应预设的离散类别名称,将所述预设的离散类别名称分别作为对应属性的关键字,包括:
3.如权利要求1所述的音频数据标注方法,其特征在于,分析所述音频数据的音频质量,获取信噪比属性,包括:
4.如权利要求1中所述的音频数据标注方法,其特征在于,分析所述音频数据的音频质量,获取早晚期反射比值属性,包括:
5.如权利要求1所述的音频数据标
...【技术特征摘要】
1.一种音频数据标注方法,其特征在于,包括以下步骤:
2.如权利要求1所述的音频数据标注方法,其特征在于,将说话速度属性、信噪比属性、早晚期反射比值属性、说话者平均音高属性和音高标准差属性映射为对应预设的离散类别名称,将所述预设的离散类别名称分别作为对应属性的关键字,包括:
3.如权利要求1所述的音频数据标注方法,其特征在于,分析所述音频数据的音频质量,获取信噪比属性,包括:
4.如权利要求1中所述的音频数据标注方法,其特征在于,分析所述音频数据的音频质量,获取早晚期反射比值属性,包括:
5.如权利要求1所述的音频数据标注方法,其特征在于,分析所述音频数据的音高特征,获取说话者平均音高属性和音高标准差属性,包括:
6.如权利要求1所述的音频数据标...
【专利技术属性】
技术研发人员:熊承远,李俊杰,陈闽川,王少军,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。