基于大模型的语音风格识别系统技术方案

技术编号:44162001 阅读:18 留言:0更新日期:2025-01-29 10:33
本申请涉及智能语音识别领域,其具体地公开了一种基于大模型的语音风格识别系统,其通过接收由麦克风采集的目标用户的语音输入信号,然后从中提取出梅尔频谱,并采用基于深度学习和大模型的信号分析和处理技术来对提取出的语音输入信号梅尔频谱图进行分块处理和多尺度语义编码,以此根据编码得到的各个上下文梅尔频谱局部编码特征之间的动力学特征聚合表示来智能地生成语音风格识别播报语音。通过该方式,系统能够确保复杂风格得到充分表征,并且能够更好地适应不同说话人在发音方式、语速、音调等方面的显著差异,提高泛化能力。

【技术实现步骤摘要】

本申请涉及智能语音识别领域,且更为具体地,涉及一种基于大模型的语音风格识别系统


技术介绍

1、随着智能设备和人机交互技术的发展,用户对个性化服务的需求日益增长。例如,在虚拟助手、智能客服、心理疗愈等领域,系统能够依据用户的个人偏好动态调整对话风格和语音播报方式变得尤为重要,这不仅提升了用户体验,也增强了人机交互的自然度和友好性。

2、传统的手工特征提取方法在语音风格识别中存在显著局限。具体来说,这些方法它依赖于预先定义的规则和特征集,这可能导致无法捕捉到所有细微特征,特别是那些对风格识别至关重要的非线性或隐含特征,如语调变化、情感色彩和发音习惯等,导致对复杂风格的表征不足。此外,不同说话人在发音方式、语速、音调等方面差异巨大,单一的手工特征集难以适应这种多样性,限制了系统的泛化能力。

3、因此,期望一种基于大模型的语音风格识别系统,其能够提升对细微特征的捕捉能力,并增强系统的适应性和泛化能力。


技术实现思路

1、为了解决上述技术问题,提出了本申请。

2、根据本申请的一个方本文档来自技高网...

【技术保护点】

1.一种基于大模型的语音风格识别系统,其特征在于,包括:语音信号采集模块,用于接收由麦克风采集的目标用户的语音输入信号;语音输入信号梅尔频谱提取模块,用于提取所述语音输入信号的梅尔频谱特征以得到语音输入信号梅尔频谱图;梅尔频谱特征分块编码模块,用于对所述语音输入信号梅尔频谱图进行分块处理和多尺度语义编码以得到上下文梅尔频谱局部编码特征的序列;梅尔频谱特征动力聚合模块,用于对所述上下文梅尔频谱局部编码特征的序列进行梅尔频谱局部特征动力学聚合以得到语音风格频谱特征显著聚合编码特征,其中,所述梅尔频谱特征动力聚合模块,包括:上下文梅尔频谱聚类单元,用于计算所述上下文梅尔频谱局部编码特征的序列的...

【技术特征摘要】

1.一种基于大模型的语音风格识别系统,其特征在于,包括:语音信号采集模块,用于接收由麦克风采集的目标用户的语音输入信号;语音输入信号梅尔频谱提取模块,用于提取所述语音输入信号的梅尔频谱特征以得到语音输入信号梅尔频谱图;梅尔频谱特征分块编码模块,用于对所述语音输入信号梅尔频谱图进行分块处理和多尺度语义编码以得到上下文梅尔频谱局部编码特征的序列;梅尔频谱特征动力聚合模块,用于对所述上下文梅尔频谱局部编码特征的序列进行梅尔频谱局部特征动力学聚合以得到语音风格频谱特征显著聚合编码特征,其中,所述梅尔频谱特征动力聚合模块,包括:上下文梅尔频谱聚类单元,用于计算所述上下文梅尔频谱局部编码特征的序列的上下文梅尔频谱伪锚定聚合中心;上下文梅尔频谱特征动力聚合单元,用于对所述上下文梅尔频谱局部编码特征的序列和所述上下文梅尔频谱伪锚定聚合中心进行特征显著聚合编码以得到所述语音风格频谱特征显著聚合编码特征;播报语音生成模块,用于基于所述语音风格频谱特征显著聚合编码特征,得到语音风格识别播报语音。

2.根据权利要求1所述的基于大模型的语音风格识别系统,其特征在于,所述梅尔频谱特征分块编码模块,包括:语音输入信号分块单元,用于对所述语音输入信号梅尔频谱图进行分块处理以得到语音输入信号梅尔频谱图图块的序列;梅尔频谱特征局部编码单元,用于将所述语音输入信号梅尔频谱图图块的序列进行梅尔频谱多尺度语义编码以得到上下文梅尔频谱局部编码特征向量的序列作为所述上下文梅尔频谱局部编码特征的序列。

3.根据权利要求2所述的基于大模型的语音风格识别系统,其特征在于,所述梅尔频谱特征局部编码单元,用于:将所述语音输入信号梅尔频谱图图块的序列输入包含卷积层和转换器结构的梅尔频谱多尺度语义编码器以得到所述上下文梅尔频谱局部编码特征向量的序列。

4.根据权利要求3所述的基于大模型的语音风格识别系统,其特征在于,所述上下文梅尔频谱聚类单元,包括:上下文梅尔频谱特征静态势能权重因子计算单元,用于计算所述上下文梅尔频谱局部编码特征向量的序列中的各个上下文梅尔频谱局部编码特征向量的静态势能权重因子以得到上下文梅尔频谱局部特征静态势能权重因子的序列;梅尔频谱特征权重加权...

【专利技术属性】
技术研发人员:赵俊翁芳胜潘法昱
申请(专利权)人:西湖心辰杭州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1