一种基于时域切片的汉语语音建模方法技术

技术编号：37391470 阅读：34 留言：0更新日期：2023-04-27 07:29

本发明专利技术提出一种基于时域切片的汉语语音建模方法，包括：采集采样人的样本语音；基于时域切片对样本语音进行切片处理，完成对特征和声调双模态切片信息的提取；将样本文本与样本语音进行双向验证；生成采样人的声纹特征语料，进入建模阶段。本发明专利技术既采用语音信息多模态抽样、也结合汉语语言学特点和汉字音素组合的规律，完成汉语语音建模，有利于汉语语音信号的分析和处理。号的分析和处理。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于时域切片的汉语语音建模方法

[0001]本专利技术涉及数字信号处理和汉语语言学双领域，更具体的说，涉及一种基于时域切片的汉语语音建模方法。

技术介绍

[0002]在通信领域，语音合成是一种越来越应用广泛的技术，其离不开语音信号的分析处理，尤其是针对汉语语音信号的分析处理。汉语语音信号是一种连续的随机信号，但在有限时段内，可视为短时周期信号。汉语语音信号的分析和处理路径大致分为两类，第一类：依托数字信号处理理论加以分析，在语音合成方向取得了明显效果。第二类：随着硬件性能提升，成本下降和人工神经网络等人工智能算法的不断成熟，基于大数据和人工智能的语音合成算法在合成效果方面展现出独特的优势。但是，无论是传统的数字信号处理在时域、频域的分析，还是大数据和人工智能算法对语音的加工，在其特定领域之外存在一定的局限性，使得语音合成的应用场景受限。

技术实现思路

[0003]本专利技术提出一种基于时域切片的汉语语音建模方法，既采用语音信息多模态抽样、也结合汉语语言学特点和汉字音素组合的规律，完成汉语语音建模，有利于汉...

【技术保护点】

【技术特征摘要】
1.一种基于时域切片的汉语语音建模方法，其特征在于，包括：S11、采集采样人的样本语音；S12、基于时域切片对样本语音进行切片处理，完成对特征和声调双模态切片信息的提取；S13、将样本文本与样本语音进行双向验证；S14、生成采样人的声纹特征语料，进入建模阶段。2.根据权利要求1所述的基于时域切片的汉语语音建模方法，其特征在于，步骤S12具体包括：将样本语音中的句子进行单字分段；每个单字统一处理为由一组若干音素；并行提取声调信号；每个音素分为若干状态音元；每个状态音元，由表示段内单个周期采样的复合波的...

【专利技术属性】
技术研发人员：吕昱峰，茅方明，单晓宇，
申请(专利权)人：天翼电信终端有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人