【技术实现步骤摘要】
一种资源受限语种语音合成前端文本分析方法及系统
本专利技术涉及语音合成
,特别涉及一种资源受限语种语音合成前端文本分析方法及系统。
技术介绍
目前,针对资源受限语种(例如中国国内方言),语音合成前端文本分析一般有两种方法:其中一种方法是根据专家知识定义标签种类,人工制作大量的带标签的目标域数据,然后输入到设计好的神经网络中训练参数,这种方法存在数据分布的均衡性问题,以及数据标注的正确性、一致性、安全性、时效性等问题;另一种方法是利用迁移学习的方法,已知资源丰富语种(中文普通话)的神经网络A,新建资源受限语种的神经网络B,利用网络A中的局部特征(参数)和少量带标签的目标域数据,即资源受限语种的数据,对网络B中的参数进行训练;或利用少量带标签的目标域数据直接在网络A上进行微调,进而得到资源受限语种的神经网络,这种方法在更符合实际场景的开放数据集合之间效果非常差;没有充分利用目标域数据和源域数据(即资源丰富语种)之间的特征相关性;利用少量带标签的目标域数据去微调参数巨大的神经网络往往很难实施。为了解决资源受限语种语音 ...
【技术保护点】
1.一种资源受限语种语音合成前端文本分析方法,其特征在于,所述方法执行以下步骤:/n步骤1:获取训练数据,所述训练数据包括源域数据、带标签的目标域数据和不带标签的目标域数据,其中所述源域数据包括资源丰富语种对应的文本数据,所述目标域数据包括资源受限语种对应的文本数据;/n步骤2:基于混合数据和所述不带标签的目标域数据,对神经网络结构进行训练,其中,所述混合数据包括带标签的所述源域数据和所述带标签的目标域数据;/n步骤3:利用训练好的所述神经网络结构,对资源受限语种进行语音合成前端文本分析。/n
【技术特征摘要】
1.一种资源受限语种语音合成前端文本分析方法,其特征在于,所述方法执行以下步骤:
步骤1:获取训练数据,所述训练数据包括源域数据、带标签的目标域数据和不带标签的目标域数据,其中所述源域数据包括资源丰富语种对应的文本数据,所述目标域数据包括资源受限语种对应的文本数据;
步骤2:基于混合数据和所述不带标签的目标域数据,对神经网络结构进行训练,其中,所述混合数据包括带标签的所述源域数据和所述带标签的目标域数据;
步骤3:利用训练好的所述神经网络结构,对资源受限语种进行语音合成前端文本分析。
2.如权利要求1所述的方法,其特征在于,在所述步骤1中,所述源域数据在所述训练数据中的比例为55%-65%,所述带标签的目标域数据在所述训练数据中的比例为8%-12%,所述不带标签的目标域数据在所述训练数据中的比例为27%-33%。
3.如权利要求1所述的方法,其特征在于,在所述步骤2中,所述神经网络结构包括特征提取器和分类器,其中所述分类器紧跟在所述特征提取器之后。
4.如权利要求3所述的方法,其特征在于,所述特征提取器包括采用transformer的编码器。
5.如权利要求3所述的方法,其特征在于,所述分类器包括全连接层、softmax层和CRF层。
6.如权利要求3所述的方法,其特征在于,所述步骤2:基于混合数据和所述不带标签的目标域数据,对神经网络结构进行训练,执行以下步骤:
步骤S21:在所述神经网络结构中输入所述混合数据,以对所述神经网络结构进行监督式学习,并同步更新所述特征提取器和所述分类器的网络参数;
步骤S22:在所述神经网络结构中同时输入所述混合数据和所述不带标签的目标域数据,以对所述神经网络结构进行半监督式学习,并只更新所述分类器的网络参数。
7.如权利要求6所述的方法,其特征在于,在所述步骤S21中,在所述神经网络结构中输入所述混合数据时,经所...
【专利技术属性】
技术研发人员:吴朗,
申请(专利权)人:云知声智能科技股份有限公司,厦门云知芯智能科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。