【技术实现步骤摘要】
本申请涉及语音处理,特别涉及一种韵律标注方法及装置。
技术介绍
1、语音合成任务是将文本处理成语音信号的过程。为了得到具有较高自然度和可懂度的语音信号,通常结合声学和语言学相关知识对文本标注韵律信息,对提高语音信号的表现力至关重要。
2、在相关技术中,常用的韵律标注方法包括基于词边界规则的标注方法和基于文本韵律模型的标注方法。其中,基于词边界规则的标注方法主要是通过计算目标文本中词的边界,然后根据人工设定的规则进行韵律的标注,在处理过程中忽视了声学信息,使得文本和语音的表现一致性较差;基于文本韵律模型的标注方法主要依据声学和文本信息构建相应的学习模型,通过学习模型对文本数据的韵律进行标注,虽然该方法将声学和文本信息进行了结合,但是需要大量的人工标注信息,而且,随着语音合成任务的更新和场景变换,学习模型也需要进行相应的迭代更新,从而导致人工成本较高,且耗时相对较长。
技术实现思路
1、本申请提供一种韵律标注方法及装置、电子设备、存储介质,可以增加韵律标注对多种场景的适用性,提高韵
...【技术保护点】
1.一种韵律标注方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据至少一个分类器中的状态参数对所述语音进行处理,得到各个所述分类器对应的语音标注结果,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据各个所述韵律层级匹配的状态参数,构建各个所述韵律层级匹配的语音识别状态机,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据各个所述语音帧的活性语音概率,基于每个所述韵律层级匹配的语音识别状态机,得到各个所述语音帧针对每个所述韵律层级的语音识别状态,包括:
5.根据权利要求3或4所述
...【技术特征摘要】
1.一种韵律标注方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据至少一个分类器中的状态参数对所述语音进行处理,得到各个所述分类器对应的语音标注结果,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据各个所述韵律层级匹配的状态参数,构建各个所述韵律层级匹配的语音识别状态机,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据各个所述语音帧的活性语音概率,基于每个所述韵律层级匹配的语音识别状态机,得到各个所述语音帧针对每个所述韵律层级的语音识别状态,包括:
5.根据权利要求3或4所述的方法,其特征在于,所述语音识别状态包括非语音状态、进入语音状态、语音状态和退出语音状态,所述状态参数包括活性语音概率阈值以及至少一个语音识别状态的状态数阈值,所述转...
【专利技术属性】
技术研发人员:熊雪军,蒋宁,吴海英,夏粉,刘敏,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。