音素误标注的检测方法和装置制造方法及图纸

技术编号：20047516 阅读：38 留言：0更新日期：2019-01-09 05:00

本发明专利技术提供一种音素误标注的检测方法和装置，该方法包括：根据目标组合音素对应的目标语音、目标组合音素的音素标注结果、以及，预先设置的音素置信度模型，获取目标组合音素的音素标注结果的置信度，音素置信度模型用于表示目标语音、目标组合音素的音素标注结果、以及目标组合音素的音素标注结果的置信度的对应关系；在目标组合音素的音素标注结果的置信度小于置信度阈值时，确定目标组合音素为误标注音素。本发明专利技术采用预先设置的音素置信度模型，获取音素标注结果的置信度，进而可以快速、准确的获取误标注音素。

全部详细技术资料下载

【技术实现步骤摘要】
音素误标注的检测方法和装置
本专利技术涉及人工智能
，尤其涉及一种音素误标注的检测方法和装置。
技术介绍
目前主流的语音合成方法包括参数语音合成方法和波形拼接合成方法，采用这两种方法进行语音合成时，均需要精细的音素标注数据，音素标注的正确性将直接影响到最后合成语音的音质、表现力等，因此音素标注的正确性是衡量一个语音合成数据库质量的重要指标。现有技术中，标注人员先对已标注的音素进行检查，对错误的音素进行重新标注，再将重新标注后的音素数据返回检查。对于一个音素数据包，检查人员对其中30％的音素数据进行抽查，若该30％的音素数据的标注均正确，则确定该音素数据包中的所有的音素标注都正确。现有技术中对音素标注进行检查的方式需要人工进行，费时费力，且容易漏掉未被抽查到的音素数据中具有明显标注错误的音素，进而造成合成语音的质量差。
技术实现思路
本专利技术提供一种音素误标注的检测方法和装置，采用预先设置的音素置信度模型，获取音素标注结果的置信度，进而可以快速、准确的获取误标注音素。本专利技术的第一方面提供一种音素误标注的检测方法，包括：根据目标组合音素对应的目标语音、所述目标...

【技术保护点】
1.一种音素误标注的检测方法，其特征在于，包括：根据目标组合音素对应的目标语音、所述目标组合音素的音素标注结果、以及，预先设置的音素置信度模型，获取所述目标组合音素的音素标注结果的置信度，所述音素置信度模型用于表示所述目标语音、所述目标组合音素的音素标注结果、以及所述目标组合音素的音素标注结果的置信度的对应关系；在所述目标组合音素的音素标注结果的置信度小于置信度阈值时，确定所述目标组合音素为误标注音素。

【技术特征摘要】
1.一种音素误标注的检测方法，其特征在于，包括：根据目标组合音素对应的目标语音、所述目标组合音素的音素标注结果、以及，预先设置的音素置信度模型，获取所述目标组合音素的音素标注结果的置信度，所述音素置信度模型用于表示所述目标语音、所述目标组合音素的音素标注结果、以及所述目标组合音素的音素标注结果的置信度的对应关系；在所述目标组合音素的音素标注结果的置信度小于置信度阈值时，确定所述目标组合音素为误标注音素。2.根据权利要求1所述的方法，其特征在于，所述目标组合音素为多个，所述确定所述目标组合音素为误标注音素之前，还包括：根据每个所述目标组合音素的音素标注结果的置信度，获取置信度标准差和置信度均值；根据所述置信度标准差和所述置信度均值，获取所述置信度阈值。3.根据权利要求2所述的方法，其特征在于，所述根据所述置信度标准差和所述置信度均值，获取所述置信度阈值，包括：根据所述置信度标准差，获取三倍置信度标准差，所述三倍置信度标准差的为所述置信度标准差的三倍；将所述置信度均值与所述三倍置信度标准差的差值，确定为所述置信度阈值。4.根据权利要求3所述的方法，其特征在于，所述获取所述目标组合音素之前，还包括：根据语音合成数据库中所有的音素数据对应的多个组合音素对应的语音、每个所述组合音素的音素标注结果、以及每个所述组合音素的音素标注结果的置信度，训练获取所述音素置信度模型，一个所述音素数据包括至少一个音素序列。5.根据权利要求4所述的方法，其特征在于，所述...

【专利技术属性】
技术研发人员：孟君，廖晓玲，郝玉峰，
申请(专利权)人：北京海天瑞声科技股份有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人