一种评价语音音素正确性的方法、装置、设备及存储介质制造方法及图纸

技术编号：21895751 阅读：26 留言：0更新日期：2019-08-17 16:02

本发明专利技术公开了一种评价语音音素正确性的方法，通过获取针对预定文本录入的音频数据，该预定文本中至少包含一个目标音素；从音频数据中解析出目标音素对应的实际发音数据；对实际发音数据的音素正确性指标进行评价，生成反映目标音素发音正误情况的反馈信息。本申请所提供的方法能够详细反馈音素级别发音的正误情况，帮助用户把握音素发音准确性，提高学习的效率，提升学习的效果。并且，采用本申请在练习发音时，用户不需要老师当面进行真人教学示范或纠正，因此克服了学习时间和空间的限制，用户可以随时随地进行相关的练习。此外，本申请还提供了一种具有上述技术效果的评价语音音素正确性的装置、设备以及计算机可读存储介质。

A Method, Device, Equipment and Storage Medium for Evaluating the Correctness of Phonemes

全部详细技术资料下载

【技术实现步骤摘要】
一种评价语音音素正确性的方法、装置、设备及存储介质
本专利技术涉及语音
，特别是涉及一种评价语音音素正确性的方法、装置、设备以及计算机可读存储介质。
技术介绍
随着科学技术的发展，基于互联网的语言学习应用也得到了快速的发展。在一些语言学习应用中，应用提供商通过互联网将学习材料发送到客户端，用户经由客户端获取学习材料，进行对应的学习。对于语言学习，除了学习语法和词汇之外，发音能力是其中最重要的能力之一。通常情况下，用户会通过朗读、跟读等方式来提升自身的发音能力。然而，多数情况下用户无法得知自身发音是否准确。现有的方案为对练习的语音进行评价时，通常都是对单个音标或者整个单词、句子进行打分，用户仅能得到针对整个单词、句子的笼统的评价信息，并不能够获知在单词和句子场景下单个音素发音是否准确的信息，导致学习针对性差、学习效率不高、效果较差的问题。
技术实现思路
本专利技术的目的是提供一种评价语音音素正确性的方法、装置、设备以及计算机可读存储介质，以解决现有方案学习效率较低、学习效果较差的问题。为解决上述技术问题，本专利技术提供一种评价语音音素正确性的方法，包括：获取针对预定文本录入的音频数据，所述预定文本中至少包含一个目标音素；从所述音频数据中解析出所述目标音素对应的实际发音数据；对所述实际发音数据的音素正确性指标进行评价，生成反映所述目标音素发音正误情况的反馈信息。可选地，所述从所述音频数据中解析出所述目标音素对应的实际发音数据包括：通过强制切分对齐匹配出所述目标音素在所述音频数据中的开始结束位置，从对应位置处提取出所述目标音素对应的实际发音数据。可选地，所述对...

【技术保护点】
1.一种评价语音音素正确性的方法，其特征在于，包括：获取针对预定文本录入的音频数据，所述预定文本中至少包含一个目标音素；从所述音频数据中解析出所述目标音素对应的实际发音数据；对所述实际发音数据的音素正确性指标进行评价，生成反映所述目标音素发音正误情况的反馈信息。

【技术特征摘要】
1.一种评价语音音素正确性的方法，其特征在于，包括：获取针对预定文本录入的音频数据，所述预定文本中至少包含一个目标音素；从所述音频数据中解析出所述目标音素对应的实际发音数据；对所述实际发音数据的音素正确性指标进行评价，生成反映所述目标音素发音正误情况的反馈信息。2.如权利要求1所述的评价语音音素正确性的方法，其特征在于，所述从所述音频数据中解析出所述目标音素对应的实际发音数据包括：通过强制切分对齐匹配出所述目标音素在所述音频数据中的开始结束位置，从对应位置处提取出所述目标音素对应的实际发音数据。3.如权利要求1或2所述的评价语音音素正确性的方法，其特征在于，所述对所述实际发音数据的音素正确性指标进行评价，生成反映所述目标音素发音正误情况的反馈信息包括：计算所述目标音素对应的实际发音数据的后验概率评价指标；计算所述目标音素对应的实际发音数据的时长评价指标；将所述后验概率评价指标以及所述时长评价指标输入至预先建立的评价模型中，得到所述实际发音数据的音素正确性指标；将所述音素正确性指标与预设阈值比较，当所述音素正确性指标高于所述预设阈值时，生成所述目标音素发音为正确的反馈信息；否则，生成所述目标音素发音为错误的反馈信息。4.如权利要求3所述的评价语音音素正确性的方法，其特征在于，所述计算所述目标音素对应的实际发音数据的后验概率评价指标包括：计算所述音频数据中每一个音素的似然度得分；将所述目标音素对应的实际发音数据的似然度得分除以所有音素的似然度得分，得到所述目标音素对应的实际发音数据的后验概率评价指标。5.如权利要求4所述的评价语音音素正确性的方法，其特征在于，所述计算所述目标音素对应的实际发音数据的时长评价指标包括：预先在标准发音数据上统计每一个音素的音素时长，通过高斯模型建立表征音素时长与时长评价指标的对应关...

【专利技术属性】
技术研发人员：刘晨晨，沈欣尧，余津锐，杨晓飞，蒋成林，梁球斌，高前勇，刘扬，唐义哲，
申请(专利权)人：上海流利说信息技术有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人