一种语音分析方法、装置及存储介质制造方法及图纸

技术编号：20972404 阅读：55 留言：0更新日期：2019-04-29 17:48

本发明专利技术实施例公开了一种语音分析方法、装置及存储介质；本发明专利技术实施例接收语音分析请求，该语音分析请求携带待分析语音；获取该待分析语音对应的预设文本以及该预设文本对应的参考语音；然后根据预设文本，获取待分析语音的第一音素，并生成第一音素概率；根据预设文本，获取参考语音的第二音素，并生成第二音素概率；最后将第一音素概率和第二音素概率进行对比，生成音素相似度，并且根据音素相似度，生成待分析语音和参考语音的语音相似度；该方案能够提高对语音的发音质量进行分析的效率以及准确率。

A Speech Analysis Method, Device and Storage Media

The embodiment of the present invention discloses a voice analysis method, device and storage medium; the embodiment of the present invention receives a voice analysis request, which carries the voice to be analyzed; obtains the preset text corresponding to the voice to be analyzed and the reference voice corresponding to the preset text; and then obtains the first phoneme of the voice to be analyzed according to the preset text, and generates the first phoneme outline. Rate; Obtain the second phoneme of the reference speech according to the preset text, and generate the second phoneme probability; Finally, compare the first phoneme probability and the second phoneme probability to generate the phoneme similarity, and according to the phoneme similarity, generate the phoneme similarity of the speech to be analyzed and the reference speech; This scheme can improve the efficiency and accuracy of the analysis of the pronunciation quality of the speech. \u3002

全部详细技术资料下载

【技术实现步骤摘要】
一种语音分析方法、装置及存储介质
本专利技术涉及通信
，具体涉及一种语音分析方法、装置及存储介质。
技术介绍
随着智能移动终端(简称移动终端)的普及，人们越来越多地利用移动终端学习语言，例如英文、日文、韩文、中文、以及德文等等。具体的，比如用户可以利用移动终端学习音标、单词、句子、或者段落等的发音。为了更好地对评估用户的发音质量，例如用户的发音是否标准等，需要对用户的发音质量进行分析。在现有技术中，通常将用户输入的语音转换成文本，然后计算该文本与预设文本的相似度，通过基于文本的相似度对用户的发音质量进行分析。或者，计算用户输入的语音与参考语音的音频波形的相似度，通过基于音频波形的相似度对用户的发音质量进行分析。在对现有技术的研究和实践过程中，本专利技术的专利技术人发现，在现有方案中，基本文本或者音频波形的相似度对用户的发音质量进行分析，由于受到音频转换成文本的准确度、噪音(例如环境背景音、杂音或静音等)、或者语速等的影响，对发音质量进行分析的效率低且准确率低。
技术实现思路
本专利技术实施例提供一种语音分析方法、装置及存储介质，能够提高对语音的发音质量进行分析的...

【技术保护点】
1.一种语音分析方法，其特征在于，包括步骤：接收语音分析请求，所述语音分析请求携带待分析语音；获取所述待分析语音对应的预设文本以及所述预设文本对应的参考语音；根据所述预设文本，获取所述待分析语音的第一音素，并生成第一音素概率；根据所述预设文本，获取所述参考语音的第二音素，并生成第二音素概率；将根据所述第一音素概率和所述第二音素概率进行对比，生成音素相似度，并且根据所述音素相似度，生成所述待分析语音和所述参考语音的语音相似度。

【技术特征摘要】
1.一种语音分析方法，其特征在于，包括步骤：接收语音分析请求，所述语音分析请求携带待分析语音；获取所述待分析语音对应的预设文本以及所述预设文本对应的参考语音；根据所述预设文本，获取所述待分析语音的第一音素，并生成第一音素概率；根据所述预设文本，获取所述参考语音的第二音素，并生成第二音素概率；将根据所述第一音素概率和所述第二音素概率进行对比，生成音素相似度，并且根据所述音素相似度，生成所述待分析语音和所述参考语音的语音相似度。2.根据权利要求1所述的语音分析方法，其特征在于，所述根据所述预设文本，获取所述待分析语音的第一音素，并生成第一音素概率的步骤，包括：基于所述预设文本对应的目标声学模型，将所述待分析语音和所述预设文本进行强制对齐，生成第一强制对齐结果；根据所述第一强制对齐结果，获取所述待分析语音的第一音素、以及所述第一音素对应的第一音素状态；根据第一预设公式、所述第一音素对应的音素声学模型以及所述第一音素状态，生成所述第一音素概率。3.根据权利要求1所述的语音分析方法，其特征在于，所述根据所述预设文本，获取所述参考语音的第二音素，并生成第二音素概率的步骤，包括：基于所述预设文本对应的目标声学模型，将所述参考语音和所述预设文本进行强制对齐，生成第二强制对齐结果；根据所述第二强制对齐结果，获取所述参考语音的第二音素、以及所述第二音素对应的第二音素状态和第二语音帧；根据第二预设公式、所述第二音素对应的音素声学模型、所述第二音素状态以及所述第二语音帧，生成所述第二音素概率。4.根据权利要求1至3任一项所述的语音分析方法，其特征在于，所述将根据所述第一音素概率和所述第二音素概率进行对比，生成音素相似度的步骤，包括：按照第三预设公式对所述第一音素概率和所述第二音素概率进行对比，生成音素相似度。5.根据权利要求1至3任一项所述的语音分析方法，其特征在于，所述根据所述音素相似度，生成所述待分析语音和所述参考语音的语音相似度，包括：获取每一音素相似度的预设权重；根据所述音素相似度以及对应的预设权重，生成所述待分析语音和所述参考语音的语音相似度。6.一种语音分析装置，其特征在于，包括：接收单元，用于接收...

【专利技术属性】
技术研发人员：李力振，王万龙，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人