一种可实时反馈用户朗读进度的语音跟踪方法技术

技术编号：8563600 阅读：236 留言：0更新日期：2013-04-11 05:30

一种可实时反馈用户朗读进度的语音跟踪方法，（1）输入待跟踪的文本；（2）根据所述文本搭建跟踪解码网络，并将跟踪解码网络、声学模型传给解码器；（3）实时提取声学特征序列，并实时传递给解码器；（4）解码器实时判断用户朗读的进度，同时检测用户是否朗读了文本外的内容；（5）实时显示跟踪进度。本发明专利技术解决了用户不按正常顺序朗读而无法正常跟踪的问题，提高了系统的抗环境噪音干扰能力，使语音朗读跟踪功能真正达到实用的水平。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种连续语音识别跟踪方法。本专利技术可实现在用户朗读固定文本时，实时获知用户朗读的文本内容，从而实现自动跟踪用户朗读文本的功能。
技术介绍
传统的口语评测和学习全部依赖于人，随着语音识别技术的发展和成熟，智能语音评测技术孕育而生，机器逐渐替代人进行口语评测和学习。智能语音评测技术涉及的知识领域包括语音技术、自然语言理解、人工智能、数据挖掘、机器学习等多学科知识，通过此技术可实现对发音人的口语水平进行评估，并根据评估结果指导发音人进行学习。例如一百易公司的互联网学习系统包含的英文句子评分功能，科大讯飞公司的畅言网包含的中文字词句的评分和音素检错功能以及英文文章的评分功能，目前的这些学习系统均能在朗读完成后给出反馈，但是在朗读过程中是没有交互的。在学习者进行口语练习的过程中，增加一些人机交互的过程会提高用户体验，增强学习者的兴趣。例如在用户朗读短文时，机器根据用户朗读内容实时高亮显示朗读文本的位置。传统的实现方法只对用户按文本顺序正常朗读的情况适用，而对用户不按文本顺序朗读或存在环境噪音干扰时，传统的实现方法无法正常进行朗读跟踪。本专利技术中介绍的方案...

【技术保护点】
一种可实时反馈用户朗读进度的语音跟踪方法，其特征在于实现步骤如下：（1）输入待跟踪的文本，并进行文本处理；（2）根据所述文本搭建跟踪解码网络，并将跟踪解码网络、声学模型传给解码器；所述声学模型是语音识别的基础数学模型，模型单元是基础数学模型的组成部分，可以是音素、音节或字；（3）实时提取声学特征序列，所述声学特征序列是指声学特征中多个单元，每一个单元称为一帧，并实时传递给解码器；所述声学特征是描述短时语音本质特征的一组值；（4）解码器基于步骤（3）中输入的声学特征序列，在跟踪解码网络中对所有可能的网络路径进行搜索，每隔一定时间检查当前的搜索路径，并找出当前概率最优路径，基于此最优路径判断用户朗...

【技术特征摘要】
1.一种可实时反馈用户朗读进度的语音跟踪方法，其特征在于实现步骤如下 (1)输入待跟踪的文本，并进行文本处理； (2)根据所述文本搭建跟踪解码网络，并将跟踪解码网络、声学模型传给解码器；所述声学模型是语音识别的基础数学模型，模型单元是基础数学模型的组成部分，可以是音素、音节或字； (3)实时提取声学特征序列，所述声学特征序列是指声学特征中多个单元，每一个单元称为一帧，并实时传递给解码器；所述声学特征是描述短时语音本质特征的一组值； (4)解码器基于步骤(3)中输入的声学特征序列，在跟踪解码网络中对所有可能的网络路径进行搜索，每隔一定时间检查当前的搜索路径，并找出当前概率最优路径，基于此最优路径判断用户朗读进度，获取当前朗读内容在文本中的位置和状态；同时结合最大路径中发音单元的概率信息检测用户是否朗读了文本外的内容； (5)根据步骤(4)中反馈的当前朗读内容在文本中的位置和状态，实时显示跟踪进度；所述步骤(2)中搭建跟踪解码网络的过程如下 (21)获取文本处理步骤中得到的朗读文本模型单元序列，所述模型单元序列是指多个模型单元按顺序排列在一起称为模型单元序列； (22)计算节点和连接弧的数目，分配内存，即根据模型单元序列个数计算跟踪解码网络中的空节点、朗读文本模型单元节点、无关语音模型单元节点及连接弧个数，并为这些节点和弧分配存储单元； (23)构造无关语音吸收网络，即将无关语音吸收网络中的关联节点用弧进行连接； (24)将朗读文本模型单元节点、空节点、无关语音吸收网络通过弧连接...

【专利技术属性】
技术研发人员：潘颂声，赵乾，吴玲，何春江，王兵，朱群，
申请(专利权)人：安徽科大讯飞信息科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人