移动设备上的实时口语评价系统及方法技术方案

技术编号:11408081 阅读:66 留言:0更新日期:2015-05-06 07:24
本发明专利技术公开了一种移动设备上的实时口语评价系统及方法,系统包括:采集模块,用于采集待评价语音的语音数据;识别模块,用于将采集模块采集到的语音数据识别为文本数据;匹配模块,用于将识别模块识别得到的文本数据与语音样本库中语音样本的文本数据进行匹配,得到匹配结果;以及评价模块,用于根据预先定义的评价策略和匹配模块匹配得到的匹配结果,得到并输出待评价语音中至少一个字符或字符串的发音得分,和/或待评价语音的发音得分。通过将口语评价系统在移动设备上完成,不但减少了口语评价系统对网络的依赖,而且还能够给用户即时口语评价反馈,提高用户体验效果。

【技术实现步骤摘要】
移动设备上的实时口语评价系统及方法
本专利技术涉及计算机
,尤其涉及一种移动设备上的实时口语评价系统及方法。
技术介绍
现有的口语评价系统大都以计算机作为客户端,用户通过与计算机相连的麦克风录音,音频数据通过网络传到服务器端,并由在服务器端运行的算法进行评价,评价算法都是运行在计算资源(CPU资源、内存资源、存储资源)相对充足的服务器端的计算机上。随着移动设备的普及,用户开始从计算机客户端向移动设备客户端迁移。将评价系统的客户端移植到移动设备上大都采用了如下解决方案:由移动设备客户端搜集语音数据,通过网络将语音数据传到服务器,在服务器上运行的口语评价算法,并将评价结果经由网络传回到移动设备客户端。由于现有的方案依赖于网络连接,一方面,通过网络传输语音数据需要耗费流量,另一方面,移动设备不是在任何时候都有可靠的网络连接。以上两点都容易给口语评价系统带来负面的用户体验,而且,搭建和维护口语评价系统的服务器也会增加额外的成本。
技术实现思路
鉴于上述问题,提出了本专利技术,以便提供一种克服上述问题或者至少部分地解决上述问题的移动设备上的实时口语评价系统及方法,通过将口语评价系统在移动设备上完成,不但减少了口语评价系统对网络的依赖,即能够减少移动设备和服务器端的消息传输的流量损耗,而且还能够给用户即时口语评价反馈,从而实现何时何地都能使用该口语评价系统练习口语,提高用户体验效果。依据本专利技术的一个方面,提供了一种移动设备上的实时口语评价系统,其包括:采集模块,用于采集待评价语音的语音数据,待评价语音中包括至少一个字符的语音或字符串的语音;识别模块,用于将采集模块采集到的语音数据识别为文本数据;匹配模块,用于将识别模块识别得到的文本数据与语音样本库中语音样本的文本数据进行匹配,得到匹配结果;以及评价模块,用于根据预先定义的评价策略和所述匹配模块匹配得到的匹配结果,得到并输出待评价语音中至少一个字符或字符串的发音得分,和/或待评价语音的发音得分。可选地,系统还包括:显示模块,用于显示所述语音样本库中语音样本的文本数据;所述采集模块进一步用于采集用户按照所述显示模块显示的语音样本库中语音样本的文本数据输入的、作为待评价语音的语音数据。可选地,系统还包括:得分比较模块,用于将评价模块输出的待评价语音的发音得分,和/或所述待评价语音中至少一个字符或字符串的发音得分,与预先定义的发音得分阈值进行比较;标记模块,用于在所述待评价语音的发音得分低于预先定义的发音得分阈值的情况下,在所述显示模块显示的文本数据中标记出发音得分低于预先定义的发音得分阈值的文本数据;和/或,在待评价语音中字符或字符串的发音得分低于预先定义的发音得分阈值的情况下,在所述显示模块显示的文本数据中标记出发音得分低于预先定义的发音得分阈值的字符或字符串。可选地,匹配模块进一步用于根据LevenshteinDistance编辑距离算法,对所述识别模块识别得到的文本数据与语音样本库中语音样本的文本数据进行匹配计算,得到匹配结果。可选地,预先定义的评价策略为:在识别得到的文本数据与语音样本库中语音样本的文本数据匹配的情况下,将根据语音数据识别得到文本数据中字符或字符串的后验概率作为待评价语音中字符或字符串的发音得分;将待评价语音中所有字符或字符串的发音得分的平均分作为待评价语音的发音得分。可选地,系统还包括:存储模块,用于存储所述语音样本库,所述语音样本库中包括至少一个语音样本。依据本专利技术的另一个方面,还提供了一种终端设备上的实时口语评价方法,其包括:采集待评价语音的语音数据,所述待评价语音中包括至少一个字符的语音或字符串的语音;将采集到的所述语音数据识别为文本数据;将识别得到的文本数据与语音样本库中语音样本的文本数据进行匹配,得到匹配结果;以及根据预先定义的评价策略和所述匹配结果,得到并输出所述待评价语音中至少一个字符或字符串的发音得分,和/或所述待评价语音的发音得分。可选地,在所述采集待评价语音的语音数据的步骤之前,所述方法还包括:显示语音样本库中语音样本的文本数据;相应地,所述采集待评价语音的语音数据的步骤为:采集用户按照显示的语音样本库中语音样本的文本数据输入的、作为待评价语音的语音数据。可选地,方法还包括:将输出的所述待评价语音的发音得分,和/或所述待评价语音中的至少一个字符或字符串的发音得分,与预先定义的发音得分阈值进行比较;在所述待评价语音的发音得分低于预先定义的发音得分阈值的情况下,在显示的文本数据中标记出发音得分低于预先定义的发音得分阈值的文本数据;和/或,在待评价语音中的至少一个字符或字符串的发音得分低于预先定义的发音得分阈值的情况下,在显示的文本数据中标记出发音得分低于预先定义的发音得分阈值的字符或字符串。可选地,所述将识别得到的文本数据与语音样本库中语音样本的文本数据进行匹配,得到匹配结果的步骤为:根据LevenshteinDistance编辑距离算法,对识别得到的文本数据与语音样本库中语音样本的文本数据进行匹配计算,得到匹配结果。在本专利技术的实施例中,通过移动设备上的实时口语评价系统采集待评价语音的语音数据;然后将采集到的语音数据识别为文本数据;然后将识别得到的文本数据与语音样本库中语音样本的文本数据进行匹配,得到匹配结果;再根据预先定义的评价策略和匹配结果,得到并输出待评价语音的发音得分,和/或待评价语音中的至少一个字符或字符串的发音得分。通过将口语评价系统在移动设备的客户端上完成,不但减少了移动设备对网络的依赖,减少了移动设备和服务器端的消息传递的流量损耗,而且能够给用户即时口语评价反馈,从而达到何时何地都能使用该口语评价系统练习口语的效果。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示意性地示出了根据本专利技术的实施例的移动设备上的实时口语评价系统100的结构框图;以及图2示意性地示出了根据本专利技术的实施例的移动设备上的实时口语评价方法200的流程图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。应当理解,本领域技术人员能够设想出尽管没有在本说明书中明确描述或者记载、但是实现了本专利技术并且包含在本专利技术精神、原理与范围内的各种结构。本说明书中引述的所有例子与条件性语言都是出于说明和教本文档来自技高网...

【技术保护点】
一种移动设备上的实时口语评价系统(100),其包括:采集模块(110),用于采集待评价语音的语音数据,所述待评价语音中包括至少一个字符的语音或字符串的语音;识别模块(130),用于将所述采集模块(110)采集到的语音数据识别为文本数据;匹配模块(150),用于将所述识别模块(130)识别得到的文本数据与语音样本库中语音样本的文本数据进行匹配,得到匹配结果;以及评价模块(170),用于根据预先定义的评价策略和所述匹配模块(150)匹配得到的匹配结果,得到并输出所述待评价语音中至少一个字符或字符串的发音得分,和/或所述待评价语音的发音得分。

【技术特征摘要】
1.一种移动设备上的实时口语评价系统(100),其包括:
采集模块(110),用于采集待评价语音的语音数据,所述待评价语音中包括至少一个字符的语音或字符串的语音;
识别模块(130),用于采用定点运算方式,将所述采集模块(110)采集到的语音数据识别为文本数据;
匹配模块(150),用于将所述识别模块(130)识别得到的文本数据与语音样本库中语音样本的文本数据进行匹配,得到匹配结果;以及
评价模块(170),用于根据预先定义的评价策略和所述匹配模块(150)匹配得到的匹配结果,得到并输出所述待评价语音中至少一个字符或字符串的发音得分,和/或所述待评价语音的发音得分;
显示模块,用于显示所述语音样本库中语音样本的文本数据;
得分比较模块,用于将所述评价模块(170)输出的待评价语音的发音得分,和/或所述待评价语音中至少一个字符或字符串的发音得分,与预先定义的发音得分阈值进行比较;
标记模块,用于在所述待评价语音的发音得分低于预先定义的发音得分阈值的情况下,在所述显示模块显示的文本数据中标记出发音得分低于预先定义的发音得分阈值的文本数据;和/或,
在待评价语音中字符或字符串的发音得分低于预先定义的发音得分阈值的情况下,在所述显示模块显示的文本数据中标记出发音得分低于预先定义的发音得分阈值的字符或字符串。


2.根据权利要求1所述的系统,其特征在于,所述采集模块(110)进一步用于采集用户按照所述显示模块显示的语音样本库中语音样本的文本数据输入的、并作为待评价语音的语音数据。


3.根据权利要求1所述的系统,其特征在于,所述匹配模块(150)进一步用于根据LevenshteinDistance编辑距离算法,对所述识别模块(130)识别得到的文本数据与语音样本库中语音样本的文本数据进行匹配计算,得到匹配结果。


4.根据权利要求1~3任一所述系统,其特征在于,所述预先定义的评价策略为:在识别得到的文本数据与语音样本库中语音样本的文本数据匹配的情况下,将根据语音数据识别得到文本数据中字符或字符串的后验概率作为待评价语音中字符或字符串的发音得分;
将待评价语音中所有字符或字符串的发音得分的平均分作为待评价语音的发音得分。


5....

【专利技术属性】
技术研发人员:林晖胡哲人王翌
申请(专利权)人:语冠信息技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1