当前位置: 首页 > 专利查询>曾雅梅专利>正文

复数字词学习机的语音评测装置及其评测与连续语音图像化方法制造方法及图纸

技术编号:16301328 阅读:20 留言:0更新日期:2017-09-26 19:25
本发明专利技术提供一种复数字词学习机的语音评测装置及其评测与连续语音图像化方法,其主要是通过将学习者朗读出复数字词形成的连续字词学习者曲线与原先建立于数据中的连续字词基准曲线进行比对,以对使用者在连续字词的发音与学习上进行评测以及重复学习的目的,依序执行的开启评量模式步骤、选择评量字词步骤、图像化步骤、录音步骤、抽取基频步骤、定义分析点步骤、转换曲线步骤、简化曲线步骤以及重复步骤,以形成连续字词学习者曲线,再进行评测步骤,以达成提供一种能够通过视觉辅助口语学习及帮助听障患者针对复数字词进行学习与复健的复数字词学习机的语音评测装置及其评测与连续语音图像化方法的目的。

Voice evaluation device of complex word learning machine and evaluation method thereof and continuous speech image method

The invention provides a plural word learning machine speech evaluation device and evaluation and continuous speech image method, which is mainly through the learners to read out complex digital words form continuous words learning curve compared with the reference data to the original words of continuous curve, with repetitive learning to users in pronunciation and learning the words on the continuous evaluation and the purpose of order execution on assessment models and procedures, assessment procedures, choice of words image recording procedures, extraction steps, fundamental steps, definition analysis steps, steps, simplified conversion curve curve step and repeat the steps to form a continuous word learning curve, and evaluation steps to provide a visual aid through oral English learning and help hearing-impaired patients in complex word learning and rehabilitation to achieve Voice evaluation device of complex word learning machine and its purpose of evaluating and continuous speech visualization.

【技术实现步骤摘要】
复数字词学习机的语音评测装置及其评测与连续语音图像化方法
本专利技术涉及一种语音验证技术,特别是涉及一种复数字词学习机的语音评测装置。本专利技术还涉及前述复数字词学习机的语音评测装置的评测与连续语音图像化方法。
技术介绍
现今社会科技发展迅速,医疗发达,许多听力受损的成人或儿童在复健时主要是通过助听器或植入电子耳等听觉辅具协助来恢复日常的生活水平或者进行复健,然而在听觉辅具的协助之下,患者对于中文独具的声调相关的频率感知仍常有不足的情况,是以急需一种能够配合听觉与视觉辅助的语言复健装置;且听障者对于单字发音的学习有极大的困难存在,尤其是口语化连续字词音的学习与复健更见不易,故急需一种合适的复健装置进行口语化连续字词音的学习与复健;又,于现今社会情势视之,在华人地区经贸及外交崛起的情况下,许多非中文为母语的外国人为打入中国市场纷纷积极学习中文。然而语言的学习并非一蹴而就,往往需要通过许多辅助的学习器具来增进学习效能。更甚之,语言的学习主要可分为听、说、读及写这四大部分,而其中应用最为广泛的部分又属于说的部分,是以需要一种除了听觉输入以外,并且能够通过视觉辅助口语学习的装置。而观察目前市面上常见的语言学习装置以及计算机软件接口,在学习与评测语音学习成果时多半是以单字为基础而设计的,但是这种单字学习形态对于实际口语化的沟通概念形成以词意为主的形态仍有差距,因为一般人说话的状态是呈连续发音的形态,而非单一字一字的发音再组合成词,然而一般只有单字数据库的装置,即会如此组合,因此单一字一字组合的音并非连续音,即一般俗称的机械发音,机械发音无论如何组合或美化调整,均无法达到真人一般的连续发音,而这种机械发音对使用者的学习,自难以发挥拟近真人的效果。因此连续音形态的拟真学习,非但未见于目前各式语言学习或评测的装置,甚至于未运用于语音辩识的系统中。因此学习后的实际运用上仍与一般母语用户在复数字词上的连续发音部份有所落差,故有重新设计的必要;一般市面上语音识别的技术应用大多局限于各种声控的应用装置、大楼门禁管制系统及无线通信装置等,多以个别单一字一字的音串接组合为主,缺乏连续字词发音的比对以及中文声调评测应用技术,为此需要一种能够利用复数字词连续音的声音验证技术达到辅助学习的复数字词学习机的语音评测装置及其评测与连续语音图像化方法。
技术实现思路
本专利技术提供一种能够通过视觉辅助口语学习及帮助听障患者复健的复数字词学习机的语音评测装置。本专利技术的另一目的是提供一种复数字词学习机的语音评测装置的评测与连续语音图像化方法。为达前述目的,本专利技术的复数字词学习机的语音评测装置,包括:一标准音数据库,包括至少一字词标准音文件以及对应该音文件的基准曲线图形,该字词标准音文件包括单字词标准音文件、双字词连续标准音文件及多字词连续标准音文件;双字词连续标准音文件及多字词连续标准音文件定义为复数字词连续标准音文件,而该复数字词连续标准音文件,是为该复数字词完整朗读的连续标准音文件与其所包含的各单字单独截断的单字音节标准音文件;各复数字词连续标准音文件分别形成对应的基准曲线,其中,复数字词连续标准音文件透过图形化步骤产生的对应连续音的各单字形成一单字音节基准曲线,并将该连续音的各单字音节基准曲线复合而成一复数字词连续基准曲线;一语音播放单元,供以播放该标准音数据库内的标准音文件以及学习者录制的学习者音文件;一中央处理系统,具有一中央处理单元连接前述的标准音数据库以及该语音播放单元,该中央处理单元并信息连接一播放接口、一音文件图像化单元及一显示单元,该中央处理单元另连接一语音接收单元及一学习者音数据库,并通过连接一评鉴单元对应该标准音数据库进行比对评鉴;该学习者音数据库与该评鉴单元同时连接该中央处理单元;该播放接口用以供用户自该标准音数据库或学习者音数据库选定欲学习或评鉴的字词音文件,通过该播放接口控制该语音播放单元播送所选的该字词音文件;该音文件图像化单元用以将用户或学习者发音的各字词学习者音文件转换成一对应该音文件的一学习者曲线,该播放接口于控制该语音播放单元播放该标准音数据库及该学习者音数据库内的字词音文件的同时亦将该标准音数据库、该学习者音数据库内的基准曲线与该学习者曲线同时显示;一语音接收单元,用以接收用户或学习者发出的声音,藉以建立学习者音数据库,将该接收单元接收到的声音形成学习者音文件,并经中央处理单元传送至该音文件图像化单元,藉由该音文件图像化单元将声音转换为该学习者曲线;该学习者音数据库包括:至少一字词学习者音文件以及对应该字词学习者音文件的该学习者曲线,该学习者音文件包括一复数字词连续学习者音文件,该复数字词连续学习者音文件包括复数字词完整朗读的一连续学习者音文件及各复数字词依各单独字截断的一单字音节学习者音文件,各该字词学习者音文件分别形成对应的一学习者曲线,各该复数字连续词学习者音文件产生的对应连续音的各单字形成一复数字词单字音节学习者曲线,复数该复数字词单字音节学习者曲线复合而成一复数字词连续学习者曲线;以及一评鉴单元,与该中央处理系统信息连接,该评鉴单元用以比对该基准曲线及该学习者曲线;学习者藉由操作该中央处理系统的该播放接口,以选出欲学习的字词音文件,由该语音播放单元播出该字词音文件,并由该显示单元显示出对应的标准音文件的基准曲线;另由该音文件图像化单元将学习者经由语音接收单元收录学习者的字词口语学习音文件转化成学习者口语的该字词对应的学习者曲线,由该显示单元显示该字词的基准曲线与学习者曲线,并经由该评鉴单元以该基准曲线为基准进行比对评分。为达前述目的,本专利技术字词学习机的语音评测装置的评测与连续语音图像化方法,包括:开启评量模式步骤,开启该中央处理系统,使该显示单元显示该播放接口;选择评量字词步骤,点选该播放接口自该标准音数据库选定欲评量的该复数字词连续标准音文件或各对应的复数字词单字音节标准音文件;播录音功能选择步骤,学习者可选择要进行播放步骤或录音步骤;录音步骤,若选择录音,则学习者对该语音接收单元说出欲评量的字词,让该语音接收单元接收学习者的声音形成学习者音文件,并将该音文件传送至该音文件图像化单元进行图像化步骤;该图像化步骤包括:一抽取基频步骤,一定义分析点步骤、一转换曲线步骤以及一简化曲线步骤;其中,该抽取基频步骤,藉由该音文件图像化单元针对学习者所说的字词进行选取,选取该字词中频率最稳定的区段,其中,单字词部份,是针对单字音文件中最稳定部份进行抽出,一般而言,是为该音文件的中段处,复数字词部份,则针对各单字中段处分别抽出该稳定区段的基频,以形成对应各单字的一单字音节学习者初始曲线,定义该单字音节学习者初始曲线的图形的横轴为一时间轴,纵轴为一频率轴;定义分析点步骤,定义该单字音节学习者初始曲线具有数分析点,其中,于该单字音节学习者初始曲线的两端点为一始点及一终点,并于该单字音节学习者初始曲线内选取最高的基频为一高点及选取最低的基频为一低点;转换曲线步骤,依序连接四个该分析点以形成至少一相互连接的线段,定义各该线段分别为一初始比对音节;简化曲线步骤,比较该初始比对音节的时间及该单字音节学习者初始曲线的时间,当该初始比对音节于该时间轴的长度不足该单字音节学习者初始曲线于该时间轴的长度的30%的,视为不本文档来自技高网
...
复数字词学习机的语音评测装置及其评测与连续语音图像化方法

【技术保护点】
一种复数字词学习机的语音评测装置,其特征在于,包括:一标准音数据库,包括至少一字词标准音文件以及对应所述字词标准音文件的一基准曲线,所述字词标准音文件包括一复数字词连续标准音文件,所述复数字词连续标准音文件为该复数字词完整朗读的连续标准音文件及其包含的各单字单独截断的单字音节标准音文件,各该字词标准音文件分别形成对应的一基准曲线,该复数字词标准音文件产生的对应连续音的各单字形成一单字音节基准曲线,复数该单字音节基准曲线复合形成一复数字词连续基准曲线;一语音播放单元,供以播放所述标准音数据库内的字词音文件;一中央处理系统,具有一中央处理单元,所述中央处理单元连接所述标准音数据库以及所述语音播放单元,所述中央处理单元并信息连接一播放接口、一音文件图像化单元、一显示单元,所述中央处理单元另连接一语音接收单元、一学习者音数据库及一评鉴单元,并通过所述评鉴单元对应所述标准音数据库进行比对评鉴;所述播放接口用以供用户自所述标准音数据库或学习者音数据库选定欲学习或评鉴的字词音文件,藉所述播放接口控制该语音播放单元播送所选的该字词音文件;所述音文件图像化单元用以将用户或学习者发音的各字词学习者音文件转换成一对应该音文件的一学习者曲线,所述播放接口于控制该语音播放单元播放该标准音数据库及该学习者音数据库内的字词音文件的同时亦将该标准音数据库、该学习者音数据库内的基准曲线与该学习者曲线同时显示;一语音接收单元,所述语音接收单元用以接收用户或学习者发出的声音,并将该接收单元接收到的声音形成学习者音数据库中的学习者音文件并传送至该音文件图像化单元,藉由该音文件图像化单元将声音转换为该学习者曲线;以及所述学习者音数据库包括:至少一字词学习者音文件以及对应该字词学习者音文件的该学习者曲线,该学习者音文件包括一复数字词连续学习者音文件,该复数字词连续学习者音文件包括复数字词完整朗读的一连续学习者音文件及各复数字词依各单独字截断的一单字音节学习者音文件,各该字词学习者音文件分别形成对应的一学习者曲线,各该复数字连续词学习者音文件产生的对应连续音的各单字形成一复数字词单字音节学习者曲线,复数该复数字词单字音节学习者曲线复合而成一复数字词连续学习者曲线;所述评鉴单元,与该中央处理系统信息连接,该评鉴单元用以比对该基准曲线及该学习者曲线的斜率正负、转折时间与斜率偏差等参数进行计分;学习者通过操作该中央处理系统的该播放接口,以选出欲学习的字词标准音文件,由该语音播放单元播出该标准音文件,并由该显示单元显示出对应的该基准曲线;另藉该音文件图像化单元,将学习者经由该语音接收单元收录学习者的连续字词口语学习者音文件通过单字音节的转化再复合成复数字词的连续口语的该学习者曲线,并经由该评鉴单元以该基准曲线为基准进行比对评分,并显示于该显示单元。...

【技术特征摘要】
1.一种复数字词学习机的语音评测装置,其特征在于,包括:一标准音数据库,包括至少一字词标准音文件以及对应所述字词标准音文件的一基准曲线,所述字词标准音文件包括一复数字词连续标准音文件,所述复数字词连续标准音文件为该复数字词完整朗读的连续标准音文件及其包含的各单字单独截断的单字音节标准音文件,各该字词标准音文件分别形成对应的一基准曲线,该复数字词标准音文件产生的对应连续音的各单字形成一单字音节基准曲线,复数该单字音节基准曲线复合形成一复数字词连续基准曲线;一语音播放单元,供以播放所述标准音数据库内的字词音文件;一中央处理系统,具有一中央处理单元,所述中央处理单元连接所述标准音数据库以及所述语音播放单元,所述中央处理单元并信息连接一播放接口、一音文件图像化单元、一显示单元,所述中央处理单元另连接一语音接收单元、一学习者音数据库及一评鉴单元,并通过所述评鉴单元对应所述标准音数据库进行比对评鉴;所述播放接口用以供用户自所述标准音数据库或学习者音数据库选定欲学习或评鉴的字词音文件,藉所述播放接口控制该语音播放单元播送所选的该字词音文件;所述音文件图像化单元用以将用户或学习者发音的各字词学习者音文件转换成一对应该音文件的一学习者曲线,所述播放接口于控制该语音播放单元播放该标准音数据库及该学习者音数据库内的字词音文件的同时亦将该标准音数据库、该学习者音数据库内的基准曲线与该学习者曲线同时显示;一语音接收单元,所述语音接收单元用以接收用户或学习者发出的声音,并将该接收单元接收到的声音形成学习者音数据库中的学习者音文件并传送至该音文件图像化单元,藉由该音文件图像化单元将声音转换为该学习者曲线;以及所述学习者音数据库包括:至少一字词学习者音文件以及对应该字词学习者音文件的该学习者曲线,该学习者音文件包括一复数字词连续学习者音文件,该复数字词连续学习者音文件包括复数字词完整朗读的一连续学习者音文件及各复数字词依各单独字截断的一单字音节学习者音文件,各该字词学习者音文件分别形成对应的一学习者曲线,各该复数字连续词学习者音文件产生的对应连续音的各单字形成一复数字词单字音节学习者曲线,复数该复数字词单字音节学习者曲线复合而成一复数字词连续学习者曲线;所述评鉴单元,与该中央处理系统信息连接,该评鉴单元用以比对该基准曲线及该学习者曲线的斜率正负、转折时间与斜率偏差等参数进行计分;学习者通过操作该中央处理系统的该播放接口,以选出欲学习的字词标准音文件,由该语音播放单元播出该标准音文件,并由该显示单元显示出对应的该基准曲线;另藉该音文件图像化单元,将学习者经由该语音接收单元收录学习者的连续字词口语学习者音文件通过单字音节的转化再复合成复数字词的连续口语的该学习者曲线,并经由该评鉴单元以该基准曲线为基准进行比对评分,并显示于该显示单元。2.根据权利要求1所述的复数字词学习机的语音评测装置,其特征在于,所述标准音数据库的标准音文件包括一单字词标准音文件、一双字词连续标准音文件、一多字词连续标准音文件、一双字词单字音节标准音文件及一多字词单字音节标准音文件;定义该双字词连续标准音文件、该多字词连续标准音文件、该双字词单字音节标准音文件、该多字词单字音节标准音文件为一复数字词连续标准音文件;该单字音节基准曲线包括一双字词单字音节基准曲线以及一多字词单字音节基准曲线两部份;该复数字词连续基准曲线则包括一双字词连续基准曲线以及一多字词连续基准曲线两部份。3.根据权利要求1所述的复数字词学习机的语音评测装置,其特征在于,所述字词学习者音文件包括一单字词学习者音文件、一双字词连续学习者音文件、一多字词连续学习者音文件、一双字词单字音节学习者音文件及多字词单字音节学习者音文件;定义该双字词连续学习者音文件、该多字词连续学习者音文件、该双字词单字音节学习者音文件及该多字词单字音节学习者音文件为该复数字词连续学习者音文件;该复数字词单字音节学习者曲线包括一双字词单字音节学习者曲线及一多字词单字音节学习者曲线两部份;该复数字词连续学习者曲线则包括一双字词连续学习者曲线以及一多字词连续学习者曲线两部份。4.根据权利要求2所述的复数字词学习机的语音评测装置的评测方法,包括:开启学习模式步骤,开启该中央处理系统,使该显示单元显示该播放接口;选择学习字词步骤,点选该播放接口,自该标准音数据库选定欲学习的该复数字词标准音文件或各对应的复数字词单字音节标准音文件;以及播放步骤,通过该播放接口控制该语音播放单元播送欲学习的复数字词标准音文件或各对应的复数字词单字音节标准音文件。5.根据权利要求1所述的复数字词学习机的语音评测装置的评测方法,包括:开启评量模式步骤,开启该中央处理系统,使该显示单元显示该播放接口;选择评量字词步骤,点选该播放接口自该标准音数据库选定欲评量的该复数字词连续标准音文件或各对应的复数字词单字音节标准音文件;播录音功能选择步骤,学习者可选择要进行播放步骤或录音步骤;录音步骤,学习者对该语音接收单元说出欲评量的复数字词,让该语音接收单元接收用户的声音形成该复数字词连续学习者音文件以及各对应的复数字词单字音节学习者音文件形成该学习者音数据内容之一,并传送至该音文件图像化单元,进行图像化步骤以形成对应的该学习者曲线中的该复数字词单字音节学习者曲线以及该复数字词连续学习者曲线;图像化步骤,主要具有一抽取基频步骤、一定义分析点步骤、一转换曲线步骤以及一简化曲线步骤,所述图像化步骤可同时针对前述的标准音文件转化成该基准曲线的作业以及针对前述的学习者音文件转化成该学习者曲线的作业;所述抽取基频步骤,针对学习者所说的字词进行选取,选取各字词频率最稳定的区段,抽出该稳定区段的基频,以形成对应该复数字词的第一单字的一单字音节学习者初始曲线,定义该单字音节学习者初始曲线的图形的横轴为一时间轴,纵轴为一频率轴,由于此步骤为逐字判别,是以各个单字逐步完成前述的图像化步骤以形成该复数字词单字音节学习者曲线;所述定义分析点步骤,定义该单字音节学习者初始曲线具有若干分析点;所述转换曲线步骤,依序连接各该分析点以形成至少一相互连接的线段,定义各该线段分别为一初始比对音节,使该单字音节学习者初始曲线呈现由至少一初始比对音节构成的线形;所述简化曲线步骤,比较各该初始比对音节的时间长度及该单字音节学习者初始曲线的总时间长度,当该初始比对音节的时间长度不足该单字音节学习者初始曲线的总时间长度的30%的,视为不具代表性的该初始比对音节,将该不具代表性的初始比对音节与接邻的初始比对音节合并形成新的一合并比对音节,并将该合并比对音节与另一具有代表性的该初始比对音节连接成一直线形曲线形态的复数字词单字音节学习者曲线的双字词单字音节学习者曲线;一重复该图像化步骤,是重复该抽取基频步骤,该定义分析点步骤、该转换曲线步骤以及该简化曲线步骤,将其余单字依序转化为该复数字词单字音节学习者曲线,并将各该复数字词单字音节学习者曲线依序连接成该复数字词连续学习者曲线,并显示于该显示单元;评测步骤,撷取该复数字词单字音节基准曲线、该复数字词连续基准曲线,与经前述步骤形成的复数字词单字音节学习者曲线以及该复数字词连续学习者曲线进行比对,经比对后便形成复数比对参数,评测步骤可由单一比对参数或复数比对参数进行评测。6.根据权利要求5所述的数字词学习机的语音评测装置的评测方法,其特征在于,于该播录音功能选择步骤,学习者若选择播放功能,则由该播放接口控制该语音播放单元播送欲评量的字词连续标准音文件或各对应的复数字词单字音节标准音文件,供学习者连续发音的口语模拟学习。7.根据权利要求5所述的数字词学习机的语音评测装置的评测方法,其特征在于,所述定义分析点步骤是定义该单字音节学习者初始曲线两端点的分析点为一第一分析点及一第二分析点,并于该单字音节学习者初始曲线的基频中去除过高或过低的频率,形成一容差频段,于该单字音节学习者初始曲线的容差频段内选取最高与最低基频...

【专利技术属性】
技术研发人员:曾雅梅
申请(专利权)人:曾雅梅云丰科技有限公司
类型:发明
国别省市:中国台湾,71

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1