一种用于语音评测的自动命题系统与方法技术方案

技术编号:2836342 阅读:213 留言:1更新日期:2012-04-11 18:40
一种用于语音评测的自动命题系统与方法,能根据语音评测的命题要求制备具有随机性的考题;其系统包含有数据库、优选拼音集建立模块、待考词产生模块及命题模块;数据库包含有词库、拼音集、优选拼音集和待考词库,分别用于存储命题可用词、命题拼音需求、优选拼音和待考词;优选拼音集建立模块用于联合词库与拼音集新建优选拼音集;待考词产生模块用于联合词库与优选拼音集随机产生待考词更新待考词库、词库和拼音集;命题模块用于判断命题任务是否完成;其方法包含有步骤,首先建立优选拼音集,然后产生待考词并根据该待考词更新待考词库、词库和拼音集,最后判断命题任务是否完成,是则执行出题后清空待考词库,否则重复上述步骤。

【技术实现步骤摘要】

本专利技术涉及计算机自动命题技术,更具体地说,本专利技术涉及。
技术介绍
语音评测,是指评测被试语音与标准语音之间的语音学意义上的相似度,其中被试语音是被测试者口头朗读被评测内容的语音记录。被评测内容可以是被测试者的现场自由发挥,但一般都是一些事先规定的词和句子,也即语音评测用考题。语音评测的命题要求,例如普通话水平测试考试大纲,一般不仅限定语音评测用考题的选词范围,设定考题的拼音种类、数量、和分布等要求,同时还要求不同时间的考题不能重复,即命题具有随机性。传统的语音评测命题算法是,从词表中随机选词,或者用拼音随机组成词,然后检验该词及已经选出的词是否满足大纲要求,满足则保留作为语音评测用考题词,否则丢弃。该传统算法的缺点是,随着保留考题词的增多,待选语音音节的选择余地越来越小,这些音节在词表中很难组成词,组词的计算复杂度将指数形式剧增,经常是上千万次尝试却很难成功一次,而且成功与否完全取决于运气,算法本身并不能控制。
技术实现思路
本专利技术的目的是,针对上述传统语音评测用命题算法的缺点,提供一种自动命题系统与方法,它能根据语音评测的命题要求,自动制备具有随机性的语音评测用考题,在节约命题成本的同时提高命题成功率。为达到上述专利技术目的,本专利技术提供了一种用于语音评测的自动命题系统,用以在不同时间出具满足命题要求的、不重复的考题,包含有-数据库,其中,-词库,用于存储命题可用词,-拼音集,用于存储命题拼音需求,-优选拼音集,用于存储优选拼音,及-待考词库,用于存储待考词;-优选拼音建立模块,用于联合词库与拼音集新建优选拼音集;-待考词产生模块,用于联合词库与优选拼音集随机产生待考词并根据该待考词更新待考词库、词库和拼音集;及-命题模块,用于判断命题任务是否完成,也即判断待考词库中存储的待考词是否满足命题要求,是则执行出题后清空待考词库,否则继续命题。本专利技术还提供了一种用于语音评测的自动命题方法,用以在不同时间出具满足命题要求的、不重复的考题,其方法包含有步骤建立优选拼音集;随机产生待考词并根据该待考词更新待考词库、词库和拼音集;判断待考词库中存储的待考词是否满足命题要求,是则执行出题后清空待考词库,否则重复上述步骤。也就是说,本专利技术所揭示的系统包含有数据库、优选拼音集建立模块、待考词产生模块及命题模块;其中数据库包含有词库、拼音集、优选拼音集和待考词库,分别用于存储命题可用词、命题拼音需求、优选拼音和待考词;优选拼音集建立模块用于联合词库与拼音集新建优选拼音集;待考词产生模块用于联合词库与优选拼音集随机产生待考词并根据该待考词更新待考词库、词库和拼音集;命题模块用于判断命题任务是否完成;其方法包含有步骤,首先建立优选拼音集,然后产生待考词并根据该待考词更新待考词库、词库和拼音集,最后判断待考词库中存储的待考词是否满足命题要求,是则执行出题后清空待考词库,否则重复上述步骤。通过本专利技术所揭示的系统与方法,使用者可根据语音评测的命考试目的,轻松制备既符合命题要求又具有随机性的语音评测用考题,在词表包含20000词的情况下,每次命题所需时间只有数十秒;并且由于整个命题过程完全由算法本身控制,命题成功率一般都能达到100%。附图说明图1为本专利技术所揭示的用于语音评测的自动命题系统示意图;及图2为本专利技术所揭示的用于语音评测的自动命题方法流程图。其中,附图标记说明如下文档100-命题要求;200-数据库;210-词库;220-拼音集;230-优选拼音集;240-待考词库;模块300-优选拼音集建立模块;模块400-待考词产生模块;模块500-命题模块;步骤600-联合词库与拼音集新建优选拼音集;步骤610-计算拼音的词库子优先系数;步骤620-计算拼音的拼音集子优先系数;步骤630-计算拼音的优先系数;步骤640-将拼音按优先系数排序,选拼音中优先系数最高的前1/N新建优选拼音集;步骤700-联合词库与优选拼音集随机产生待考词,更新待考词库、词库和拼音集;步骤710-按优选拼音检索词库获得候选词;步骤720-随机选候选词的1/M作为待考词;步骤730-将待考词存入待考词库,同时删除词库中的该待考词,并减去拼音集中该待考词贡献的拼音需求;步骤800-判断命题任务是否完成,也就是判断待考词库中存储的待考词是否满足命题要求,是则执行步骤900,否则继续命题;步骤900-命题任务完成,执行出题后清空待考词库。具体实施例方式本专利技术为。首先,请参照图1,说明本专利技术所揭示的用于语音评测的自动命题系统示意图,包含有(a)文档命题要求100,用于规定考题拼音的种类、数量、分布和考题词的选择范围等要求。(b)数据库200,包含有I、词库210,用于存储命题可用词,是一个双音节词表,特别说明双音节词表是词表的一种。该词表可以按照拼音进行检索,比如按照a,可检索到大海(dahai)、分发(fenfa)等;并且该词表中包含的每个双音节词均带有拼音和音调属性字段。词库210的初始数据来源于命题要求100规定的考题词的选择范围。随着自动命题系统的运行,词库210中存储的数据将不断减少。这是因为在自动命题系统运行过程中,每产生一次新的待考词,就需要删除词库210中的该待考词。II、拼音集220,用于存储命题拼音需求。每个拼音需求均带有拼音、拼音的需求数量、和拼音的优先系数等属性字段,其中,拼音的优先系数是拼音的词库子优先系数(也即拼音在词库210中的优先系数)与拼音的拼音集子优先系数(也即拼音在拼音集220中的优先系数)的加权和。拼音的词库子优先系数的计算规则是拼音在词库210中出现次数越少越优先,常用的计算方法是一个拼音的词库子优先系数等于1减该拼音在词库210中的出现频率;而拼音的拼音集子优先系数的计算规则是拼音在拼音集220中需求数量越多越优先,常用的计算方法是一个拼音的拼音集子优先系数等于该拼音在拼音集220中的需求比率。加权和计算中权重因子的取值为经验值,可视两个子优先系数谁更重要而定,一般采用最简单的取值是两个权重因子均等于1。这样,一个拼音的优先系数等于该拼音在拼音集220中的需求比率加1减该拼音在词库210中的出现频率。拼音集220中关于拼音和拼音的需求数量的初始数据来源于命题要求100规定的考题拼音的种类、数量和分布等要求。随着自动命题系统的运行,拼音集220中存储的数据将不断变化。这是因为在自动命题系统运行过程中,每产生一次新的待考词,在删除词库210中该待考词的同时还需要减去拼音集220中该待考词贡献的拼音需求;并且随着上述更新的进行,拼音集220中关于拼音的优先系数的数据也将发生变化。III、优选拼音集230,用于存储优选拼音,优选拼音是具有最高优先系数的拼音。优选拼音通过选取拼音集中优先系数最高的前1/N拼音产生,其中N为不小于1的整数。N的取值为经验值,需要视拼音集中不同拼音的个数而定,一般最常用的取值是N等于5。优选拼音集230的初始数据为空。随着自动命题系统的运行,优选拼音集230中存储的数据将不断重写。这是因为在自动命题系统运行过程中,每产生一次新的优选拼音,就将把原有的优选拼音覆盖掉,存储于同一个数据库优选拼音集230中。IV、待考词库240,与词库210一样也是一个可按照拼音进行检索的双音节词表,用于存储待考词。本文档来自技高网...

【技术保护点】
一种用于语音评测的自动命题系统,能够根据语音评测的命题要求在不同时间出具不重复的考题,其特征在于包含有:-数据库,包含有:-词库,用于存储命题可用词;一拼音集,用于存储命题拼音需求;一优选拼音集,用于存储优选 拼音;及一待考词库,用于存储待考词;一优选拼音建立模块,用于联合词库与拼音集新建优选拼音集;一待考词产生模块,用于联合词库与优选拼音集随机产生待考词,并根据该待考词更新待考词库、词库和拼音集;及一命题模块,用 于判断命题任务是否完成,也即待考词库中存储的待考词是否满足命题要求,是则执行出题后清空待考词库,否则继续命题。

【技术特征摘要】
1.一种用于语音评测的自动命题系统,能够根据语音评测的命题要求在不同时间出具不重复的考题,其特征在于包含有—数据库,包含有—词库,用于存储命题可用词;—拼音集,用于存储命题拼音需求;—优选拼音集,用于存储优选拼音;及—待考词库,用于存储待考词;—优选拼音建立模块,用于联合词库与拼音集新建优选拼音集;—待考词产生模块,用于联合词库与优选拼音集随机产生待考词,并根据该待考词更新待考词库、词库和拼音集;及—命题模块,用于判断命题任务是否完成,也即待考词库中存储的待考词是否满足命题要求,是则执行出题后清空待考词库,否则继续命题。2.如权利要求1所述的用于语音评测的自动命题系统,其特征在于所述词库和拼音集的初始数据由用户根据命题要求设定,所述待考词库的初始数据为空。3.如权利要求1、2所述的用于语音评测的自动命题系统,其特征在于所述词库和所述待考词库分别为一个可按照拼音进行检索的词表,所述命题可用词和所述待考词为相应词表中包含的词。4.如权利要求3所述的用于语音评测的自动命题系统,其特征在于所述词表中包含的词带有拼音和音调属性字段。5.如权利要求1所述的用于语音评测的自动命题系统,其特征在于所述命题拼音需求带有拼音、拼音的需求数量和拼音的优先系数等属性字段。6.如权利要求5所述的用于语音评测的自动命题系统,其特征在于所述优先系数是词库子优先系数和拼音集子优先系数的加权和。7.如权利要求6所述的用于语音评测的自动命题系统,其特征在于所述词库子优先系数是指拼音在词库中的优先系数,其计算规则是拼音在词库中出现次数越少越优先,其计算方法是一个...

【专利技术属性】
技术研发人员:于水源冯晓亮谢凌云
申请(专利权)人:中国传媒大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有1条评论
  • 来自[美国加利福尼亚州圣克拉拉县山景市谷歌公司] 2015年02月28日 13:50
    在现代哲学、数学、逻辑学、语言学中,命题是指一个判断(陈述)的语义(实际表达的概念),这个概念是可以被定义并观察的现象。命题不是指判断(陈述)本身,而是指所表达的语义。当相异判断(陈述)具有相同语义的时候,他们表达相同的命题。在数学中,一般把判断某一件事情的陈述句叫做命题。
    0
1