一种语句分析处理方法及系统技术方案

技术编号:25189168 阅读:32 留言:0更新日期:2020-08-07 21:15
本发明专利技术公开了一种语句分析处理的方法及系统,所述方法包括:对进行练习语句进行韵律层级分析,确定各个语句中各个韵律组块的组块时间边界,对练习语句设置语调标记;对练习语句设置重读标记;将确定的组块时间边界、语调标记以及重读标记的练习语句作为标准韵律层级语句。通过本发明专利技术所提供的方法,对输入的语句的文本进行韵律层级分析,从而将一个整句的线性单词序列转换成一个韵律层级结构,从而使用户学习和掌握对文本进行韵律结构分析的方法以及在发音中使用。通过该方法还可以使用户在语句朗读时,掌握语调以及重读的使用。

【技术实现步骤摘要】
一种语句分析处理方法及系统
本申请涉及数据分析
,尤其涉及一种语句分析处理方法及系统。
技术介绍
朗读是语言学习中的一个重要的学习方法:朗读可以提升学习者的发音的准确性和流利度,也能提高学习者对句子乃至篇章的理解能力,从而加强对重读、语调等韵律特征的正确使用。在朗读中,学习者可能会出现下面的错误或不当:单词的发音错误或不适当(包括元音、辅音、音节边界、重读、连读、省读等),词内及词间的不流利(包括不合适的时长和停顿),缺乏音高能力等韵律变化(重读的遗漏或者误用)、缺乏正确地进行语法语义相关的语调变化(例如句末的声调或者降调)、不能正确地理解语句并通过短语(Phrasing)来控制语音输出的节奏。目前,较为传统的方案通过如下两种方式来练习朗读:方式一:有声字典独立电子辞典设备、或者桌面软件、运行于移动设备中的软件(包括微信小程序、网页等)。在用户查询单词后,有声字典提供该词的传统释义,同时提供该词的可以播放的发音音频(真人录音或者计算机合成语言)。学习者通过播放该音频,了解该单词的发音,并可能进行口头模仿。有声字典也可能提供若干与单词相关的例句,这些例句也同样可能带有可以播放的音频。方式二:有声读物可以是独立发行的音频文件(mp3等)、图书的配套光盘、早期的录音磁带,也可以是某个内容平台上的节目形式:例如PodCast、喜马拉雅FM、微信公众号等等。学习者使用有声读物的方式通常为“听”。学习者当然也可以自行进行模仿。方式三:发音评测软件包括运行于桌面系统的软件、运行于移动设备中的软件(移动应用、微信小程序、网页程序等)、其他运行了操作系统的智能设备(智能电视、智能音箱等)。此类软件通常提供示范音频,将学习者朗读语音与示范语音进行比对,产生一个整体打分,一般也提供包括发音准确度、完整度以及流利度在内的细分维度的打分。虽然,上述的方案可以引导用户进行朗读训练,但是方式一以及方式二不能对用户的朗读水平进行评价,学习者不能得到即时的反馈;方式三虽然能够对朗读者的训练进行评分,但是往往只能提供整句级别的朗读评分,系统无法实现学习者在结构片段上进行针对训练;并且该方式仅仅提供录音示范音频,无法提供教学功能,从而降低了用户对朗读技巧的掌握。
技术实现思路
本专利技术提供了一种语句分析处理方法及系统,用以解决现有技术中对用户朗读数据进行整句分析评测,导致用户无法针对性进行训练的问题。其具体的技术方案如下:一种语句分析处理的方法,所述方法包括:对进行练习语句进行韵律层级分析,确定各个语句中各个韵律组块的组块时间边界,其中,所述韵律组块包含至少一个单词,所述时间边界表征了语句的停顿位置;根据确定出的所述组块时间边界,对所述练习语句设置语调标记;根据确定出的所述组块时间边界,对所述练习语句设置重读标记;将确定的所述组块时间边界、所述语调标记以及所述重读标记的练习语句作为标准韵律层级语句。可选的,对进行练习语句进行韵律层级分析,确定各个语句中各个韵律组块的组块时间边界,包括:对进行练习语句进行韵律层级分析,确定所述练习语句中各个单词对应的单词时间边界;根据各个单词的所述单词时间边界,确定各个韵律组块的所述组块时间边界。可选的,根据各个单词的所述单词时间边界,确定各个韵律组块的所述组块时间边界,包括:根据各个单词的单词时间边界,在练习语句中确定出句子层;在所述句子层中确定出语调短语层;在所述语调短语层中确定出韵律短语层;根据所述句子层、所述语调短语层以及所述韵律短语层,确定各个韵律组块的所述组块时间边界。可选的,根据确定出的所述组块时间边界,对所述练习语句设置语调标记,包括:获取所述练习语句中的数据以及获取语调标注集,其中,所述数据包含每行文本以及每行文本对应的语音,所述标注集中包含了各个语调;基于所述练习语句中的数据以及标注集,以及根据确定出所述单词时间边界,对各个单词设置语调标记。可选的,根据确定出的所述组块时间边界,对所述练习语句设置重读标记,包括:获取所述练习语句中的数据以及获取重读标注集;基于所述练习语句中的数据以及获取的重读标注集,以及根据确定出所述单词时间边界,对各个单词进行重读标记。可选的,在将确定的所述组块时间边界、所述语调标记以及所述重读标记的练习语句作为标准韵律层级语句之后,所述方法还包括:获取用户基于所述标准韵律层级语句的练习语句;基于韵律层级,在所述练习语句中确定出存在错误的韵律组块;输出用于提示用户进行重复练习的韵律组块的提示信息。可选的,在输出用于提示用于进行重复练习的韵律组块的提示信息之后,所述方法还包括:检测用户当前训练的韵律组块是否评测通过;若否,则提示用户继续训练当前韵律组块;若是,则从当前的韵律组块切换至下一个存在错误的韵律组块,以使用户练习下一个韵律组块。一种语句分析处理的系统,所述系统包括:分析模块,用于对进行练习语句进行韵律层级分析,确定各个语句中各个韵律组块的组块时间边界,根据确定出的所述组块时间边界,对所述练习语句设置语调标记;根据确定出的所述组块时间边界,对所述练习语句设置重读标记,其中,所述韵律组块包含至少一个单词,所述时间边界表征了语句的停顿位置;处理模块,用于将确定的所述组块时间边界、所述语调标记以及所述重读标记的练习语句作为标准韵律层级语句。可选的,所述分析模块,具体用于对进行练习语句进行韵律层级分析,确定所述练习语句中各个单词对应的单词时间边界;根据各个单词的所述单词时间边界,确定各个韵律组块的所述组块时间边界。可选的,所述分析模块,具体用于根据各个单词的单词时间边界,在练习语句中确定出句子层;在所述句子层中确定出语调短语层;在所述语调短语层中确定出韵律短语层;根据所述句子层、所述语调短语层以及所述韵律短语层,确定各个韵律组块的所述组块时间边界。可选的,所述分析模块,具体用于获取所述练习语句中的数据以及获取语调标注集,其中,所述数据包含每行文本以及每行文本对应的语音,所述标注集中包含了各个语调;基于所述练习语句中的数据以及标注集,以及根据确定出所述单词时间边界,对各个单词设置语调标记。可选的,所述分析模块,具体用于获取所述练习语句中的数据以及获取重读标注集;基于所述练习语句中的数据以及获取的重读标注集,以及根据确定出所述单词时间边界,对各个单词进行重读标记。可选的,所述处理模块,还用于获取用户基于所述标准韵律层级语句的练习语句;基于韵律层级,在所述练习语句中确定出存在错误的韵律组块;输出用于提示用户进行重复练习的韵律组块的提示信息。可选的,所述处理模块,还用于检测用户当前训练的韵律组块是否评测通过;若否,则提示用户继续训练当前韵律组块;若是,则从当前的韵律组块切换至下一个存在错误的韵律组块,以使用户练习下一个韵律组块。...

【技术保护点】
1.一种语句分析处理的方法,其特征在于,所述方法包括:/n对进行练习语句进行韵律层级分析,确定各个语句中各个韵律组块的组块时间边界,其中,所述韵律组块包含至少一个单词,所述时间边界表征了语句的停顿位置;/n根据确定出的所述组块时间边界,对所述练习语句设置语调标记;/n根据确定出的所述组块时间边界,对所述练习语句设置重读标记;/n将确定的所述组块时间边界、所述语调标记以及所述重读标记的练习语句作为标准韵律层级语句。/n

【技术特征摘要】
1.一种语句分析处理的方法,其特征在于,所述方法包括:
对进行练习语句进行韵律层级分析,确定各个语句中各个韵律组块的组块时间边界,其中,所述韵律组块包含至少一个单词,所述时间边界表征了语句的停顿位置;
根据确定出的所述组块时间边界,对所述练习语句设置语调标记;
根据确定出的所述组块时间边界,对所述练习语句设置重读标记;
将确定的所述组块时间边界、所述语调标记以及所述重读标记的练习语句作为标准韵律层级语句。


2.如权利要求1所述的方法,其特征在于,对进行练习语句进行韵律层级分析,确定各个语句中各个韵律组块的组块时间边界,包括:
对进行练习语句进行韵律层级分析,确定所述练习语句中各个单词对应的单词时间边界;
根据各个单词的所述单词时间边界,确定各个韵律组块的所述组块时间边界。


3.如权利要求2所述的方法,其特征在于,根据各个单词的所述单词时间边界,确定各个韵律组块的所述组块时间边界,包括:
根据各个单词的单词时间边界,在练习语句中确定出句子层;
在所述句子层中确定出语调短语层;
在所述语调短语层中确定出韵律短语层;
根据所述句子层、所述语调短语层以及所述韵律短语层,确定各个韵律组块的所述组块时间边界。


4.如权利要求2所述的方法,其特征在于,根据确定出的所述组块时间边界,对所述练习语句设置语调标记,包括:
获取所述练习语句中的数据以及获取语调标注集,其中,所述数据包含每行文本以及每行文本对应的语音,所述标注集中包含了各个语调;
基于所述练习语句中的数据以及标注集,以及根据确定出所述单词时间边界,对各个单词设置语调标记。


5.如权利要求2所述的方法,其特征在于,根据确定出的所述组块时间边界,对所述练习语句设置重读标记,包括:
获取所述练习语句中的数据以及获取重读标注集;
基于所述练习语句中的数据以及获取的重读标注集,以及根据确定出所述单词时间边界,对各个单词进行重读标记。


6.如权利要求1所述的方法,其特征在于,在将确定的所述组块时间边界、所述语调标记以及所述重读标记的练习语句作为标准韵律层级语句之后,所述方法还包括:
获取用户基于所述标准韵律层级语句的练习语句;
基于韵律层级,在所述练习语句中确定出存在错误的韵律组块;
输出用于提示用户进行重复练习的韵律组块的提示信息。


7.如权利要求6所述的方法,其特征在于,在输出用于提示用于进行重复练习的韵律组块的提示信息...

【专利技术属性】
技术研发人员:夏海荣张少飞于佳玉刘悦
申请(专利权)人:沪江教育科技上海股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1