一种语音语句断句处理方法及系统技术方案

技术编号:32246270 阅读:6 留言:0更新日期:2022-02-09 17:49
本发明专利技术提供一种语音语句断句处理方法及系统,所述处理方法包括如下步骤:步骤S1,用户输入语音信息;步骤S2,识别用户输入的语音信息;步骤S3,对识别后的语音信息进行断句处理,并针对每句语句生成若干相近语句,然后对若干相近语句进行等级划分;步骤S4,将处理后的语句推送给用户,用户基于输入的语音语义选择对应的语句,本发明专利技术能够对用户输入的语音进行精准的断句识别,从而提高语音语义的断句识别准确性,以解决现有的语音断句识别不够精准的问题。题。题。

【技术实现步骤摘要】
一种语音语句断句处理方法及系统


[0001]本专利技术涉及语音断句处理
,尤其涉及一种语音语句断句处理方法及系统。

技术介绍

[0002]语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。
[0003]现有的技术中,在进行语音识别时,如何对用户输入的语音进行断句成为了一大难题,通过对人声的识别来进行语音语义文字的转换,现有的断句方法仅仅通过时间间隔来判断,但是转换后的文字经常会出现断句混乱的现象,导致语音识别后的文字表达的语义与用户输入的语音语义不能匹配的问题。

技术实现思路

[0004]针对现有技术存在的不足,本专利技术目的是提供一种语音语句断句处理方法及系统,能够对用户输入的语音进行精准的断句识别,从而提高语音语义的断句识别准确性,以解决现有的语音断句识别不够精准的问题。
[0005]为了实现上述目的,本专利技术是通过如下的技术方案来实现:一种语音语句断句处理方法,所述处理方法包括如下步骤:步骤S1,用户输入语音信息;步骤S2,识别用户输入的语音信息;步骤S3,对识别后的语音信息进行断句处理,并针对每句语句生成若干相近语句,然后对若干相近语句进行等级划分;步骤S4,将处理后的语句推送给用户,用户基于输入的语音语义选择对应的语句。
[0006]进一步地,所述步骤S1还包括:用户在进行语音输入时,可以进行人声直接输入或其他设备声音输入的选择;所述步骤S2还包括:对输入的语音进行声纹识别,对识别到的人声生成语音信息。
[0007]进一步地,所述步骤S3还包括步骤A1,所述步骤A1包括:先将识别到语音转化为文字信息,将转化后的文字信息放入一时间横轴内,该时间横轴以语音输入的起始时间为起点,以语音输入结束的时间为终点,将文字信息中的每个文字对应到时间横轴内,分别标记每个语音的横坐标,然后通过第一时长计算方法计算出每个文字输入耗费的时长;将若干文字输入耗费的时长带入文字平均时长公式中求得文字平均时长值;再获取每两个文字之间的间隔时长,将间隔时长和文字平均时长值带入断句间隔公式中求得断句差值;当断句差值大于第一断句阈值时,将该断句差值对应的两个文字进行分开断句。
[0008]进一步地,所述步骤A1还包括:以文字信息中的文字距两侧文字的中点为两侧截
止点,两侧截止点之间的时长即为该文字的输入耗费时长;其中,第一个文字的两侧截止点分别为时间横轴的起点以及第一个文字和第二个文字在时间横轴上的中点;最后一个文字的两侧截止点分别为倒数第二个文字和最后一个文字在时间横轴上的中点以及时间横轴的终点。
[0009]进一步地,所述步骤S3还包括步骤A2,所述步骤A2包括:对断句后的文字进行相近词语的替换,针对每句文字生成若干相近语句;从大数据中调取每个相近词语的使用频率,选取使用频率最多的词语进行优先推选,其余相近语句按照替换词语的使用频率由高到低进行排序。
[0010]进一步地,所述步骤S4还包括:选取使用频率最多的词语作为每句文字的优选语句,生成最终的文字信息进行推荐;对每句文字设置触碰下弹框,下弹框内按照按照替换词语的使用频率由高到低对相近语句进行排序,用户根据自身输入的语义选择是否替换优选语句。
[0011]进一步地,所述处理系统包括语音输入模块、语音识别模块、处理模块以及推送模块;所述语音输入模块用于用户输入语音信息;所述语音识别模块用于识别用户输入的语音信息;所述处理模块用于对识别后的语音信息进行处理,并对应生成不同等级的语句;所述处理模块包括断句单元以及等级划分单元,所述断句单元用于对识别后的语音信息进行断句处理,并针对每句语句生成若干相近语句;所述等级划分单元用于对若干相近语句进行等级划分;所述推送模块用于将处理后的语句推送给用户,用户基于输入的语音语义选择对应的语句。
[0012]进一步地,所述语音输入模块配置有语音输入策略,所述语音输入策略包括:用户在进行语音输入时,可以进行人声直接输入或其他设备声音输入的选择;所述语音识别模块包括人声识别单元,所述人声识别单元配置有人声识别策略,所述人声识别策略包括:对输入的语音进行声纹识别,对识别到的人声生成语音信息并输出至处理模块。
[0013]进一步地,所述断句单元配置有断句策略,所述断句策略包括:先将识别到语音转化为文字信息,将转化后的文字信息放入一时间横轴内,该时间横轴以语音输入的起始时间为起点,以语音输入结束的时间为终点,将文字信息中的每个文字对应到时间横轴内,分别标记每个语音的横坐标,然后通过第一时长计算方法计算出每个文字输入耗费的时长;将若干文字输入耗费的时长带入文字平均时长公式中求得文字平均时长值;再获取每两个文字之间的间隔时长,将间隔时长和文字平均时长值带入断句间隔公式中求得断句差值;当断句差值大于第一断句阈值时,将该断句差值对应的两个文字进行分开断句;所述第一时长计算方法包括:以文字信息中的文字距两侧文字的中点为两侧截止点,两侧截止点之间的时长即为该文字的输入耗费时长;其中,第一个文字的两侧截止点分别为时间横轴的起点以及第一个文字和第二个文字在时间横轴上的中点;最后一个文字的两侧截止点分别为倒数第二个文字和最后一个
文字在时间横轴上的中点以及时间横轴的终点。
[0014]进一步地,所述文字平均时长公式配置为:;所述断句间隔公式配置为:;其中,Vwz为文字平均时长值,t1为第一个文字的输入耗费时长,tn为第n个文字的输入耗费时长,n为该文字信息的文字数量,Pdc为断句差值,tj代表两个文字之间的间隔时长,i表示每两个文字之间间隔时长的数量,i为正整数,且i可以自由替换,a1为断句差值的转换系数,且a1大于零。
[0015]进一步地,所述等级划分单元配置有等级划分策略,所述等级划分策略包括:对断句后的文字进行相近词语的替换,针对每句文字生成若干相近语句;从大数据中调取每个相近词语的使用频率,选取使用频率最多的词语进行优先推选,其余相近语句按照替换词语的使用频率由高到低进行排序;所述推送模块配置有推送策略,所述推送策略包括:选取使用频率最多的词语作为每句文字的优选语句,生成最终的文字信息进行推荐;对每句文字设置触碰下弹框,下弹框内按照按照替换词语的使用频率由高到低对相近语句进行排序,用户根据自身输入的语义选择是否替换优选语句。
[0016]本专利技术的有益效果:本专利技术通过识别用户输入的语音信息,再对识别后的语音信息进行断句处理,并针对每句语句生成若干相近语句,然后对若干相近语句进行等级划分;最后将处理后的语句推送给用户,用户基于输入的语音语义选择对应的语句;同时在断句识别的过程中,通过对每个文字所耗费的时长进行计算,然后再综合每两个文字之间的时长间隔,能够基于用户的语速来对语音进行断句,从而能够根据不同用户的语音输入特征来进行断句,提高语音语义断句的准确性。
附图说明
[0017]通过阅读参照以下附图对非限制性实施例所作的详细描述,本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音语句断句处理方法,其特征在于,所述处理方法包括如下步骤:步骤S1,用户输入语音信息;步骤S2,识别用户输入的语音信息;步骤S3,对识别后的语音信息进行断句处理,并针对每句语句生成若干相近语句,然后对若干相近语句进行等级划分;步骤S4,将处理后的语句推送给用户,用户基于输入的语音语义选择对应的语句。2.根据权利要求1所述的一种语音语句断句处理方法,其特征在于,所述步骤S1还包括:用户在进行语音输入时,可以进行人声直接输入或其他设备声音输入的选择;所述步骤S2还包括:对输入的语音进行声纹识别,对识别到的人声生成语音信息。3.根据权利要求2所述的一种语音语句断句处理方法,其特征在于,所述步骤S3还包括步骤A1,所述步骤A1包括:先将识别到语音转化为文字信息,将转化后的文字信息放入一时间横轴内,该时间横轴以语音输入的起始时间为起点,以语音输入结束的时间为终点,将文字信息中的每个文字对应到时间横轴内,分别标记每个语音的横坐标,然后通过第一时长计算方法计算出每个文字输入耗费的时长;将若干文字输入耗费的时长带入文字平均时长公式中求得文字平均时长值;再获取每两个文字之间的间隔时长,将间隔时长和文字平均时长值带入断句间隔公式中求得断句差值;当断句差值大于第一断句阈值时,将该断句差值对应的两个文字进行分开断句。4.根据权利要求3所述的一种语音语句断句处理方法,其特征在于,所述步骤A1还包括:以文字信息中的文字距两侧文字的中点为两侧截止点,两侧截止点之间的时长即为该文字的输入耗费时长;其中,第一个文字的两侧截止点分别为时间横轴的起点以及第一个文字和第二个文字在时间横轴上的中点;最后一个文字的两侧截止点分别为倒数第二个文字和最后一个文字在时间横轴上的中点以及时间横轴的终点。5.根据权利要求4所述的一种语音语句断句处理方法,其特征在于,所述步骤S3还包括步骤A2,所述步骤A2包括:对断句后的文字进行相近词语的替换,针对每句文字生成若干相近语句;从大数据中调取每个相近词语的使用频率,选取使用频率最多的词语进行优先推选,其余相近语句按照替换词语的使用频率由高到低进行排序;所述步骤S4还包括:选取使用频率最多的词语作为每句文字的优选语句,生成最终的文字信息进行推荐;对每句文字设置触碰下弹框,下弹框内按照按照替换词语的使用频率由高到低对相近语句进行排序,用户根据自身输入的语义选择是否替换优选语句。6.根据权利要求1

5任意一项所述的一种语音语句断句处理方法的处理系统,其特征在于,所述处理系统包括语音输入模块(1)、语音识别模块(2)、处理模块(3)以及推送模块(4);所述语音输入模块(1)用于用户输入语音信息;所述语音识别模块(2)用于识别用户输入的语音信息;所述处理模块(3)用于对识别后的语音信息进行处理,并对应生成不同等级的语句;
所述处理模块(3)包括断句单元(31)以及等级划分单元(32),所述断句单元(31)用于对识...

【专利技术属性】
技术研发人员:汪张龙徐俊沈毅飞巫庭虎邹月荣
申请(专利权)人:广州讯飞易听说网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1