一种语音语句断句处理方法及系统技术方案

技术编号：32246270 阅读：6 留言：0更新日期：2022-02-09 17:49

本发明专利技术提供一种语音语句断句处理方法及系统，所述处理方法包括如下步骤：步骤S1，用户输入语音信息；步骤S2，识别用户输入的语音信息；步骤S3，对识别后的语音信息进行断句处理，并针对每句语句生成若干相近语句，然后对若干相近语句进行等级划分；步骤S4，将处理后的语句推送给用户，用户基于输入的语音语义选择对应的语句，本发明专利技术能够对用户输入的语音进行精准的断句识别，从而提高语音语义的断句识别准确性，以解决现有的语音断句识别不够精准的问题。题。题。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音语句断句处理方法及系统

[0001]本专利技术涉及语音断句处理
，尤其涉及一种语音语句断句处理方法及系统。

技术介绍

[0002]语音识别是一门交叉学科。近二十年来，语音识别技术取得显著进步，开始从实验室走向市场，未来10年内，语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。
[0003]现有的技术中，在进行语音识别时，如何对用户输入的语音进行断句成为了一大难题，通过对人声的识别来进行语音语义文字的转换，现有的断句方法仅仅通过时间间隔来判断，但是转换后的文字经常会出现断句混乱的现象，导致语音识别后的文字表达的语义与用户输入的语音语义不能匹配的问题。

技术实现思路

[0004]针对现有技术存在的不足，本专利技术目的是提供一种语音语句断句处理方法及系统，能够对用户输入的语音进行精准的断句识别，从而提高语音语义的断句识别准确性，以解决现有的语音断句识别不够精准的问题。
[0005]为了实现上述目的，本专利技术是通过如下的技术方案来实现：一种语音语句断句处理方法，所述处理方法包括如下步骤：步骤S1，用户输入语音信息；步骤S2，识别用户输入的语音信息；步骤S3，对识别后的语音信息进行断句处理，并针对每句语句生成若干相近语句，然后对若干相近语句进行等级划分；步骤S4，将处理后的语句推送给用户，用户基于输入的语音语义选择对应的语句。
[0006]进一步地，所述步骤S1还包括：用户在进行语音输入时，可以进行人声直接输入或其他设备声音输入的选择...

【技术保护点】

【技术特征摘要】
1.一种语音语句断句处理方法，其特征在于，所述处理方法包括如下步骤：步骤S1，用户输入语音信息；步骤S2，识别用户输入的语音信息；步骤S3，对识别后的语音信息进行断句处理，并针对每句语句生成若干相近语句，然后对若干相近语句进行等级划分；步骤S4，将处理后的语句推送给用户，用户基于输入的语音语义选择对应的语句。2.根据权利要求1所述的一种语音语句断句处理方法，其特征在于，所述步骤S1还包括：用户在进行语音输入时，可以进行人声直接输入或其他设备声音输入的选择；所述步骤S2还包括：对输入的语音进行声纹识别，对识别到的人声生成语音信息。3.根据权利要求2所述的一种语音语句断句处理方法，其特征在于，所述步骤S3还包括步骤A1，所述步骤A1包括：先将识别到语音转化为文字信息，将转化后的文字信息放入一时间横轴内，该时间横轴以语音输入的起始时间为起点，以语音输入结束的时间为终点，将文字信息中的每个文字对应到时间横轴内，分别标记每个语音的横坐标，然后通过第一时长计算方法计算出每个文字输入耗费的时长；将若干文字输入耗费的时长带入文字平均时长公式中求得文字平均时长值；再获取每两个文字之间的间隔时长，将间隔时长和文字平均时长值带入断句间隔公式中求得断句差值；当断句差值大于第一断句阈值时，将该断句差值对应的两个文字进行分开断句。4.根据权利要求3所述的一种语音语句断句处理方法，其特征在于，所述步骤A1还包括：以文字信息中的文字距两侧文字的中点为两侧截止点，两侧截止点之间的时长即为该文字的输入耗费时长；其中，第一个文字的两侧截止点分别为时间横轴的起点以及第一个文字和第二个文字在时间横轴上的中点；最后一个文字的两侧截止点分别为倒数第二个文字和最后一个文字在时间横轴上的中点以及时间横轴的终点。5.根据权利要求4所述的一种语音语句断句处理方法，其特征在于，所述步骤S3还包括步骤A2，所述步骤A2包括：对断句后的文字进行相近词语的替换，针对每句文字生成若干相近语句；从大数据中调取每个相近词语的使用频率，选取使用频率最多的词语进行优先推选，其余相近语句按照替换词语的使用频率由高到低进行排序；所述步骤S4还包括：选取使用频率最多的词语作为每句文字的优选语句，生成最终的文字信息进行推荐；对每句文字设置触碰下弹框，下弹框内按照按照替换词语的使用频率由高到低对相近语句进行排序，用户根据自身输入的语义选择是否替换优选语句。6.根据权利要求1
‑
5任意一项所述的一种语音语句断句处理方法的处理系统，其特征在于，所述处理系统包括语音输入模块(1)、语音识别模块(2)、处理模块(3)以及推送模块(4)；所述语音输入模块(1)用于用户输入语音信息；所述语音识别模块(2)用于识别用户输入的语音信息；所述处理模块(3)用于对识别后的语音信息进行处理，并对应生成不同等级的语句；
所述处理模块(3)包括断句单元(31)以及等级划分单元(32)，所述断句单元(31)用于对识...

【专利技术属性】
技术研发人员：汪张龙，徐俊，沈毅飞，巫庭虎，邹月荣，
申请(专利权)人：广州讯飞易听说网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人