语音断句检测方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号:44764652 阅读:19 留言:0更新日期:2025-03-26 12:46
本申请公开了一种语音断句检测方法、装置、设备、存储介质及程序产品,方法包括:获取第一语音的第一语音基础数据和第二语音的第二语音基础数据;根据所述第一语音基础数据和所述第二语音基础数据确定第二静音时长阈值;根据所述第二语音的静音时长和所述第二静音时长阈值确定所述第二语音的第一断句检测结果,所述第一断句检测结果用于指示所述第二语音是否需要断句。通过根据需要进行断句检测语音的第二语音基础数据和已进行断句检测语音的第一语音基础数据对静音时长阈值进行动态调整,然后根据第二语音基础数据和调整后的静音时长阈值进行语音断句检测,得到语音断句检测结果,有利于提高语音断句检测的准确性。

【技术实现步骤摘要】

本申请涉及断句检测,尤其涉及一种语音断句检测方法、装置、设备、存储介质及程序产品


技术介绍

1、在对用户语音的识别过程中,传统断句算法通过设置固定的静音时长阈值来进行语音断句的判断。当语音的停顿时长大于该静音时长阈值时则判断为断句,小于该静音时长阈值时则不进行断句。经研究发现,不同用户在说话时的语速是不同的,这跟用户所处环境,情绪状态及所述内容等都有关系,固定的静音时长阈值未考虑说话者的语速和说话时长,这会导致在一定情境下,固定的静音时长阈值会不适用,例如在一些小于静音时长阈值的情况下应该断句但未断句,从而可能造成语音断句检测的准确率下降。


技术实现思路

1、本申请实施例提供一种语音断句检测方法、装置、设备、存储介质及程序产品,通过根据待断句检测语音的语速数据、时长数据和已进行断句检测语音的语速数据、时长数据以及第一静音时长阈值对静音时长阈值进行动态调整,得到第二静音时长阈值,然后根据待断句检测语音的静音时长和第二静音时长阈值得到语音断句检测结果,有利于提高语音断句检测的准确性。

2、第一方面,本文档来自技高网...

【技术保护点】

1.一种语音断句检测方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述根据所述第一语音时长数据、所述第一语音语速数据、所述第一静音时长阈值、所述第二语音时长数据以及所述第二语音语速数据确定第二静音时长阈值,包括:

3.如权利要求2所述的方法,其特征在于,所述根据第一权重平衡因子、所述第二语音语速数据以及所述第一语音语速数据确定第一权重,包括:

4.如权利要求2所述的方法,其特征在于,所述根据所述第一权重平衡因子、所述第二语音时长数据以及所述第一语音时长数据确定第二权重,包括:

5.如权利要求1所述的方法,其特征在...

【技术特征摘要】

1.一种语音断句检测方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述根据所述第一语音时长数据、所述第一语音语速数据、所述第一静音时长阈值、所述第二语音时长数据以及所述第二语音语速数据确定第二静音时长阈值,包括:

3.如权利要求2所述的方法,其特征在于,所述根据第一权重平衡因子、所述第二语音语速数据以及所述第一语音语速数据确定第一权重,包括:

4.如权利要求2所述的方法,其特征在于,所述根据所述第一权重平衡因子、所述第二语音时长数据以及所述第一语音时长数据确定第二权重,包括:

5.如权利要求1所述的方法,其特征在于,所述根据所述第二语音的静音时长和所述第二静音时长阈值确定所述第二语音的第一断句检测结果,包括:

6.如权利要求1-5任一项所述的方法,其特征在于,在所述确定所述第二语音的第一断句检测结果为所述第二语音不...

【专利技术属性】
技术研发人员:荣林通
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1