语音波形处理系统及方法技术方案

技术编号:3045906 阅读:143 留言:0更新日期:2012-04-11 18:40
一种语音波形处理系统及方法,该系统至少包括:语音数据预处理模块、储存模块、切分处理模块、切分结果显示模块及波形显示模块;与常用的语音波形处理技术相比,本发明专利技术的语音波形处理系统及方法可根据预先定义的语音参数将连续语音波形切分为多个句段,并将切分处理后的句段建立索引机制,实现可快速跳转到连续语音的其中任一句段的目的,可将其它媒体信息通过索引机制与任何一个句段建立关联,借以改善上述现有技术的缺点,令语言处理技术具有更大的应用空间。

【技术实现步骤摘要】

本专利技术是关于一种,特别是一种可根据预先定义的语音参数对连续语音波形进行切分处理的。
技术介绍
现今社会随着计算机科技的飞速发展,计算机技术业已渗透至人们日常生活各个领域,应用计算机处理信息也已由单纯文本文件的处理发展至今日可处理音频及视频在内的所有形式的数据。在各种信息处理形式中,音频信息处理技术的发展历来备受关注,如通过对语音声波处理并结合相应软件实现不同目的的应用技术。目前是使用一种可对语音波形进行切分处理的技术,可对音频数据执行切分处理,也就是将连续语音信号分割为若干段落。但是该项技术往往需借由统一标准执行,缺乏自主性及灵活性,因而其应用范围受到限制。此外,常用的连续语音切分处理技术往往是单纯作为一项理论技术,缺乏实用性。因此,如何提供一种自主灵活的语音切分处理系统及方法,如何拓展该项技术的应用领域,成为急待解决的重要问题。
技术实现思路
克服上述现有技术的缺点,本专利技术的主要目的在于提供一种,可按预先定义的语音参数将连续语音波形切分为多个句段。本专利技术的另一目的在于提供一种,可对切分处理后的句段建立索引机制。本专利技术的再一目的在于提供一种,可快速跳转到连续语音当中的任何一个句段。本专利技术的又一目的在于提供一种,可将其它媒体信息通过索引机制与任何一个句段建立关联。为达上述及其它目的,本专利技术即提供一种。本专利技术的语音波形处理系统至少包括切分参数设定模块,用于设定处理语音波形的处理参数;语音数据预处理模块,用于读取连续语音信号,并对该语音信号进行预处理;储存模块,用于储存该切分参数设定模块预先设定处理的语音波形的处理参数及与语音信号相关的信息;切分处理模块,用于根据该切分参数设定模块预先设定处理的语音波形的处理参数及与输入语音信号相关的信息,对输入的连续语音信号进行切分处理;切分结果显示模块,用于将借由该切分处理模块进行切分处理后的切分索引提供给使用者;以及波形显示模块,用于显示连续语音信号波形及借由该切分处理模块进行切分处理后的语音信号波形。本专利技术通过该语音波形处理系统执行的语音波形处理方法的步骤包括1)令该语音波形处理系统预先设定处理语音波形处理的参数;2)令该语音波形处理系统读取输入的连续语音信号,并对该语音信号进行预处理,该连续语音信号波形将通过语音波形处理系统所设的波形显示模块提供给使用者浏览;3)令该语音波形处理系统预先设定处理语音波形的参数及与输入语音信号相关的信息;4)令该语音波形处理系统按照语音波形处理的参数及与输入的语音信号相关的信息,对输入的连续语音信号进行切分处理,并通过波形显示模块提供给使用者浏览该切分处理后的语音波形;以及5)令该语音波形处理系统将切分处理后的切分索引提供给使用者。与常用的语音波形处理技术相比,本专利技术的可根据预先定义的语音参数将连续语音波形切分为多个句段,并将切分处理后的句段建立索引机制,实现可快速跳转到连续语音的其中任一句段的目的,可将其它媒体信息通过索引机制与任何一个句段建立关联,借以改善上述现有技术的缺点,令语言处理技术具有更大的应用空间。附图说明图1是本专利技术的语音波形处理系统的基本结构方块图;图2是本专利技术的语音波形处理方法的基本工作流程图;图3是本专利技术的语音波形处理系统预先设定语音切分处理参数的计算机屏幕截留图;图4是本专利技术的切分处理模块进行切分的基本工作流程图;图5是令该切分处理模块通过弹出信息框形式提供连续语音切分结果列表的计算机屏幕截留图;图6是在确定该语音切分处理系统所执行的切分结果后的计算机屏幕截留图;图7是本专利技术的语音切分处理模块配合其它软件执行连续语音切分的计算机屏幕截留图;以及图8是利用本专利技术的语音切分处理模块对连续语音切分后,选择并按照切分结果索引直接跳转到相应句段播放或者处理的计算机屏幕截留图。具体实施例方式实施例以下通过特定的具体实施例说明本专利技术的实施方式。以下实施例是将本专利技术的语音波形处理系统结合在计算机设备中进行连续语音波形处理,此外,还可应用在具有音效识别功能的其他信息设备中。图1为方块图,它是本专利技术的语音波形处理系统的基本结构示意情形图,该语音波形处理系统1至少包括语音数据预处理模块10,储存模块11,切分处理模块12,切分结果显示模块13及波形显示模块14。在本实施例中,使用者可根据需要自定义处理语音波形的参数,这些处理语音波形参数至少包括静音幅阀值及静音间隔阀值,其中,当语音声波幅度小于预先设定的静音幅度阀值时,则判定为静音状态,当持续静音状态时间超过静音间隔阀值时,则判定为语音停顿状态,根据这些参数对连续语音进行切分处理。语音数据预处理模块10用于读取输入的连续语音信号,以对该语音信号进行预处理,并对输入的语音波形进行分析,记录该段语音波形中的停顿位置。储存模块11用于储存预先设定的处理语音波形的参数及与输入语音信号相关的信息。在本实施例中,该预先设定处理语音波形的参数至少包括如上所述的使用者自定义的静音幅阀值及静音间隔阀值,该输入的语音信号相关信息至少包括借由该语音数据预处理模块10判定该段语音信号中具有的停顿位置。该切分处理模块12用于根据语音波形处理的参数及与输入语音信号相关的信息,对输入的连续语音信号进行切分处理。其中,该切分处理过程是按照切分算法进行的。该切分结果显示模块13则用于将切分处理模块12处理后的切分索引提供给使用者。在本实施例中,该切分结果显示模块13是以弹出列表的形式出现,并提供输入语音经由切分处理后产生的句段编号、起始位置及统计信息等相关信息。该波形显示模块14用于显示输入的连续语音信号波形及借由该切分处理模块12进行切分处理后的语音信号波形。在本实施例中,在该切分处理模块12对输入的连续语音进行切分处理前,该波形显示模块14将显示该段连续语音的原始波形,且在该语音波形切分模块1对输入的连续语音进行切分处理后,该波形显示模块14将显示该段连续语音经语音切分处理的波形,其中也包括语音切分线的切分波形。图2是基本工作流程图,显示本专利技术的语音波形处理方法的基本步骤。在步骤S1中,先行提供使用者处理语音波形的参数设置字段,令使用者可通过该参数设置字段进行语音处理参数的选择及设置,接着,执行步骤S2。在步骤S2中,向该语音波形处理系统1输入一段连续语音信号,该连续语音信号即为待执行切分处理的对象,它可以是使用者直接输入的一段语音或由任何外部设备(例如磁带、光盘及硬盘等)转录的语音,接着,进行步骤S3。在步骤S3中,令该语音数据预处理模块10读取输入的连续语音信号,并对该语音信号进行预处理,该连续语音信号波形则可通过波形显示模块14提供给使用者参考,接着,进行步骤S4。在步骤S4中,令该语音波形处理系统1扫描输入的连续语音信号,并根据预先通过该参数设置字段设定的语音处理参数,判断该段连续语音信号中的停顿位置,接着,进行步骤S5。在步骤S5中,令该储存模块11储存由该语音波形处理系统1经扫描判断出的停顿位置,接着,进行步骤S6。在步骤S6中,令该切分处理模块12执行切分算法,并根据该储存模块11中储存的停顿位置切分连续语音,生成切分句段清单,最后,执行步骤S7。在步骤S7中,令该切分结果显示模块13显示切分句段清单,并令该波形显示模块14显示该段连续语音经语音切分处理后的波形,也就是语音切分线的切本文档来自技高网...

【技术保护点】
一种语音波形处理系统,按定义的参数对连续语音波形进行处理,其特征在于,该系统至少包括:切分参数设定模块,用于设定处理语音波形的处理参数;语音数据预处理模块,用于读取连续语音信号,并对该语音信号进行预处理;储存模块,用 于储存该切分参数设定模块预先设定处理的语音波形的处理参数及与语音信号相关的信息;切分处理模块,用于根据该切分参数设定模块预先设定处理的语音波形的处理参数及与输入语音信号相关的信息,对输入的连续语音信号进行切分处理;切分结果显 示模块,用于将借由该切分处理模块进行切分处理后的切分索引提供给使用者;以及波形显示模块,用于显示连续语音信号波形及借由该切分处理模块进行切分处理后的语音信号波形。

【技术特征摘要】
1.一种语音波形处理系统,按定义的参数对连续语音波形进行处理,其特征在于,该系统至少包括切分参数设定模块,用于设定处理语音波形的处理参数;语音数据预处理模块,用于读取连续语音信号,并对该语音信号进行预处理;储存模块,用于储存该切分参数设定模块预先设定处理的语音波形的处理参数及与语音信号相关的信息;切分处理模块,用于根据该切分参数设定模块预先设定处理的语音波形的处理参数及与输入语音信号相关的信息,对输入的连续语音信号进行切分处理;切分结果显示模块,用于将借由该切分处理模块进行切分处理后的切分索引提供给使用者;以及波形显示模块,用于显示连续语音信号波形及借由该切分处理模块进行切分处理后的语音信号波形。2.如权利要求1所述的语音波形处理系统,其特征在于,该预先设定处理的语音波形处理的参数至少包括静音幅阀值及静音持续间隔时间中的一个。3.如权利要求2所述的语音波形处理系统,其特征在于,当语音波形幅度小于预先设定的静音幅阀值时,则该语音波形处理系统判断为静音状态。4.如权利要求2所述的语音波形处理系统,其特征在于,当持续静音状态时间超过静音持续间隔时间时,则该语音波形处理系统判断为语音停顿状态。5.如权利要求1所述的语音波形处理系统,其特征在于,该语音数据预处理模块对输入的语音波形进行分析后,记录该段语音波形中的停顿区域。6.如权利要求1所述的语音波形处理系统,其特征在于,该切分处理模块按照切分算法对连续语音信号进行切分处理。7.如权利要求1所述的语音波形处理系统,其特征在于,该切分结果显示模块将在进行完切分处理后,显示带切分标记的语音波形以及索引清单。8.一种语音波形处理方法...

【专利技术属性】
技术研发人员:邵晓慧邱全成
申请(专利权)人:英业达股份有限公司
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利