用于语音处理的方法与系统技术方案

技术编号:8216088 阅读:228 留言:0更新日期:2013-01-17 17:26
提供了一种用于语音处理的方法和系统,所述系统包括:语音特性参数获取模块,用于获取表现第一语音和第二语音的语音特性的语音特性参数;语音模版生成模块,用于将第一语音的语音特性参数生成为语音模版;语音处理模块,用于根据语音模版调整第二语音的语音特性参数,并将调整后的语音特性参数应用于第二语音。

【技术实现步骤摘要】

本专利技术涉及一种用于语音处理的方法与系统,更具体地讲,涉及一种能够使用语音模板对语音进行处理的方法与系统。
技术介绍
近年来,随着语音处理技术的快速发展,人们对语音的认识越来越深入,并出现了多种关于语音的应用,例如,语音识别、录音、鹦鹉学舌等。由于各种语音应用的出发点有所不同,因而这些应用各具特色,并能够满足各类人群的不同需求。尽管在现有技术中已出现了关于语音处理中的语音变声的许多应用和方法,但是大多数变声应用只能以预先确定的模式对语音进行处理,而难以对多样性的、变化性的语 音进行有效处理和变声,使得用户无法根据实际需求来对语音进行灵活处理。因此,随着数字装置的广泛应用以及数字装置的用户需求的不断变化,现有的变声应用已无法满足当前和未来发展的需要。在这种情况下,需要一种能够灵活地根据用户的需求来对语音进行处理以实现变声的方法和系统。
技术实现思路
本专利技术的目的在于提供一种能够根据用户需求来生成语音模板并使用语音模板对语音进行处理的方法与系统,从而使得用户能够更加灵活和有效地对语音进行处理,其中,可通过提取语音信号的语音特性参数来产生语音模板。根据本专利技术的一方面,提供了一种语音处理系统,所述系统包括语音特性参数获取模块,用于获取表现第一语音和第二语音的语音特性的语音特性参数;语音模版生成模块,用于将第一语音的语音特性参数生成为语音模版;语音处理模块,用于根据语音模板调整第二语音的语音特性参数,并将调整后的语音特性参数应用于第二语音。所述系统还可包括语音获取模块,用于获取第一语音和/或第二语音。所述系统还可包括存储模块,用于存储语音模板。所述语音特性可包括语音的音量、音调和音色特性中的至少一个。所述语音获取模块可从预先存储的语音中选取第一语音和/或第二语音。所述语音获取模块可使用录音设备录制第一语音和/或第二语音。所述语音特性参数可包括下述参数中的至少一个表现音量特性的音量大小参数、表现音调特性的基音的频率和幅度参数、表现音色特性的预定数量的泛音的频率和幅度参数。语音特性参数获取模块可直接设置形成语音模板所需的第一语音的各项语音特性参数,使得设置的语音特性参数被语音模板生成模块生成为语音模板。语音处理模块对从存储的语音模板中选择的语音模板所包含的语音特性参数进行调整,并根据调整后的语音特性参数由语音模板生成模块生成与选择的语音模板不同的另一语音模板。根据本专利技术的另一方面,还提供了一种语音处理方法,所述方法包括获取表现第一语音和第二语音的语音特性的语音特性参数;将第一语音的语音特性参数生成为语音模版;根据语音模板调整第二语音的语音特性参数,并将调整后的语音特性参数应用于第二语音。所述方法还可包括获取第一语音和/或第二语音。所述方法还可包括存储语音模板。所述语音特性可包括语音的音量、音调和音色特性中的至少一个。可从预先存储的语音中选取第一语音和/或第二语音。可使用录音设备录制第一语音和/或第二语音。 所述语音特性参数可包括下述参数中的至少一个表现音量特性的音量大小参数、表现音调特性的基音的频率和幅度参数、表现音色特性的预定数量的泛音的频率和幅度参数。可直接设置形成语音模板所需的第一语音的各项语音特性参数,使得设置的语音特性参数被生成为语音模板。对从存储的语音模板中选择的语音模板所包含的语音特性参数进行调整,并根据调整后的语音特性参数生成与选择的语音模板不同的另一语音模板。通过使用本专利技术的语音处理方法和系统,可更灵活地按照用户的需求对语音进行处理,使得语音处理的结果更加逼真和多样,实现丰富用户的娱乐生活的目的。将在接下来的描述中部分阐述本专利技术另外的方面和/或优点,还有一部分通过描述将是清楚的,或者可以经过本专利技术的实施而得知。附图说明通过下面结合附图进行的详细描述,本专利技术的上述和/或其它目的、特点和优点将会变得更加清楚,其中图I是示出根据本专利技术的示例性实施例的语音处理系统的框图;图2是示出根据本专利技术的示例性实施例的语音处理方法的流程图;图3是示出根据本专利技术的另一示例性实施例的语音模板生成方法的流程图;图4是示出根据本专利技术的又一示例性实施例的语音模板生成方法的流程图。具体实施例方式以下,将参照附图更充分地描述本专利技术的示例性实施例,示例性实施例在附图中示出。然而,可以以许多不同的形式实施示例性实施例,并且不应被解释为局限于在此阐述的示例性实施例。相反,提供这些实施例从而本公开将会彻底和完整,并将完全地将示例性实施例的范围传达给本领域的技术人员。在附图中,相同的标号表示相同的部分。图I是示出根据本专利技术的示例性实施例的语音处理系统100的框图。参照图1,根据本专利技术的示例性实施例的语音处理系统100包括语音特性参数获取模块120、语音模版生成模块130以及语音处理模块140。参照图1,语音特性参数获取模块120可用于获取表现至少一种语音特性(例如,语音的音量、音调以及音色特性等)的语音特性参数。仅作为示例,下面将描述使用PCM流格式的语音音频信号(以下,简称为“PCM音频信号”)来获取表现音量、音调和音色特性中的至少一种语音特性的语音特性参数的方法。音量是指人耳对所听到的声音大小强弱的主观感受,其客观评价尺度是声音的幅度大小。因此可使用PCM音频信号的幅度来表现语音的音量大小。音调通常指具有特定且稳定音高的信号,是声音听起来调子的高低,主要取决于频率。频率高的声音人耳的反应是音调高,频率低的声音人耳的反应是音调低。音调主要由声音的基频决定,因此,可以通过提取PCM音频信号的基音的频率(即,基频)和幅度来获取音调参数。音色是声音的特色,每一个人的语音有不同的音色,因此可以根据其音色辨别出不同的人,音色的不同取决于不同的泛音,在每一种乐器、不同的人以及所有能发声的物体发出的声音中,除了一个基音外,还有许多不同频率的泛音伴随,正是这些泛音的频率和幅度的不同组合决定了不同的音色。因此,可通过提取音频信号的预定数量的泛音的频率和幅度来获取音色特性参数。 常用的语音特性还可以概括为基音、共振峰、线性预测倒谱系数、Mel频率倒谱系数等数字参数,通过目前现有的一些主流技术,如基于LPCC的特征提取技术、基于MFCC的特征提取技术、短时傅里叶变换(处理平稳信号的传统方法)技术,可获取表现语音特性的至少一个以下参数表现音量特性的音量大小参数、表现音调特性的基音的频率和幅度参数、表现音色特性的预定数量的泛音的频率和幅度参数。在提取操作完成之后,语音特性参数获取模块120可将获取的语音特性参数发送到语音模板生成模块130以生成语音模板,或者保留所述参数,以利用这些参数随后对该语音进行处理。语音模版生成模块130根据从语音特性参数获取模块120获得的多个语音特性参数来生成语音模版,并将生成的语音模版存储在存储模块150中,其中,所述语音模版是指表现特定语音的多种语音特性的语音特性参数的集合,所述语音特性可包括,但不限于,音量、音色和音调特性中的至少一个。可选择地,根据另一实施例,语音模版生成模块130也可直接将生成的语音模板输入到语音处理模块140来对一语音进行处理。此外,还可通过语音特性参数获取模块120按照形成语音模板所需的各种参数来直接设置各个语音特性参数,并将设置的语音特性参数传递到语音模板生成模块130,以生成自定义的语音模版。本文档来自技高网...

【技术保护点】
一种语音处理系统,所述系统包括:语音特性参数获取模块,用于获取表现第一语音和第二语音的语音特性的语音特性参数;语音模版生成模块,用于将第一语音的语音特性参数生成为语音模版;语音处理模块,用于根据语音模板调整第二语音的语音特性参数,并将调整后的语音特性参数应用于第二语音。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈晓晓李远友向春
申请(专利权)人:三星电子中国研发中心三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1