语音信号传输方法及系统技术方案

技术编号:9490800 阅读:119 留言:0更新日期:2013-12-26 00:34
本发明专利技术公开了一种语音信号传输方法及系统,该方法包括:确定待发送的连续语音信号对应的文本内容;根据所述文本内容及所述连续语音信号确定各合成单元的语音合成参数模型;拼接各合成单元的语音合成参数模型得到语音合成参数模型序列;确定所述语音合成参数模型序列对应的序号串;将所述序号串发送给接收端,以使所述接收端根据所述序号串恢复所述连续语音信号。利用本发明专利技术,可以在保证语音恢复音质损失最小化的前提下实现极低码流率的信号传输。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种语音信号传输方法及系统,该方法包括:确定待发送的连续语音信号对应的文本内容;根据所述文本内容及所述连续语音信号确定各合成单元的语音合成参数模型;拼接各合成单元的语音合成参数模型得到语音合成参数模型序列;确定所述语音合成参数模型序列对应的序号串;将所述序号串发送给接收端,以使所述接收端根据所述序号串恢复所述连续语音信号。利用本专利技术,可以在保证语音恢复音质损失最小化的前提下实现极低码流率的信号传输。【专利说明】语音信号传输方法及系统
本专利技术涉及信号传输
,具体涉及一种语音信号传输方法及系统。
技术介绍
随着互联网的普及和便携式设备的推广,各种基于手持设备的聊天软件应运而生。语音交互的自然人性化是其他交互手段无法超越的,特别是在不利于手写按键输入的手持小屏设备应用上。对此很多产品都支持语音交互功能,将某终端接收到的语音信号传输至目的端,如腾讯推出的微讯产品即支持VoiceMessage的语音消息传输功能。然而直接传输的语音信号数据量往往极大,在互联网或通讯网等按流量收费的信道中给用户带来了较大的经济负担。显然如何在不影响语音质量的前提下尽可能压缩传送的数据量是提高语音信号传输应用价值的前提条件。针对语音信号传输的问题,研究人员尝试了多种语音编码方法,对语音信号进行数字量化和压缩传输,在提高语音信号的恢复话质条件下降低编码码率并提升传输效率。目前常用的语音信号压缩方法有波形编码和参数编码等。其中:波形编码是将时域的模拟信号波形经过取样、量化、编码,形成数字信号,这种编码方式具有适应能力强、话音质量高的优点。但由于需要保持恢复原有语音信号的波形形状,这种方案码流率要求较高,在高于16kb/s才能取得较好的音质。参数编码即从原始语音信号中提取表征语音发音特征的参量,并对该特征参量进行编码。这种方案的目标在于保持原始语音的语意,保证可懂度。其优点在于码流率较低,但恢复音质受损较多。在传统的语音通信时代,往往采用时间计费方式,编码方法主要考量算法延时和通信质量;而在移动互联时代,语音作为数据信号的一种,通常使用流量来收取费用,编码语音码流率的高低将直接影响用户使用的花费。此外,传统电话信道语音只使用8k采样率,属于窄带语音,音质受损且存在上限。显然如果继续使用传统编码方式处理宽带或超宽带语音,需要增加码流率,成倍提升流量消耗。
技术实现思路
本专利技术实施例提供一种语音信号传输方法及系统,在保证语音恢复音质损失最小化的前提下实现极低码流率的信号传输。本专利技术实施例提供一种语音信号传输方法,包括:确定待发送的连续语音信号对应的文本内容;根据所述文本内容及所述连续语音信号确定各合成单元的语音合成参数模型;拼接各合成单元的语音合成参数模型得到语音合成参数模型序列;确定所述语音合成参数模型序列对应的序号串;将所述序号串发送给接收端,以使所述接收端根据所述序号串恢复所述连续语音信号。本专利技术实施例还提供一种语音信号传输系统,包括:文本获取模块,用于确定待发送的连续语音信号对应的文本内容;参数模型确定模块,用于根据所述文本内容及所述连续语音信号确定各合成单元的语音合成参数模型;拼接模块,用于拼接各合成单元的语音合成参数模型得到语音合成参数模型序列;序号串确定模块,用于确定所述语音合成参数模型序列对应的序号串;发送模块,用于将所述序号串发送给接收端,以使所述接收端根据所述序号串恢复所述连续语音信号。本专利技术实施例提供的语音信号传输方法及系统,采用统计分析模型编码,其处理方式与语音采样率无关,在保证语音恢复音质损失最小化的前提下极大地降低了传输码流率,减少了流量消耗,解决了传统语音编码方法不能兼顾音质和流量的问题,改善了移动网络时代下用户通信需求体验。【专利附图】【附图说明】为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1是本专利技术实施例语音信号传输方法的流程图;图2是本专利技术实施例中确定各合成单元的语音合成参数模型的一种流程图;图3是本专利技术实施例中二叉决策树的构建流程图;图4是本专利技术实施例中一种二叉决策树的示意图;图5是本专利技术实施例中对初始基频模型进行联合优化的流程图;图6是本专利技术实施例语音信号传输系统的结构示意图;图7是本专利技术实施例中参数模型确定模块的一种结构示意图;图8是本专利技术实施例中语音信号发送系统中二叉决策树构建模块的结构示意图;图9是本专利技术实施例中第一优化单元的结构示意图;图10是本专利技术实施例中第二优化单元的结构示意图。【具体实施方式】为了使本
的人员更好地理解本专利技术实施例的方案,下面结合附图和实施方式对本专利技术实施例作进一步的详细说明。针对传统编码方式处理宽带或超宽带语音,需要增加码流率,流量消耗大的问题,本专利技术实施例提供一种语音信号传输方法及系统,适用于各类语音(如16KHz采样率的超宽带语音、SKHz采样率的窄带语音等)的编码,在保证语音恢复音质损失最小化的前提下,实现极低码流率的信号传输。如图1所示,是本专利技术实施例语音信号发送方法的流程图,包括以下步骤:步骤101,确定待发送的连续语音信号对应的文本内容。具体地,可以通过语音识别算法自动获取所述文本内容,当然也可以通过人工标注的方式来获取所述文本内容。另外,为了进一步保证语音识别得到的文本内容的正确性,还可以对语音识别得到的文本内容进行人工编辑修正。步骤102,根据所述文本内容及所述连续语音信号确定各合成单元的语音合成参数模型。所述合成单元是预先设定的最小合成对象,如音节单元、音素单元,甚至是音素HMM模型中的状态单元等。为了尽量减少接收端恢复音质的损失,使接收端能够通过语音合成方式恢复连续语音信号,发送端从原始语音信号中获取的语音合成参数模型应尽可能符合原语音信号特点,以减少信号压缩和恢复的损失。具体地,可以根据所述文本内容对连续语音信号进行语音片断切分,得到各合成单元对应的语音片断,进而得到各合成单元对应的时长、初始化语音合成参数模型,然后利用采集的语音信号对初始化语音合成参数模型进行联合优化,具体过程将在后面详细描述。步骤103,拼接各合成单元的语音合成参数模型得到语音合成参数模型序列。步骤104,确定所述语音合成参数模型序列对应的序号串。步骤105,将所述序号串发送给接收端,以使所述接收端根据所述序号串恢复所述连续语音信号。相应地,接收方接收到发送方发送的序号串后,可以根据所述序号串从码本中获取语音合成参数模型序列。由于每个语音合成参数模型都有一个唯一的序号,而且,在发送方和接收方都保存有相同的码本,所述码本中包含了所有语音合成参数模型。因此,接收方接收到所述序号串后,根据所述序号串即可从码本中获取对应各序号的语音合成参数模型,拼接这些语音合成参数模型得到所述语音合成参数模型序列。然后,根据所述语音合成参数模型序列确定语音合成参数序列,通过语音合成方式恢复语音信号。本专利技术实施例语音信号传输方法,采用统计分析模型编码,其处理方式与语音采样率无关,对16kHz超宽带语音编码无需付出额外码流率代价,其音质效果好,编码流量低。以一段典型的本文档来自技高网
...

【技术保护点】
一种语音信号传输方法,其特征在于,包括:确定待发送的连续语音信号对应的文本内容;根据所述文本内容及所述连续语音信号确定各合成单元的语音合成参数模型;拼接各合成单元的语音合成参数模型得到语音合成参数模型序列;确定所述语音合成参数模型序列对应的序号串;将所述序号串发送给接收端,以使所述接收端根据所述序号串恢复所述连续语音信号。

【技术特征摘要】

【专利技术属性】
技术研发人员:江源周明凌震华何婷婷胡国平胡郁刘庆峰
申请(专利权)人:安徽科大讯飞信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1