当前位置: 首页 > 专利查询>复旦大学专利>正文

一种基于文本、音频两种模态的语义通信传输方法技术

技术编号:40946007 阅读:22 留言:0更新日期:2024-04-18 15:04
本发明专利技术属于语义通信技术领域,具体为一种基于文本、音频两种模态的语义通信传输方法。本发明专利技术将深度学习与语义通信相结合,包含构建深度学习网络,深度学习网络包括:文本语义特征提取模块、音频特征信息提取模块以及语音合成模块;原始语音信号通过文本语义特征提取模块得到原始语音信号的文本描述;由音频特征信息提取模块得到原始语音信号的音频信息包括持续时间、音高和功率信息;两种数据信息整合后进行信源信道联合编码并送到接收方;接收方经过解码得到文本描述和语音信息,通过语音合成模块生成符合要求的语音信号。本发明专利技术可显著降低信道资源开销,提高传输效率,极大地提升语音通信的交流质量和用户体验。

【技术实现步骤摘要】

本专利技术属于语义通信,具体涉及基于文本、音频两种模态的语义通信传输方法


技术介绍

1、近年来随着通信需求不断增加,无线数据流量急剧增长,对当前的通信基础设施造成了沉重的负担。基于语义的通信是下一代通信的有前途的技术之一,因为它极大地提高了传输效率。传统通信系统专注于传输符号,而忽略语义内容,而语义通信则专注于从源收集语义信息,并在接收端恢复相同的语义信息。

2、随着计算机技术和信息技术的迅猛发展,未来有望进入一个广泛连接的时代,即使在语音信号领域。随着越来越多的应用和设备融入语音信号网络,与云端的实时交互也将引发数据量的爆炸性增长。因此,对现有的基于语音信号通信传输技术进行改进变得尤为迫切。


技术实现思路

1、本专利技术的目的在于提供一种基于文本、音频两种模态的高效语义通信传输方法,以满足不断扩大的语音信号网络需求。

2、本专利技术提供的基于文本、音频两种模态的高效语义通信传输方法,是将文本语义特征提取、音频特征信息提取和语音合成等深度学习网络与通信传输相结合,实现语义的高效传输;本文档来自技高网...

【技术保护点】

1.一种基于文本、音频两种模态的语义通信传输方法,其特征在于,是将深度学习与语义通信相结合,实现语义的高效传输;包含构建深度学习网络,深度学习网络包括:文本语义特征提取模块,音频特征信息提取模块以及语音合成模块;所述语义通信传输方法的具体步骤如下:

2.根据权利要求1所述的语义通信传输方法,其特征在于,接收方在基于解码得到文本描述和语音信息来合成符合要求的语音信号时,通过文本描述与语音信息的对齐,使得合成后得语音信号,更加接近原始语音信号得持续时间、音高和功率信息。

3.根据权利要求1所述的语义通信传输方法,其特征在于,接收方每生成一次语音信号,都会衡量该生成语音...

【技术特征摘要】

1.一种基于文本、音频两种模态的语义通信传输方法,其特征在于,是将深度学习与语义通信相结合,实现语义的高效传输;包含构建深度学习网络,深度学习网络包括:文本语义特征提取模块,音频特征信息提取模块以及语音合成模块;所述语义通信传输方法的具体步骤如下:

2.根据权利要求1所述的语义通信传输方法,其特征在于,接收方在基于解码得到文本描述和语音信息来合成符合要求的语音信号时,通过文本描述与语音信息的对齐,使得合成后得语音信号,更加接近原始语音信号得持续时间、音高和功率信息。

3.根据权利要求1所述的语义通信传输方法,其特征在于,接收方每生成一次语音信号,都会衡量该生成语音信号是否达到的质量标准,当语音信号没有达到预期的质量标准时,接收方在此基础上再次生成,直到达到质量标准为止,该质量标准根据传输要求预先设定。

4.根据权利要求1所述的语义通信传输方法,其特征在于,生成的语音信号的质量衡量方法,是将语音信号用与发送方一致的语音信号重构模块转化为文本,计算该文本与接收方解码得到的文本的语义相似度,相似度越大说明语音信号越符合文本条件。

5.根据权利要求1所述的语义通信传输方法,其特征在于,所述文本语义特征提取模块包含vgg层、blstm层、注意力机制模块;所述vgg是由16个卷积层构成的卷积神经网络;所述blstm是用于处理序列数据包括语音、文本的循环神经网络;所述注意力机制模块是通过计算注意力分数,使系统能够更加关注输入语音...

【专利技术属性】
技术研发人员:邱世英胡蝶
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1