当前位置: 首页 > 专利查询>孔繁泽专利>正文

语言语义的音频交换方法和音频交换系统技术方案

技术编号:19062150 阅读:21 留言:0更新日期:2018-09-29 13:15
本发明专利技术的语言语义的音频交换方法、系统和音频编码图形,以解决现有技术中语言互译时因语义复杂导致数据响应出现差错和实时性差的技术问题。方法包括利用最小音素序列形成各语言的语音映射结构,通过各语音映射结构完成语义的语言间转换。利用语言构成中形成音频最小短段的最小音素作为各语言间语义转换的基本数据交换单元,利用最小音素作为数据交换的编码基础,改变了语音识别的基础结构,优化了语言中音频内容的编码复杂性和准确率,使得语言音频的编码过程中避免被耦合了语言片段中音调、音阶、音域等复合信息形成的复杂音频特征,保证了语音识别率。利用最小音素形成的语音编码与文字编码的映射结构使得语言翻译时的数据交换效率得到提高。

【技术实现步骤摘要】
语言语义的音频交换方法和音频交换系统、编码图形
本专利技术涉及信息交换领域,具体涉及一种语言语义的音频交换方法和音频交换系统、编码图形。
技术介绍
目前的语言翻译主要由语音识别、语义分析和语句合成几部分组成,语音识别采用高灵敏度传感器,从初始语言的频域或时域语音信号流中提取与语句中文字相应的音频信号集合,语义分析利用隐马尔可夫模型(HMM)、自学习模型、人工神经网络(ANN)等模型对音频信号集合中的文字序列和语义含义进行识别和量化以尽可能确定表达内容,语句合成根据表达内容的识别和量化数据形成目标语言的音频信号集合或文字序列集合。在这一过程中受语义分析模型复杂度的影响需要海量的计算资源,对于移动终端的应用需要采用分布式的计算架构,利用互联网的可靠带宽接入服务端的计算资源,因此翻译的实时性和准确性受到限制。在专利文献CN104637482B中,公开了一种利用数字编码实现语音向文字转换的装置,其中利用音素存储单元存储第一语言音素特征数据;利用音素转换单元将接收的音素信号序列通过第一语言音素特征数据转换为第一语言音素;利用数字编码单元为第一语言音素进行唯一编码,形成第一语言音素编码序列;利用第一语言音素编码序列形成第一语言的字发音编码序列和词汇发音编码序列;利用字词存储单元存储第一语言的字、词汇或图形及所对应的编码序列;利用字词转换单元根据编码序列的对应关系生成第一语言的字、词汇、图形和/或其组合。该装置说明字词和语音间存在编码映射的基础。如何利用编码映射基础降低语言间相同语义的图文音频转换的资源消耗需要创造性改进。
技术实现思路
有鉴于此,本专利技术实施例致力于提供一种语言语义的音频交换方法和音频交换系统,以解决现有技术中语言互译时语义复杂导致数据响应和实时性差的技术问题。本专利技术实施例的语言语义的音频交换方法,利用最小音素序列形成各语言的语音映射结构,通过各语音映射结构完成语义的语言间转换。本专利技术实施例的语言语义的音频交换系统,其特征在于,包括:存储器,用于存储上述的语言语义的音频交换方法的程序代码;处理器,用于运行所述程序代码。本专利技术实施例的语言语义的音频交换系统,用于利用最小音素序列形成各语言的语音映射结构,通过各语音映射结构完成语义的语言间转换。本专利技术实施例的基本语音编码图形,用于语言音素的图形化显示,包括基本框架,所述基本框架包括并列的第一适配柱、第二适配柱和适配杆,所述第一适配柱和所述第二适配柱分别设置适配位组,所述适配位组包括若干适配位,所述适配杆的两端各自连接一个适配柱的一个所述适配位。本专利技术实施例的语言语义的音频交换方法和音频交换系统、编码图形利用语言构成中形成音频最小短段的最小音素作为各语言间语义转换的基本数据交换单元,利用最小音素作为数据交换的编码基础,改变了语音识别的基础结构,简化了语言中音频内容的编码长度和编码效率,使得语言翻译时的数据交换效率得到优化,对降低远端数据实时响应时延,提高基础数据结构和基础数据在本地移动端的存储容量具有积极影响。附图说明图1所示为本专利技术一实施例语言语义的音频交换方法的数据处理过程示意图。图2所示为本专利技术一实施例语言语义的音频交换方法的编码过程示意图。图3所示为本专利技术一实施例语言语义的音频交换方法的语音映射结构示意图。图4所示为本专利技术一实施例语言语义的音频交换方法的语音映射结构示意图。图5所示为本专利技术一实施例语言语义的音频交换方法进行语言转换的示意图。图6所示为本专利技术一实施例语言语义的音频交换系统的架构示意图。图7所示为本专利技术实施例语言语义的音频交换方法中一种基本语音编码图形的图形结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例的语言语义的音频交换方法,包括:利用最小音素序列形成各语言的语音映射结构,通过各语音映射结构完成语义的语言间转换。语言间相同语义的表达在图文和发音上存在实质差异,语义转换是指相同语义的不同图文和发音表达形式的转换。地域性的通用语言表达语义的文字(作为图形符号的一种)的发音具有确定性,词汇和语句的发音规律可以归纳为音节的不同组合。而采用一组基本的最小音素构成每个音节可以利用最小音素的低信号载荷特点排除音频冗余信号和干扰信息,为复杂数据交换提供更精简的编码基础,降低编码长度。根据本领域技术人员对各地域性的通用语言的统计比对,作为发音基本要素的最小音素数量和其音频特征可以确定,数量小于1000个,世界7000左右种语言中共计800个左右不重复的最小音素,其中每种西方语言大约使用40个左右最小音素,汉语不超过150个左右最小音素,完全可以采用百位数值范围或千位数值范围的定长编码建立索引例如是十进制三位数或四位数,例如是二进制10位数或20位数。本专利技术实施例的语言语义的音频交换方法利用语言构成中形成音频最小短段的最小音素作为各语言间语义转换的基本数据交换单元,利用最小音素作为数据交换的编码基础,改变了语音识别的基础结构,简化了语言中音频内容的编码长度和编码效率,使得语言音频的编码过程中避免被耦合了语言片段中音调、音阶、音域等复合信息形成的复杂音频特征,保证了语音识别率,利用最小音素形成的语音编码与文字编码的映射结构使得语言翻译时的数据交换效率得到优化。对降低远端数据实时响应时延,提高基础数据结构和基础数据在本地移动端的存储容量具有积极影响。图1为本专利技术一实施例语言语义的音频交换方法的数据处理过程示意图。如图1所示,包括:步骤100:序列化所有最小音素。序列化过程可以包括对语言中音节、音素、音阶、语调的识别,对识别的音节、音素、音阶、语调的定量数学描述,如时域或频域的音频特征数据,对定量数学描述数据的结构化存储,如逐个编码形成索引。步骤200:通过所有最小音素的子集形成各语言的文字语音间映射数据。每种语言的发音基础由一个所有最小音素的子集确定,通过子集中最小音素的组合形成一种语言中文字发音的语音标识,进而利用语音标识形成文字与语音标识间对应结构的映射数据,映射数据包括存储数据的数据结构。映射数据可以包括文字与语音间的映射数据、以及语音间的映射数据。步骤300:通过语言语义形成各语言的语音间映射数据。利用语义的客观性建立语言间对应含义的语音的映射数据,映射数据包括存储数据的数据结构。也可以包括文字与语音间的映射数据步骤400:利用对应的语音间映射数据和文字语音间映射数据形成语义的语言转换。本专利技术实施例的语言语义的音频交换方法通过文字语音间映射数据保证了一种语言的文字-语音转换的连贯性和正确性,语音间映射数据与文字语音间映射数据的结合使得语言间的转换多样性可以在保证语言间的转换质量的同时实现转换过程中较高的语言基础数据交互效率。同时通过语音间映射数据与文字语音间映射数据的映射变化可以形成进一步的加密效果。图2为本专利技术一实施例语言语义的音频交换方法的编码过程示意图。如图2所示,在上述实施例基础上,步骤100包括:步骤110:通过语音识别采集各通用语言的最小音素。基于人类生理特征和语言演进,语言的语音可以分解本文档来自技高网...

【技术保护点】
1.一种语言语义的音频交换方法,其特征在于,利用最小音素序列形成各语言的语音映射结构,通过各语音映射结构完成语义的语言间转换。

【技术特征摘要】
1.一种语言语义的音频交换方法,其特征在于,利用最小音素序列形成各语言的语音映射结构,通过各语音映射结构完成语义的语言间转换。2.根据权利要求1所述的语言语义的音频交换方法,其特征在于,所述利用最小音素序列形成各语言的语音映射结构包括:序列化所有最小音素;通过所述所有最小音素的子集形成所述各语言的文字语音间映射数据;通过语言语义形成所述各语言的语音间映射数据。3.根据权利要求2所述的语言语义的音频交换方法,其特征在于,所述通过各语音映射结构完成语义的语言间转换包括:利用对应的所述语音间映射数据和所述文字语音间映射数据形成语义的语言转换。4.根据权利要求2或3所述的语言语义的音频交换方法,其特征在于,所述序列化所有最小音素包括:通过语音识别采集各通用语言的所述最小音素;将所述最小音素形成统一音素序列。5.根据权利要求4所述的语言语义的音频交换方法,其特征在于,所述通过所述所有最小音素的子集形成所述各语言的文字语音间映射数据包括:利用所述统一音素序列中一部分音素形成与第一语言中单字或单词的发音对应的第一基本语音编码序列;利用所述第一基本语音编码序列形成与第一语言中短语或语句发音对应的第一语音映射结构:利用所述统一音素序列中另一部分音素形成第二语言中单字或单词发音的第二基本语音编码序列;利用所述第二基本语音编码序列形成与第二语言中短语或语句发音对应的第二语音映射结构。6.根据权利要求5所述的语言语义的音频交换方法,其特征在于,所述通过语言语义形成所述各语言的语音间映射数据包括:利用相同或相近的语义信息通过所述第一语言和...

【专利技术属性】
技术研发人员:孔繁泽
申请(专利权)人:孔繁泽
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1