一种基于语音转译电文输出的方法技术

技术编号:9795149 阅读:158 留言:0更新日期:2014-03-21 22:39
本发明专利技术涉及一种基于语音转译电文输出的方法,其特征在于将语音原音依次经原音存储、原音校正、标音存储、音文转换、译文存储和电文存储步骤,从而实现将语音原音转译成电文信号输出。本发明专利技术既可对输入语音原音中的方言等进行自动校正,又可根据语音的停顿、语调升降等自动判断出对应的译文内容中应有的标点符号,直至进行段句修饰形成标准电文,从而进一步实现将电文打印输出或实现电文与原音同步视听。本发明专利技术既适用于普通电话机、多媒体电话机、IP电话的音文转译通信,也适用于收音机、录音机、录音笔、收录机、翻译机等需要实施音文转换的终端设备。

【技术实现步骤摘要】

本专利技术属于语音翻译
,特别是涉及。
技术介绍
随着现代通信技术、数字技术、软件技术的不断进步,通讯设备及通信终端越来越向着多元化、个性化和高端化方向发展,以方便使用者操作和使用的多功能通信设备和通讯终端越来越受到大众的青睐,特别是在现代专网通信、局域网通信以及办公自动化应用领域中,对开发具有语音通信实时自动转译电文通信功能的终端设备提出了很高的期待,但目前还基本处于空白状态。美国苹果公司早于2006年2月向美国专利和商标局递交了描述“一种高级文字转换为语音功能”的专利申请,虽然其Mac OS X已经配备文字-语音转换功能,但是机器生成的语音质量不高。同时,苹果公司的另一项“多单元文本-语音合成方法”的专利申请,其描述了一个接收输入字符串匹配的单位,包括如短语和单词之间的衔接关系的音频片段库过程的元数据,使得机器的发音更贴近人类的现实语音。现有大多数的转换技术其研究方向,都是利用文字向语音的转换。目前在利用语音转换文字的技术应用方面,安卓手机系统中有使语音转译成文字短信的手机、汉王手写板中有使用语音输入得到文字输出的功能等。但这些产品都还存在着明显不足:一是仅能发短信短语,语音转译文字受到短信字数等条件的限制无法连续进行;二是语音识别的准确率低,方言或不标准发音将造成错误的转换;三是标点符号、断句无法体现;四是无文字打印输出功能等。中国专利申请200710124172.X公开了 “一种语音编辑短信息的方法及手机装置”,它由中央处理器控制,具有将麦克风把声音转化为语音信号、语音信号转化为短信息的文字信号以及文字信号传输给显示屏显示的功能,但该方法还存在以下明显不足:一是仅能够发送属于短信短语的简单句,不适用于发送连续长句;二是无断句修饰功能,无法形成连续长句的电文;三是应用对象仅限于手机,适用的范围很小。目前在普通电话机、多媒体电话机、IP电话通信等使用环境中,尚未出现具有商品化价值的利用语音转译电文功能的产品。如何克服现有技术的不足已成为当今语音翻译
中亟待解决的重大难题之一。
技术实现思路
本专利技术的目的是为克服现有技术的不足而提供,本专利技术既可对输入语音原音中的方言等不标准音进行自动校正,又可根据语音的停顿、语调升降等自动判断出对应的译文内容中应有的标点符号,直至进行段句修饰形成标准电文,从而进一步实现将电文打印输出或实现电文与原音同步视听。根据本专利技术提出的,其特征在于将语音原音依次经原音存储、原音校正、标音存储、音文转换、译文存储和电文存储步骤,从而实现将语音原音转译成电文信息输出,具体步骤如下: 步骤一,原音存储:将语音原音经受话器转换为音频信号,该音频信号的一路经音频放大器输出用于语音原音比对,另一路经音频编解码器将模拟信号转数字信号并存储于原音存储模块以供原音校正; 步骤二,原音校正:在由同音翻译模块与原音校正模块组成的同音翻译功能块区,将语音原音音频信号通过同音翻译模块校正,转换为原音校正信号并存储于原音校正模块;步骤三,标音存储:在由标音修饰模块与标音存储模块组成的标音修饰功能块区,将原音校正信号通过标音修饰模块修饰,形成原音的标音音频信号并存储于标音存储模块;步骤四,音文转译:在由音文交换模块与音文转译模块组成的音文交换功能块区,将标音音频信号通过音文交换模块译制,形成音转译文信号并存储于音文转译模块; 步骤五,译文存储:在由段句修饰模块与译文存储模块组成的段句修饰功能块区,将译文信号通过段句修饰模块校正,形成译文并存储于译文存储模块; 步骤六,电文存储:将段句修饰后的译文信号作为电文信号存储于电文存储模块,以提供电文输出或电文与语音原音同步视听输出; 其中:步骤二所述同音翻译功能块区、步骤三所述标音修饰功能块区、步骤四所述音文交换功能块区和步骤五所述段句修饰功能块区依次信号连接并通过DSP芯片集成,同时与时钟源、CPU、缓冲存储模块以及标准音库和标准文库存储单元协同进行信号处理;其中:所述时钟源与DSP芯片连接; 所述CPU分别与同音翻译功能块区、标音修饰功能块区、音文转换功能块区和段句修饰功能块区连接;所述CPU还分别与缓冲存储模块连接、标准音库和标准文库存储单元连接以及电文输出接口连接; 所述同音翻译功能块区、标音修饰功能块区、音文转换功能块区和段句修饰功能块区分别与缓冲存储模块信号连接。本专利技术与现有技术相比其显著优点在于:一是本专利技术采用DSP芯片集成技术与CPU微处理器技术相结合,确保整机功能模块能够发挥综合协同作用;二是实现了对语音原音输入中的方言等不标准音的自动校正,使得转译成电文内容的准确度大大提升;三是本专利技术可根据语音原音编码后得到的涉及停顿、语调升降等语音信号数据,自动判断出对应的译文内容中应有的标点符号,对段句进行修饰,以至形成标准电文;四是本专利技术采用音文转译的音文交换模块,大大提高了对数据的处理能力,内容的转译不受文字长度的限制;五是本专利技术形成的电文既可供打印输出,也可供电文显示与语音原音录音同步比对视听,确保语音原音转译电文内容的正确性。本专利技术既适用于普通电话机、多媒体电话机、IP电话的音文转译通信,也可适用于收音机、录音机、录音笔、收录机、翻译机等需要音文转换的终端设备。【附图说明】图1为本专利技术提出的一种基于语音转译电文输出方法的信号流程方框示意图。图2为本专利技术提出的一种基于语音转译电文输出方法的原理逻辑方框示意图。图3为本专利技术应用于一种带有电话转译电文功能的电话机的模块结构方框示意图。【具体实施方式】下面结合附图和实施例对本专利技术的【具体实施方式】作进一步的详细说明。结合图1,本专利技术提出的,是由语音原音依次经原音存储、原音校正、标音存储、音文转换、译文存储和电文存储步骤,从而实现将语音原音转译成电文信息输出,具体步骤如下: 步骤一,原音存储:将语音原音经受话器转换为音频信号,该音频信号的一路经音频放大器输出用于语音原音比对,另一路经音频编解码器将模拟信号转数字信号并存储于原音存储模块以供原音校正; 步骤二,原音校正:在由同音翻译模块与原音校正模块组成的同音翻译功能块区,将语音原音音频信号通过同音翻译模块校正,转换为原音校正信号并存储于原音校正模块;其中:同音翻译校正是指利用普通话发音的标准音库,比对并校正原音音频信号中可能出现的非普通话或方言发音等特殊音节,进而确保语音转换的准确性; 步骤三,标音存储:在由标音修饰模块与标音存储模块组成的标音修饰功能块区,将原音校正信号通过标音修饰模块修饰,形成原音的标音音频信号并存储于标音存储模块;其中:标音修饰是指采用标准语音的停顿频率、停顿时间长短来判断和修饰校正后的原音的逗号或句号;同时,采用标准语音语气的升降调来判断和修饰校正后的原音的问号或感叹号; 步骤四,音文转译:在由音文交换模块与音文转译模块组成的音文交换功能块区,将标音音频信号通过音文交换模块译制,形成音转译文信号并存储于音文转译模块;其中:音文交换模块可将标音音频信号实时转译译文信号的处理,解决了现有技术中实施音文转译受限于文字个数长短的问题; 步骤五,译文存储:在由段句修饰模块与译文存储模块组成的段句修饰功能块区,将译文信号通过段句修饰模块校正,形成译文并存储于译文存储模块;段句修饰是指将标本文档来自技高网
...

【技术保护点】
一种基于语音转译电文输出的方法,其特征在于将语音原音依次经原音存储、原音校正、标音存储、音转译文、译文存储和电文存储步骤,从而实现将语音原音转译成电文信息输出,具体步骤如下:步骤一,原音存储:将语音原音经受话器转换为音频信号,该音频信号的一路经音频放大器输出用于语音原音比对,另一路经音频编解码器将模拟信号转数字信号并存储于原音存储模块以供原音校正;步骤二,原音校正:在由同音翻译模块与原音校正模块组成的同音翻译功能块区,将语音原音音频信号通过同音翻译模块校正,转换为原音校正信号并存储于原音校正模块;步骤三,标音存储:在由标音修饰模块与标音存储模块组成的标音修饰功能块区,将原音校正信号通过标音修饰模块修饰,形成原音的标音音频信号并存储于标音存储模块;步骤四,音文转译:在由音文交换模块与音文转译模块组成的音文交换功能块区,将标音音频信号通过音文交换模块译制,形成音转译文信号并存储于音文转译模块;步骤五,译文存储:在由段句修饰模块与译文存储模块组成的段句修饰功能块区,将译文信号通过段句修饰模块校正,形成译文并存储于译文存储模块;?步骤六,电文存储:将段句修饰后的译文信号作为电文信号存储于电文存储模块,以提供电文输出或电文与语音原音同步视听输出;其中:步骤二所述同音翻译功能块区、步骤三所述标音修饰功能块区、步骤四所述音文交换功能块区和步骤五所述段句修饰功能块区依次信号连接并通过DSP芯片集成,同时与时钟源、CPU、缓冲存储模块以及标准音库和标准文库存储单元协同进行信号处理;其中:所述时钟源与DSP芯片连接;所述CPU分别与同音翻译功能块区、标音修饰功能块区、音文转换功能块区和段句修饰功能块区连接;所述CPU还分别与缓冲存储模块连接、标准音库和标准文库存储单元连接以及电文输出接口连接;所述同音翻译功能块区、标音修饰功能块区、音文转换功能块区和段句修饰功能块区分别与缓冲存储模块信号连接。...

【技术特征摘要】
1.一种基于语音转译电文输出的方法,其特征在于将语音原音依次经原音存储、原音校正、标音存储、音转译文、译文存储和电文存储步骤,从而实现将语音原音转译成电文信息输出,具体步骤如下: 步骤一,原音存储:将语音原音经受话器转换为音频信号,该音频信号的一路经音频放大器输出用于语音原音比对,另一路经音频编解码器将模拟信号转数字信号并存储于原音存储模块以供原音校正; 步骤二,原音校正:在由同音翻译模块与原音校正模块组成的同音翻译功能块区,将语音原音音频信号通过同音翻译模块校正,转换为原音校正信号并存储于原音校正模块;步骤三,标音存储:在由标音修饰模块与标音存储模块组成的标音修饰功能块区,将原音校正信号通过标音修饰模块修饰,形成原音的标音音频信号并存储于标音存储模块;步骤四,音文转译:在由音文交换模块与音文转译模块组成的音文交换功能块区,将标音音频信号通过音文交换模块译制,形成音转译文信号并存储于音文转译模块; 步骤五,译文存储:在由段句修饰模块与译文存储模块组成的段句修饰功能块区,将译文信号通过段句修饰模块校正,形成译文并存储于译文存储模块; 步骤六,电文存储:将段句修饰后的译文信号作为电文信号存储于电文存储模块,以提供电文输出或电文与语音原音同步视听输出; 其中:步骤二所述同音翻译功能块区、步骤三所述标音修饰功能块区、步骤四所述音文交换功能块区和步骤五所述段句修饰功能块区依次...

【专利技术属性】
技术研发人员:谢作龙吴传信谢作健李建华张进蔡冬冬张宝富方涛周华经继松
申请(专利权)人:南京丰泰通信技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1