一种维、汉双语GSM短信息语音转换播发系统技术方案

技术编号:14824239 阅读:27 留言:0更新日期:2017-03-16 12:31
本发明专利技术公开的是一种维、汉双语GSM短信息语音转换播发系统,分为软件系统和硬件系统两个组成部分;所述软件系统功能分为短信接收模块、文本预处理模块、语料库构建模块、波形拼接合成模块四部分;所述的硬件系统为:使用cortex M3内核的ARM处理器作为控制单元、使用SIM900A GSM模块作为短信接收及语音传输单元。本发明专利技术实现了维、汉短信语音转换,并保证仅对授权的手机号码的短信内容进行识别,自动回拨机制及DTMF密码验证机制确保了短信内容的发送方的合法性。本发明专利技术安全稳定、集成度高,可将应急短信通过安全验证机制配合PC转换成语音并广播到指定区域,在提高灵活度的同时大大降低应急广播的铺设成本。

【技术实现步骤摘要】

本专利技术涉及信息语音转换播发系统
,具体是一种涉及维、汉双语GSM短信息语音转换播发系统
技术介绍
通信是二十世纪出现的最有价值的电子信息技术之一。其中手机短信是人们使用手机交流的最早的主要方式。短信息语音转换播发功能在人们的日常生活中具有非常重要的应用价值,它能够给人类提供的廉价、便利的通信服务。现有的一些手机提供的语音播报短信的技术都不能很好的满足用户的需要:有的需要连接到服务器进行合成再将语音信息发给手机,这样会有使用环境的限制并带来费用的增加;有的通过在本地储存音节的办法进行语音合成,这样合成音质非常差。尤其是对于维、汉双语短信息语音转换播发,目前还存在一些问题,比如应急短信无法安全转换成语音并广播到指定区域;另外,在语音合成方面,常用的语音合成方法主要有参数合成和波形拼接方法两种技术,参数合成方法在合成技术中比较依赖语音的参数提取技术,但是,目前对语音产生模型的研究还不够完善,因此基于参数合成方法的语音合成清晰度和自然度都还达不到实用程度。于此不同,基于波形拼接技术的语音合成原理是把语音波形进行拼接,输出整体语音数据。波形拼接语音合成用自然语音波形取代参数,语音波形取自词、短语和句子,隐含了原始语音中的自然韵律,合成的语音清晰自然,其质量普遍高于基于参数的语音合成。在波形拼接过程中,如果直接将简单的波形进行拼接,经常发现在拼接点会有以下问题:首先,会有发现声音拼接点存在刺啦声,其次,如果两个声音音高不同,会发现拼接中整个声音的音高不同,忽低忽高。针对以上问题,我们对维、汉双语短信息语音转换播发系统应用平台进行更加深入和细化的设计开发,将具有很广泛的实际应用价值。
技术实现思路
本专利技术解决的技术问题是提供一种低功耗低成本的维、汉双语GSM短信息语音转换播发系统,解决了应急短信无法安全转换成语音并广播到指定区域的问题。本专利技术的技术方案是:一种维、汉双语GSM短信息语音转换播发系统,分为软件系统和硬件系统两个组成部分;所述软件系统功能分为短信接收模块、文本预处理模块、语料库构建模块、波形拼接合成模块四部分;短信接收模块:负责短信接收,实时获取最新的短信文本;当接收到短信时,进行回拨,通过MT8870芯片对键盘输入进行DTMF解码,获取输入密码,并进行验证,然后通过终端控制来进行推送信息的实时处理工作;实现了基于移动短信推送的信息接收功能。短信接收是一个开发式系统,且没有对短信来源进行指定。由于在项目应用的实际环境中,不可避免的会接收到一些非推送请求的短信。为了在短信接收终端进行推送请求的认证,故加入验证处理。通过回拨电话,然后待用户输入密码,进行密码验证。该验证过程中,主要难点就是回拨电话时,获取客户通过拨号键盘输入的密码。文本预处理模块:首先进行语种识别,区分汉语与维吾尔语文本,然后基于汉语、维吾尔语的正规化规则,分别对汉语、维吾尔语进行文本正则化,对汉语根据已有词典库进行分词,对维吾尔语根据已有的音节库进行切分,获得文本的发音单元;语料库构建模块:构建汉语词汇、单字语料库;构建维吾尔语音节语料库;波形拼接合成模块:针对汉语,选择词汇对应的音频文件进行拼接,针对维吾尔语,选择音节对应的音频文件进行拼接;所述的硬件系统为:使用cortexM3内核的ARM处理器作为控制单元、使用SIM900AGSM模块作为短信接收及语音传输单元、采用VS1003音频解码芯片对MP3音频文件进行解码、采用SDIO驱动SD卡并建立FAT32文件系统存储配置文件及音频文件、使用400X240TFT3寸彩色液晶显示屏显示系统每个运行状态、使用MX3232作为RS232接口电路的驱动芯片实现系统与PC的通信连接、采用RTC时钟电路为系统提供精确实时时钟、采用AMS1117线性稳压器将电源适配器的电压降至ARM处理器及其他芯片的工作电压、嵌入式短信播报系统能够接收指定手机的短信并能主动向授权手机号码回拨电话,通过双音多频DTMF(DualToneMultiFrequency)识别授权手机密码,当验证通过后会将需要播报的短信发送到PC进行语音合成并广播。SIM900A模块是尺寸紧凑的GSM/GPRS无线通信模块,采用SMT封装易于客户进行灵活设计,性能强大。进一步地,在上述方案中,所述文本预处理模块使用语种字符在Unicode中的具体位置识别语种,区分汉语与维吾尔语信息,通过工程和技术的角度,基于规则对汉语、维吾尔语文件进行正则化处理;对汉语根据已有词典库采用正向最大匹配算法进行分词,对维吾尔语根据已有的音节库同样采用正向最大匹配算法进行切分;语种识别包含语音语种识别,即根据语音文件来区别语种;文本语种识别,即根据文本文件来区别语种。作为语种识别的基础,编码识别是前提条件,本专利技术采用统一编码UTF-8,因此就避开了编码识别环节,主要工作在识别少数民族语言,在少数民族语言的识别上我们采用基于语种字符在Unicode中的具体位置的方法来进行正则匹配。真实的文本中,经常会包含大量的非标准文字字符串,比如“2016年1月”,其中的“2016”和“1”;“10000米”,其中的“10000”;其中的“1000”;其中的“15”。这些非标准文字字符,主要有阿拉伯数字、英文字符、各种符号组成。在语音合成过程中,对这些非标准文字字符组成的日期、电话、数值等需要进行特殊处理,其过程就是文本正则化。以汉语的正则化为例。为了区分数字的发音规则,首先,设定数字的发音类型,当为电话类型时,即“101”读“幺零幺”时,则认为数字类型为P;当为字符串类型时,即“145”读“一四五”时,则认为数字类型为S;当为数字类型时,即“165”读“一百六十五”时,则认为数字类型为N。用这种形式表示时间“2016年1月1日“时,则记作“S年S月S日“;表示“100万“时,则记作“N万“;表示“2016/1/1”,则记作“S/S/S”;表示“010-25124585”时,则记作“P-P”。通过动态构建形式表达式,从而完成了数字的正则化。考虑到特殊符号的发音,为了将符号发音进行表达,提出一种语音表达式,就是直接将特殊符号的发音进行描述。比如“12.25%”,用以上形式表达式为“N.N%”,其语音表达为“百分之N.N”。通过动态构建语音表达式,从而完成了特殊符号的正则化。汉语的语音合成是基于大规模语料库的语音合成方法。基于大规模语料库波形拼接语音合成技术的优点是最大限度的保留了原始语音的语言学特征,对于未登录词汇,采用音节为基本拼接单元。通过选取语料库中尽量长词汇、短语进行合成,减少合成语句中的拼接点。这样做,有两个好处:首先,有相当多的韵律词、韵律短语使用了语料库中的原始语音数据,保持了很好的原始自然度,同时尽量减少拼接点,保证了合成语音的整体自然度;其次,就是能够很好的应对未登录词汇的语音合成。进一步地,在上述方案中,所述得逞构建维吾尔语音节语料库,在语音合成时,可以屏蔽音节内部的发音规则,使音节内部的语音更自然,通过收录长音节,可以在一定程度上避免音节直接的联音现象,增加音节与音节之间的语音自然度;维吾尔语语料库包含约6000维吾尔语音节,除了2000多个常用音节外,其余为收录的长音节;语料库原始语音大小约为0.72G;进一步地,在上述方案中,本文档来自技高网
...
一种维、汉双语GSM短信息语音转换播发系统

【技术保护点】
一种维、汉双语GSM短信息语音转换播发系统,其特征在于,分为软件系统和硬件系统两个组成部分。所述软件系统功能分为短信接收模块、文本预处理模块、语料库构建模块、波形拼接合成模块四部分;短信接收模块:负责短信接收,实时获取最新的短信文本;当接收到短信时,进行回拨,通过MT8870芯片对键盘输入进行DTMF解码,获取输入密码,并进行验证,然后通过终端控制来进行推送信息的实时处理工作;文本预处理模块:首先进行语种识别,区分汉语与维吾尔语文本,然后基于汉语、维吾尔语的正规化规则,分别对汉语、维吾尔语进行文本正则化,对汉语根据已有词典库进行分词,对维吾尔语根据已有的音节库进行切分,获得文本的发音单元;语料库构建模块:构建汉语词汇、单字语料库;构建维吾尔语音节语料库;波形拼接合成模块:针对汉语,选择词汇对应的音频文件进行拼接,针对维吾尔语,选择音节对应的音频文件进行拼接;所述的硬件系统为:使用cortex M3内核的ARM处理器作为控制单元、使用SIM900A GSM模块作为短信接收及语音传输单元、采用VS1003音频解码芯片对MP3音频文件进行解码、采用SDIO驱动SD卡并建立FAT32文件系统存储配置文件及音频文件、使用400X240TFT3寸彩色液晶显示屏显示系统每个运行状态、使用MX3232作为RS232接口电路的驱动芯片实现系统与PC的通信连接、采用RTC时钟电路为系统提供精确实时时钟、采用AMS1117线性稳压器将电源适配器的电压降至ARM处理器及其他芯片的工作电压、嵌入式短信播报系统能够接收指定手机的短信并能主动向授权手机号码回拨电话,通过双音多频DTMF(Dual Tone Multi Frequency)识别授权手机密码,当验证通过后会将需要播报的短信发送到PC进行语音合成并广播。...

【技术特征摘要】
1.一种维、汉双语GSM短信息语音转换播发系统,其特征在于,分为软件系统和硬件系统两个组成部分。所述软件系统功能分为短信接收模块、文本预处理模块、语料库构建模块、波形拼接合成模块四部分;短信接收模块:负责短信接收,实时获取最新的短信文本;当接收到短信时,进行回拨,通过MT8870芯片对键盘输入进行DTMF解码,获取输入密码,并进行验证,然后通过终端控制来进行推送信息的实时处理工作;文本预处理模块:首先进行语种识别,区分汉语与维吾尔语文本,然后基于汉语、维吾尔语的正规化规则,分别对汉语、维吾尔语进行文本正则化,对汉语根据已有词典库进行分词,对维吾尔语根据已有的音节库进行切分,获得文本的发音单元;语料库构建模块:构建汉语词汇、单字语料库;构建维吾尔语音节语料库;波形拼接合成模块:针对汉语,选择词汇对应的音频文件进行拼接,针对维吾尔语,选择音节对应的音频文件进行拼接;所述的硬件系统为:使用cortexM3内核的ARM处理器作为控制单元、使用SIM900AGSM模块作为短信接收及语音传输单元、采用VS1003音频解码芯片对MP3音频文件进行解码、采用SDIO驱动SD卡并建立FAT32文件系统存储配置文件及音频文件、使用400X240TFT3寸彩色液晶显示屏显示系统每个运行状态、使用MX3232作为RS232接口电路的驱动芯片实现系统与PC的通信连接、采用RTC时钟电路为系统提供精确实时时钟、采用AMS1117线性稳压器将电源适配器的电压降至ARM处理器及其他芯片的工作电压、嵌入式短信播报系统能够接收指定手机的短信并能主动向授权手机号码回拨电话,通过双音多频DTMF(DualToneMultiFrequency)识别授权手机密码,当验证通过后会将需要播报的短信发送到PC进行语音合成并广播。2.根据权利要求1所述的文本预处理模块,其特征在于,所述文本预处理模块使用语种字符在Unicode中的具体位置识别语种,区分汉语与维吾尔语信息,通过工程和技术的角度,基于规则对汉语、维吾尔语文件进行正则化处理;对汉语根据已有词典库采用正向最大匹配算法进行分词,对维吾尔语根据已有的音节库同样采用正向最大匹配算法进行切分;语种识别包含语音语种识别,即根据语音文件来区别语种;文本语种识别,即根据文本文件来区别语...

【专利技术属性】
技术研发人员:白涛王磊寇晓斌杨抒吴乃宁吴艳程鲁玉
申请(专利权)人:新疆农业大学
类型:发明
国别省市:新疆;65

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1