The utility model discloses a Tibetan speech synthesis device based on FPGA, including FPGA chip, text input device, FLASH memory, SDRAM memory, audio output device; the FPGA chip includes Nios II soft core processor, Avalon bus, the input equipment controller, FLASH memory interface, SDRAM controller, PLL, PLL UART, controller and Co processor for speech synthesis; the Nios processor through the Avalon bus are respectively connected with the input device controller, FLASH memory interface, SDRAM controller, PLL, PLL, UART controller and processor connected; the text input and text input device connected to the controller, the FLASH memory connected to the FLASH memory interface and SDRAM memory connected with the SDRAM controller, and the audio output device The audio controller is connected to realize the conversion from Tibetan text to Tibetan speech.
【技术实现步骤摘要】
一种基于FPGA的藏语语音合成装置
本技术涉及到藏语文本到藏语语音转换的语音合成
,具体涉及一种基于FPGA的藏语语音合成装置。
技术介绍
随着现代社会信息技术的高速发展,高度智能的人机交互、人机互动技术,逐渐受到研究人员的日益重视。人们迫切希望同机器的交流方式,不仅仅停留在依靠于传统的键盘、鼠标以及显示器,完成指令的下发及思想的表达。而是有一种类似于人与人之间交流的方式进行交互,以达到“察言观色”的效果,进而表达出真实的意图。随着语音合成技术的成熟,其各种应用层出不穷,嵌入式语音合成的开发也成为争相发展的热门,TTS(TextToSpeech)系统可以应用于计算机交互输出、呼叫中心、双语手机、PDA等各种设备上。现在比较流行的语音合成技术主要有基于大语料库的语音拼接合成技术,此方法因为是直接从语料库中挑选出语音片段进行拼接,所以合成的语音音质较好。但是此方法需要一个大的语料库,制作语料库不仅费时费力,而且占用大量的存储空间。由于嵌入式设备,对存储空间有一定的限制,所以此方法就不利于应用在嵌入式设备中。另一种现在流行的语音合成方法,是基于HMM(HiddenMarkovModels)的统计参数语音合成技术。此方法建立的语音合成系统特点:系统构建需要的数据量少,存储尺寸小,合成时计算量少;并且合成的语音平滑流畅,鲁棒性高,具有较好的音质和可懂度。藏族作为我们中国的少数民族,有其悠久的历史,它也有自己独特的语言体系-藏语。藏族作为中国的少数民族之一,主要是分布在西藏自治区和青海、甘肃、四川、云南等省区,人口约640万余人。而现在的研究主要集中在汉语的语音 ...
【技术保护点】
一种基于FPGA的藏语语音合成装置,其特征在于,包括FPGA芯片,文本输入设备,FLASH存储器,SDRAM存储器,音频输出设备;所述FPGA芯片包括NiosⅡ软核处理器、Avalon总线、输入设备控制器、FLASH存储器接口、SDRAM控制器、音频控制器、PLL锁相环、UART控制器以及用于语音合成的协处理器;所述NiosⅡ软核处理器通过所述Avalon总线分别与输入设备控制器、FLASH存储器接口、SDRAM控制器、音频控制器、PLL锁相环、UART控制器和协处理器相连;所述文本输入设备与文本输入控制器相连,所述FLASH存储器与FLASH存储器接口相连,SDRAM存储器与SDRAM控制器相连,音频输出设备与音频控制器相连;所述协处理器包括浮点单元、语音参数生成器、语音合成生成器和内部存储器;所述浮点单元通过设置浮点单元总线与语音参数生成器和语音合成生成器相连,所述内部存储器通过设置内部存储器总线与语音参数生成器和语音合成生成器相连;所述内部存储器、语音参数生成器和语音合成生成器分别与Avalon总线相连。
【技术特征摘要】
1.一种基于FPGA的藏语语音合成装置,其特征在于,包括FPGA芯片,文本输入设备,FLASH存储器,SDRAM存储器,音频输出设备;所述FPGA芯片包括NiosⅡ软核处理器、Avalon总线、输入设备控制器、FLASH存储器接口、SDRAM控制器、音频控制器、PLL锁相环、UART控制器以及用于语音合成的协处理器;所述NiosⅡ软核处理器通过所述Avalon总线分别与输入设备控制器、FLASH存储器接口、SDRAM控制器、音频控制器、PLL锁相环、UART控制器和协处理器相连;所述文本输入设备与文本输入控制器...
【专利技术属性】
技术研发人员:杨鸿武,张帅,甘振业,
申请(专利权)人:西北师范大学,
类型:新型
国别省市:甘肃,62
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。