基于语义检索的文语转换方法及系统技术方案

技术编号：7220048 阅读：205 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及语音合成技术领域，提供了一种基于语义检索的文语转换方法及系统。本发明专利技术的方法和系统中，首先同时使用正向最大匹配和逆向最大匹配，几乎全部的非歧义字段都可以被切分出，大大提高了文本切分的准确度，改善了语音合成效果。此外，本发明专利技术将文本切分方法与传统的基于语义的信息检索方法相结合，借鉴信息检索技术中对于关键词的处理方式，来进行歧义字段的处理，可有效提高歧义字段自动识别的效率和准确度，大大提高语音合成的效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音合成
，特别涉及一种基于语义检索的文语转换方法及系统。
技术介绍
语音合成是通过机械的、电子的方法产生人造语音的技术，语音合成和语音识别技术是实现人机语音通信等高级人机交互方式的关键技术。语音合成的目的是将任意信息实时转化为标准流畅的语音朗读出来，涉及声学、语言学、数字信号处理、计算机等多个领域的技术，是信息处理领域的一项前沿技术。语音合成要让计算机能够自动产生高清晰度、高自然度的连续语音，这与传统的声音回放技术有着本质的区别。传统的声音回放设备，如磁带录音机等，是通过预先录制声音然后回放来实现语音重现的；这种方式无论是在内容、存储、传输或者方便性、及时性等方面都存在很大的限制。而通过计算机进行的语音合成则可以在任何时候将任意信息转换成具有高自然度的语音，从而真正实现人机之间的智能交互。文语转换(Text to Speech)技术隶属于语音合成，是将计算机设备自动产生的或是外部输入的文字信息转变为可以听得懂的、流利的汉语(或其他语种，视具体需求而定) 口语输出的技术，文语转换系统实际上可以看作是一个人工智能系统。为了合成出高质量的语言，除了依赖于各种规则，包括语义学规则、词汇规则、语音学规则外，还必须对文字的内容有很好的理解，这也涉及到自然语言理解的问题。文语转换过程通常包括语言学处理、韵律处理和声学处理几个方面，一个好的文语转换系统应能输出音质清晰、自然流畅的语音，而不是简单的语音合成，这需要系统能够对文本进行语言学的分析，确定文本中关于语音的字、词、句的区分以方便后续韵律处理的调整。目前的文语转换系统中，多数是结合词典对...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：傅泽田，李鑫星，张领先，温皓杰，李道亮，刘雪，
申请(专利权)人：中国农业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人