【技术实现步骤摘要】
多音字读音确定方法、系统,电子设备及介质
[0001]本专利技术涉及语音合成领域,特别涉及一种多音字读音确定方法、系统,电子设备及介质。
技术介绍
[0002]TTS(Text To Speech,语音合成)系统是一个将文本转为语音输出的过程,这个过程主要是将输入的文本按字或次分解为音素,并且再对其进行分析,将音素生成音频,用扬声器生成声音文件再采用多媒体软件播放出来。在TTS系统中,需要对文本进行分析,实现字音上的转换,然后在汉语中,由于一字多音的情况很常见,而且没有统一的可供寻找的规律,通常为了判断多音字的读音往往只能按照约定俗成的读法,这就使得为了提高多音字读音的准确性必然要建立TTS系统的多音字词库。
[0003]由于多音字在词汇中通常能够确定唯一的读音,因此现有技术中针对中文TTS系统中的多音字问题,主要通过构建多音字词库和非多音字词库,将多音字以词汇的形式区分,并且通过对多音字词库和非多音字词库的结构形式的构造,减少词库的多余信息,以提高词汇语音的查找速率和准确性。但是越精准的多音字词库,所要建立的词库就 ...
【技术保护点】
【技术特征摘要】
1.一种多音字读音确定方法,其特征在于,包括以下步骤:根据预设的多音字字典确定文本中的多音字;在所述文本中获取与所述多音字相邻的上下文;分析所述上下文并得到所述多音字的类别;根据所述类别匹配与所述类别对应的多音字词库;从所述多音字词库中查询所述多音字并输出与所述多音字对应的读音。2.根据权利要求1所述的多音字读音确定方法,其特征在于,所述从所述多音字词库中查询所述多音字并输出与所述多音字对应的读音的步骤包括:判断所述多音字在所述类别下是否具有唯一读音,若是,则输出所述读音;若否,则根据所述上下文将所述多音字组成词组;从所述多音字词库中查询所述词组并输出所述词组中与所述多音字对应的读音。3.根据权利要求1所述的多音字读音确定方法,其特征在于,所述多音字读音确定方法还包括:预先构建若干个不同类别的多音字词库;获取包含有多音字的词组;根据所述类别对所述词组进行分类;分别将同一类别的所述词组及所述词组中多音字的读音存入所述类别下的多音字词库。4.根据权利要求1所述的多音字读音确定方法,其特征在于,所述多音字读音确定方法还包括:构建测试用例,所述测试用例包括待测多音字、包含所述待测多音字的待测语句和所述待测多音字的实际读音;输入所述待测语句,根据所述多音字词库获取所述待测多音字的读音作为测试读音;对比所述测试读音与所述实际读音,若一致,则输出测试结果为测试成功;若不一致,则输出测试结果为测试失败;统计所述测试成功和所述测试失败的次数,根据所述次数确定所述多音字词库的准确率。5.一种多音字读音确定系统,其特征在于,所述多音字读音确定系统包括确定模块、第一获取模块、分析模块、匹配模块和输出模块:所述确定模块用于根据预设的多音字字典确定文本中的多音字;所述第一获取模块用于在所述文本中获取与所述多音字相邻的上下文;所述分析模块用于分析所述上下文并得到所述多音字的类别;所述匹配模块用于根据所述类别匹配与所述类别对应的多音字库;所述输出模块用于从所述多音字词库中查询所述多音字并输出与所述多音字对...
【专利技术属性】
技术研发人员:于江昆,张艺,蒋春燕,
申请(专利权)人:芯讯通无线科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。