词库生成方法、词库生成装置、电子设备及可读存储介质制造方法及图纸

技术编号:41180747 阅读:17 留言:0更新日期:2024-05-07 22:15
本申请适用于语音合成技术领域,提供了一种词库生成方法、词库生成装置、电子设备及可读存储介质。所述词库生成方法包括:获取自定义词汇和第一汉语拼音,所述第一汉语拼音是所述自定义词汇的汉语拼音;基于所述第一汉语拼音,确定对应的第一信息,所述第一信息包括所述第一汉语拼音对应的音素和声调标志;基于所述自定义词汇和所述第一信息,生成自定义词库。通过本申请可提高词库的生成效率,降低人力和时间成本。

【技术实现步骤摘要】

本申请属于语音合成,尤其涉及一种词库生成方法、词库生成装置、电子设备及可读存储介质


技术介绍

1、语音合成,又称文语转换(text to speech)技术,是一种可以将文本转换成相应语音的技术。在语音合成的过程中,通常包括三个部分:一是文本分析,对输入的文本进行正则化,将字母、数字、符号等转换为对应的汉字,随后通过分词将句子拆分为词组和单字,再通过查字典表找到词组或单字对应的音素;二是声学模型,将音素转换为语音特征;三是声码器,将语音特征转换为声音波形并输出。

2、其中,上述字典表是词组或单字到音素的映射表,通常能够覆盖日常词汇。但是,在实际的应用场景中,可能会遇到一些多音词或专用词,则需要增加或者修改词汇,增加或者修改的词汇可以称之为“自定义词汇”。但在增加或者修改词汇时,通常需要将程序服务停掉,由开发人员增加或者修改,然后重启程序服务,操作较为繁琐。如果自定义词汇比较多,则会耗费大量的人力和时间成本。


技术实现思路

1、本申请实施例提供了一种词库生成方法、词库生成装置、电子设备及可读存储介本文档来自技高网...

【技术保护点】

1.一种词库生成方法,其特征在于,所述词库生成方法包括:

2.根据权利要求1所述的词库生成方法,其特征在于,所述基于所述第一汉语拼音,确定对应的第一信息,包括:

3.根据权利要求2所述的词库生成方法,其特征在于,所述词库生成方法还包括:

4.根据权利要求2所述的词库生成方法,其特征在于,所述基于所述第一汉语拼音和第一映射关系,确定所述第一信息,包括:

5.根据权利要求1至4任一项所述的词库生成方法,其特征在于,在所述自定义词汇不为单字的情况下,所述词库生成方法还包括:

6.根据权利要求5所述的词库生成方法,其特征在于,在生成自定...

【技术特征摘要】

1.一种词库生成方法,其特征在于,所述词库生成方法包括:

2.根据权利要求1所述的词库生成方法,其特征在于,所述基于所述第一汉语拼音,确定对应的第一信息,包括:

3.根据权利要求2所述的词库生成方法,其特征在于,所述词库生成方法还包括:

4.根据权利要求2所述的词库生成方法,其特征在于,所述基于所述第一汉语拼音和第一映射关系,确定所述第一信息,包括:

5.根据权利要求1至4任一项所述的词库生成方法,其特征在于,在所述自定义词汇不为单字的情况下,所述词库生成方法还包括:

6.根据权利要求5所述的词库生成方法,其特征在于,在生成自定义词库之后,还包括:<...

【专利技术属性】
技术研发人员:郑泽鸿杨显杰罗沛鹏李鹏辉
申请(专利权)人:深圳市优必选科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1