文本注音的方法、装置、电子设备及存储介质制造方法及图纸

技术编号:31486927 阅读:41 留言:0更新日期:2021-12-18 12:22
本申请公开了一种文本注音的方法、装置、电子设备及存储介质,涉及数据处理技术领域。该方法包括:获取待注音文本及与所述待注音文本发音关联的目标文本;获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音;基于所述第一发音以及所述第二发音获取目标发音;将所述目标发音作为所述待注音文本的发音。本方法实现了能够根据与待注音文本对应的第一发音、以及与待注音文本发音关联的目标文本对应的第二发音共同确定待注音文本的发音,从而可以减少与待注音文本不相关的歧义发音出现,提升用户使用体验。提升用户使用体验。提升用户使用体验。

【技术实现步骤摘要】
文本注音的方法、装置、电子设备及存储介质


[0001]本申请涉及数据处理
,更具体地,涉及一种文本注音的方法、装置、电子设备及存储介质。

技术介绍

[0002]目前的语音识别系统大多通过发音词典来给每个待识别的词汇添加发音,例如,可以通过发音词典使用拼音注音的方式对每个词汇进行发音标注;或者可以通过对每个待识别的词汇进行分词,然后从预先存储的发音词典中查找每个分词对应的发音,再将不同的发音拼接在一起,然而,该种方式容易引入多余的发音,产生歧义。

技术实现思路

[0003]本申请提出了一种文本注音的方法、装置、电子设备及存储介质,以改善上述问题。
[0004]第一方面,本申请实施例提供了一种文本注音的方法,所述方法包括:获取待注音文本及与所述待注音文本发音关联的目标文本;获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音;基于所述第一发音以及所述第二发音获取目标发音;将所述目标发音作为所述待注音文本的发音。
[0005]第二方面,本申请实施例提供了一种文本注音装置,所述装置包括:文本获取模本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本注音的方法,其特征在于,所述方法包括:获取待注音文本及与所述待注音文本发音关联的目标文本;获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音;基于所述第一发音以及所述第二发音获取目标发音;将所述目标发音作为所述待注音文本的发音。2.根据权利要求1所述的方法,其特征在于,所述获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音,包括:对所述待注音文本进行分词,得到至少两个第一分词;获取与所述至少两个第一分词对应的第一注音集合,所述第一注音集合由所述至少两个第一分词分别对应的拼音组成;将所述第一注音集合作为与所述待注音文本对应的第一发音;对所述目标文本进行分词,得到至少两个第二分词;获取与所述至少两个第二分词对应的第二注音集合,所述第二注音集合由所述至少两个第二分词分别对应的拼音组成;将所述第二注音集合作为与所述目标文本对应的第二发音。3.根据权利要求2所述的方法,其特征在于,所述获取与所述至少两个第一分词对应的第一注音集合,包括:从预设发音词典或网络上获取与所述至少两个第一分词对应的第一注音集合。4.根据权利要求1所述的方法,其特征在于,所述获取与所述待注音文本对应的第一发音,并获取与所述目标文本对应的第二发音,包括:从预设发音词典获取与所述待注音文本对应的第一发音,从预设发音词典或网络上获取与所述目标文本对应的第二发音。5.根据权利要求1所述的方法,其特征在于,所述基于所述第一发音以及所述第二发音获取目标发音,包括:将所述第一...

【专利技术属性】
技术研发人员:李亚桐张伟彬陈东鹏
申请(专利权)人:深圳市声扬科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1