语音处理方法、装置和介质制造方法及图纸

技术编号：26602132 阅读：37 留言：0更新日期：2020-12-04 21:25

本发明专利技术实施例提供了一种语音处理方法和装置、一种用于语音处理的装置，其中的方法具体包括：展示文本中多音字当前的读音信息；所述文本用于语音合成处理；所述当前的读音信息为依据所述多音字及其上下文得到；依据用户针对所述当前的读音信息的纠正操作，展示所述多音字对应的读音输入接口，以供用户输入修正后的读音信息；依据修正后的读音信息，对所述文本进行语音合成。本发明专利技术实施例能够提高读音纠错的效率。

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法、装置和介质
本专利技术涉及通信
，特别是涉及一种语音处理方法和装置、一种机器可读介质。
技术介绍
随着通信技术的发展，蓝牙耳机、智能音箱等音频设备的普及，音频内容消费在近年持续增长，包括无线电台、网络播客、有声读物、知识节目等。随时随地以“听”的方式获取声音陪伴成为了更多用户的选择，在驾驶、通勤、睡前等场景中能够轻松获得沉浸式的新闻、学习、娱乐、音乐等有声体验。目前，可以将用户指定的文本，转换为音频内容，并支持音频内容的试听。在音频内容的试听过程中，若用户发现读音的错误，可以支持用户提供正确的读音，以依据正确的读音对音频内容进行修正。专利技术人在实施本专利技术实施例的过程中发现，用户需要通过试听的方式完成读音纠错，使得语音纠错花费较多的时间成本，进而使得语音纠错的效率较低。
技术实现思路
鉴于上述问题，提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的语音处理方法、语音处理装置及用于语音处理的装置，本专利技术实施例可以提高读音纠错的效率。...

【技术保护点】
1.一种语音处理方法，其特征在于，所述方法包括：/n展示文本中多音字当前的读音信息；所述文本用于语音合成处理；所述当前的读音信息为依据所述多音字及其上下文得到；/n依据用户针对所述当前的读音信息的纠正操作，展示所述多音字对应的读音输入接口，以供用户输入修正后的读音信息；/n依据修正后的读音信息，对所述文本进行语音合成。/n

【技术特征摘要】
1.一种语音处理方法，其特征在于，所述方法包括：
展示文本中多音字当前的读音信息；所述文本用于语音合成处理；所述当前的读音信息为依据所述多音字及其上下文得到；
依据用户针对所述当前的读音信息的纠正操作，展示所述多音字对应的读音输入接口，以供用户输入修正后的读音信息；
依据修正后的读音信息，对所述文本进行语音合成。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：
依据所述多音字及其上下文、以及包含多音字的标注语料，确定所述文本中多音字当前的读音信息。

3.根据权利要求1所述的方法，其特征在于，所述展示文本中多音字当前的读音信息，包括：
在对所述文本进行语音合成之前，展示文本中多音字当前的读音信息。

4.根据权利要求1所述的方法，其特征在于，所述展示所述多音字对应的读音输入接口，包括：
展示所述多音字对应的读音选项，以供用户选择；或者
展示所述多音字对应的读音输入框，以供用户输入。

5.根据权利要求1至4中任一所述的方法，其特征在于，所述依据修正后的读音信息，对所述文本进行语音合成，包括：
依据修正后的读音信息，对所述多音字对应的完整文本进行语音合成。

6.根据权利要求1至4中任一所述的方法，其特征在于，所述文本包括：第一部分文本和第二部分文本；在确定所述修正后的读音信息之前，确定所述第二部分文本对应的第二部分合成结果；
则所述依据修正后的读音信息，对所述文本进行语音合成，包括：
依据修正后的读音信息，对所述多音字对应的第一部分文本进行语音合成，以得到对应...

【专利技术属性】
技术研发人员：叶一川，
申请(专利权)人：北京搜狗科技发展有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人