一种数据处理方法及装置制造方法及图纸

技术编号：30913693 阅读：25 留言：0更新日期：2021-11-23 00:01

本申请公开了一种数据处理方法，具体地：当用户触发多音字查看操作之后，可以确定查看范围，并进一步确定所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音，并显示所述每个多音字分别对应的至少一种读音。由此可见，在本申请中，用户触发多音字查看操作之后，不是直接获取整个目标文本中多音字的读音，而是首先判断查看范围，并且所述查看范围可以是目标文本，也可以是目标文本中的部分文本。这就使得本方案可以根据实际情况适应性的为用户展示查看范围中的多音字的读音，而不是直接展示整个目标文本中的多音字的读音，从而使得本方案能够更加符合用户需求，从而用户体验更佳。从而用户体验更佳。从而用户体验更佳。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法及装置

[0001]本申请涉及数据处理领域，特别是涉及一种数据处理方法及装置。

技术介绍

[0002]在一些场景例如在音频创作的场景中，可以将文字转换成音频。但是，文字可能有多种发音，即有的文字为“多音字”。这就导致在将文字转换成音频之后，需要对前述多音字的发音进行纠错。
[0003]而目前对多音字的发音进行纠错的方式，用户体验不佳。

技术实现思路

[0004]本申请所要解决的技术问题是：目前对多音字的发音进行纠错的方式，用户体验不佳，提供一种数据处理方法及装置。
[0005]第一方面，本申请实施例提供了一种数据处理方法，所述方法包括：
[0006]响应于用户触发的多音字查看操作，确定查看范围，所述查看范围包括：目标文本或者目标文本中的部分文本；
[0007]获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音；
[0008]显示所述每个多音字分别对应的至少一种读音。
[0009]可选的，所述确定查看范围，包括：
[0...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，所述方法包括：响应于用户触发的多音字查看操作，确定查看范围，所述查看范围包括：目标文本或者目标文本中的部分文本；获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音；显示所述每个多音字分别对应的至少一种读音。2.根据权利要求1所述的方法，其特征在于，所述确定查看范围，包括：若用户针对所述目标文本中的部分文本执行了选择操作，则确定所述查看范围为所述目标文本中的部分文本。3.根据权利要求1所述的方法，其特征在于，所述确定查看范围，包括：若用户未针对所述目标文本中的任一文本执行选择操作，则确定所述查看范围为所述目标文本。4.根据权利要求1所述的方法，其特征在于，所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音，包括：获取所述查看范围中包括的易错多音字中每个多音字分别对应的至少一种读音。5.根据权利要求1所述的方法，其特征在于，所述方法还包括:确定所述查看范围中包括的易错多音字。6.根据权利要求5所述的方法，其特征在于，所述确定所述查看范围中包括的易错多音字，包括：根据所述查看范围中的多音字的上下文，确定所述查看范围中包括的易错多音字。7.根据权利要求6所述的方法，其特征在于，所述查看范围内的多音字包括第一多音字，所述第一多音字在目标音频中的读音为第一读音，所述目标音频为所述目标文本对应的音频，所述根据所述查看范围中的多音字的上下文，确定所述查看范围中包括的易错多音字，包括：将所述第一多音字所在的语句以及所述第一多音字在所述语句中的位置输入机器学习模型，得到所述第一多音字在所述语句中的读音为所述第一读音的概率，所述机器学习模型用于为语句中的多音字确定读音；若所述概率小于或者等于预设阈值，则确定所述第一多音字为易错多音字。8.根据权利要求6所述的方法，其特征在于，所述查看范围内的多音字包括第一多音字，所述根据所述查看范围中的多音字的上下文，确定所述查看范围中包括的易错多音字，包括：对所述第一多音字所在的语...

【专利技术属性】
技术研发人员：王宁，姜伟，张爽，朱伟基，邹双圆，朱浩，程龙，
申请(专利权)人：北京搜狗科技发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人