【技术实现步骤摘要】
一种数据处理方法及装置
[0001]本申请涉及数据处理领域,特别是涉及一种数据处理方法及装置。
技术介绍
[0002]在一些场景例如在音频创作的场景中,可以将文字转换成音频。但是,文字可能有多种发音,即有的文字为“多音字”。这就导致在将文字转换成音频之后,需要对前述多音字的发音进行纠错。
[0003]而目前对多音字的发音进行纠错的方式,用户体验不佳。
技术实现思路
[0004]本申请所要解决的技术问题是:目前对多音字的发音进行纠错的方式,用户体验不佳,提供一种数据处理方法及装置。
[0005]第一方面,本申请实施例提供了一种数据处理方法,所述方法包括:
[0006]响应于用户触发的多音字查看操作,确定查看范围,所述查看范围包括:目标文本或者目标文本中的部分文本;
[0007]获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音;
[0008]显示所述每个多音字分别对应的至少一种读音。
[0009]可选的,所述确定查看范围,包括:
[0 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:响应于用户触发的多音字查看操作,确定查看范围,所述查看范围包括:目标文本或者目标文本中的部分文本;获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音;显示所述每个多音字分别对应的至少一种读音。2.根据权利要求1所述的方法,其特征在于,所述确定查看范围,包括:若用户针对所述目标文本中的部分文本执行了选择操作,则确定所述查看范围为所述目标文本中的部分文本。3.根据权利要求1所述的方法,其特征在于,所述确定查看范围,包括:若用户未针对所述目标文本中的任一文本执行选择操作,则确定所述查看范围为所述目标文本。4.根据权利要求1所述的方法,其特征在于,所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,包括:获取所述查看范围中包括的易错多音字中每个多音字分别对应的至少一种读音。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定所述查看范围中包括的易错多音字。6.根据权利要求5所述的方法,其特征在于,所述确定所述查看范围中包括的易错多音字,包括:根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字。7.根据权利要求6所述的方法,其特征在于,所述查看范围内的多音字包括第一多音字,所述第一多音字在目标音频中的读音为第一读音,所述目标音频为所述目标文本对应的音频,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:将所述第一多音字所在的语句以及所述第一多音字在所述语句中的位置输入机器学习模型,得到所述第一多音字在所述语句中的读音为所述第一读音的概率,所述机器学习模型用于为语句中的多音字确定读音;若所述概率小于或者等于预设阈值,则确定所述第一多音字为易错多音字。8.根据权利要求6所述的方法,其特征在于,所述查看范围内的多音字包括第一多音字,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:对所述第一多音字所在的语...
【专利技术属性】
技术研发人员:王宁,姜伟,张爽,朱伟基,邹双圆,朱浩,程龙,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。