一种数据处理方法及装置制造方法及图纸

技术编号:30913693 阅读:18 留言:0更新日期:2021-11-23 00:01
本申请公开了一种数据处理方法,具体地:当用户触发多音字查看操作之后,可以确定查看范围,并进一步确定所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,并显示所述每个多音字分别对应的至少一种读音。由此可见,在本申请中,用户触发多音字查看操作之后,不是直接获取整个目标文本中多音字的读音,而是首先判断查看范围,并且所述查看范围可以是目标文本,也可以是目标文本中的部分文本。这就使得本方案可以根据实际情况适应性的为用户展示查看范围中的多音字的读音,而不是直接展示整个目标文本中的多音字的读音,从而使得本方案能够更加符合用户需求,从而用户体验更佳。从而用户体验更佳。从而用户体验更佳。

【技术实现步骤摘要】
一种数据处理方法及装置


[0001]本申请涉及数据处理领域,特别是涉及一种数据处理方法及装置。

技术介绍

[0002]在一些场景例如在音频创作的场景中,可以将文字转换成音频。但是,文字可能有多种发音,即有的文字为“多音字”。这就导致在将文字转换成音频之后,需要对前述多音字的发音进行纠错。
[0003]而目前对多音字的发音进行纠错的方式,用户体验不佳。

技术实现思路

[0004]本申请所要解决的技术问题是:目前对多音字的发音进行纠错的方式,用户体验不佳,提供一种数据处理方法及装置。
[0005]第一方面,本申请实施例提供了一种数据处理方法,所述方法包括:
[0006]响应于用户触发的多音字查看操作,确定查看范围,所述查看范围包括:目标文本或者目标文本中的部分文本;
[0007]获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音;
[0008]显示所述每个多音字分别对应的至少一种读音。
[0009]可选的,所述确定查看范围,包括:
[0010]若用户针对所述目标文本中的部分文本执行了选择操作,则确定所述查看范围为所述目标文本中的部分文本。
[0011]可选的,所述确定查看范围,包括:
[0012]若用户未针对所述目标文本中的任一文本执行选择操作,则确定所述查看范围为所述目标文本。
[0013]可选的,所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,包括:
[0014]获取所述查看范围中包括的易错多音字中每个多音字分别对应的至少一种读音。
[0015]可选的,所述方法还包括:
[0016]确定所述查看范围中包括的易错多音字。
[0017]可选的,所述确定所述查看范围中包括的易错多音字,包括:
[0018]根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字。
[0019]可选的,所述查看范围内的多音字包括第一多音字,所述第一多音字在目标音频中的读音为第一读音,所述目标音频为所述目标文本对应的音频,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:
[0020]将所述第一多音字所在的语句以及所述第一多音字在所述语句中的位置输入机
器学习模型,得到所述第一多音字在所述语句中的读音为所述第一读音的概率,所述机器学习模型用于为语句中的多音字确定读音;
[0021]若所述概率小于或者等于预设阈值,则确定所述第一多音字为易错多音字。
[0022]可选的,所述查看范围内的多音字包括第一多音字,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:
[0023]对所述第一多音字所在的语句进行分词,得到包括所述第一多音字的第一分词;
[0024]若所述第一分词不是已有词汇,则确定所述第一多音字为易错多音字。
[0025]可选的,所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,包括:
[0026]获取所述查看范围中包括的所有多音字中每个多音字分别对应的至少一种读音。
[0027]可选的,所述每个多音字分别对应的至少一种读音,包括:
[0028]所述每个多音字在目标音频中的读音,所述目标音频为所述目标文本对应的音频;或者,
[0029]所述每个多音字的全部读音。
[0030]可选的,所述响应于用户触发的多音字查看操作,包括:
[0031]响应于所述用户通过第一控件触发的所述多音字查看操作。
[0032]可选的,所述至少一个多音字包括第二多音字,所述方法还包括:
[0033]显示包括所述第二多音字的至少一个词汇,所述至少一个词汇与所述第二多音字的至少一种读音一一对应。
[0034]第二方面,本申请实施例提供了一种数据处理装置,所述装置包括:
[0035]第一确定单元,用于响应于用户触发的多音字查看操作,确定查看范围,所述查看范围包括:目标文本或者目标文本中的部分文本;
[0036]获取单元,用于获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音;
[0037]第一显示单元,用于显示所述每个多音字分别对应的至少一种读音。
[0038]可选的,所述确定查看范围,包括:
[0039]若用户针对所述目标文本中的部分文本执行了选择操作,则确定所述查看范围为所述目标文本中的部分文本。
[0040]可选的,所述确定查看范围,包括:
[0041]若用户未针对所述目标文本中的任一文本执行选择操作,则确定所述查看范围为所述目标文本。
[0042]可选的,所述获取单元,用于:
[0043]获取所述查看范围中包括的易错多音字中每个多音字分别对应的至少一种读音。
[0044]可选的,所述装置还包括:
[0045]第二确定单元,用于确定所述查看范围中包括的易错多音字。
[0046]可选的,所述第二确定单元,用于:
[0047]根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字。
[0048]可选的,所述查看范围内的多音字包括第一多音字,所述第一多音字在目标音频
中的读音为第一读音,所述目标音频为所述目标文本对应的音频,所述第二确定单元,用于:
[0049]将所述第一多音字所在的语句以及所述第一多音字在所述语句中的位置输入机器学习模型,得到所述第一多音字在所述语句中的读音为所述第一读音的概率,所述机器学习模型用于为语句中的多音字确定读音;
[0050]若所述概率小于或者等于预设阈值,则确定所述第一多音字为易错多音字。
[0051]可选的,所述查看范围内的多音字包括第一多音字,所述第二确定单元,用于:
[0052]对所述第一多音字所在的语句进行分词,得到包括所述第一多音字的第一分词;
[0053]若所述第一分词不是已有词汇,则确定所述第一多音字为易错多音字。
[0054]可选的,所述获取单元,用于:
[0055]获取所述查看范围中包括的所有多音字中每个多音字分别对应的至少一种读音。
[0056]可选的,所述每个多音字分别对应的至少一种读音,包括:
[0057]所述每个多音字在目标音频中的读音,所述目标音频为所述目标文本对应的音频;或者,
[0058]所述每个多音字的全部读音。
[0059]可选的,所述第一确定单元,用于:
[0060]响应于所述用户通过第一控件触发的所述多音字查看操作,确定所述查看范围。
[0061]可选的,所述至少一个多音字包括第二多音字,所述装置还包括:
[0062]第二显示单元,用于显示包括所述第二多音字的至少一个词汇,所述至少一个词汇与所述第二多音字的至少一种读音一一对应。
[0063本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:响应于用户触发的多音字查看操作,确定查看范围,所述查看范围包括:目标文本或者目标文本中的部分文本;获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音;显示所述每个多音字分别对应的至少一种读音。2.根据权利要求1所述的方法,其特征在于,所述确定查看范围,包括:若用户针对所述目标文本中的部分文本执行了选择操作,则确定所述查看范围为所述目标文本中的部分文本。3.根据权利要求1所述的方法,其特征在于,所述确定查看范围,包括:若用户未针对所述目标文本中的任一文本执行选择操作,则确定所述查看范围为所述目标文本。4.根据权利要求1所述的方法,其特征在于,所述获取所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,包括:获取所述查看范围中包括的易错多音字中每个多音字分别对应的至少一种读音。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定所述查看范围中包括的易错多音字。6.根据权利要求5所述的方法,其特征在于,所述确定所述查看范围中包括的易错多音字,包括:根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字。7.根据权利要求6所述的方法,其特征在于,所述查看范围内的多音字包括第一多音字,所述第一多音字在目标音频中的读音为第一读音,所述目标音频为所述目标文本对应的音频,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:将所述第一多音字所在的语句以及所述第一多音字在所述语句中的位置输入机器学习模型,得到所述第一多音字在所述语句中的读音为所述第一读音的概率,所述机器学习模型用于为语句中的多音字确定读音;若所述概率小于或者等于预设阈值,则确定所述第一多音字为易错多音字。8.根据权利要求6所述的方法,其特征在于,所述查看范围内的多音字包括第一多音字,所述根据所述查看范围中的多音字的上下文,确定所述查看范围中包括的易错多音字,包括:对所述第一多音字所在的语...

【专利技术属性】
技术研发人员:王宁姜伟张爽朱伟基邹双圆朱浩程龙
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1