多音字处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：29078598 阅读：14 留言：0更新日期：2021-06-30 09:37

本申请公开了一种多音字处理方法、装置、电子设备及存储介质，该方法包括：获取扫描图像，对所述扫描图像进行切行，得到目标图像，对所述目标图像进行识别，得到所述至少一个注音和所述多个文字，基于所述至少一个注音，从所述多个文字中确定所述每个注音对应的多音字。本申请通过扫描和识别文本中的注音来确定文本中的多音字，能够解决无法识别文本中的多音字注音的问题，提高文本的识别效果。提高文本的识别效果。提高文本的识别效果。

全部详细技术资料下载

【技术实现步骤摘要】
多音字处理方法、装置、电子设备及存储介质

[0001]本申请涉及计算机
，尤其涉及一种多音字处理方法、装置、电子设备及存储介质。

技术介绍

[0002]随着电子技术的发展，电子设备的种类也越来越丰富。扫描笔又名微型扫描仪或手刮式扫描笔，是一种手持式的电子设备。将扫描笔的笔尖扫过书刊、报纸上的文字时，通过内置的光学字符识别(Optical Character Recognition，OCR)模块能够对书刊、报纸上的文字进行识别、存储、编辑等操作。对于识别到的文字，扫描笔通过内置的发音(Text To Speech，TTS)模块和翻译模块，能够将文字读出来并进行翻译。多音字，是指一个字有两个或两个以上的读音，不同的读音表义不同，用法不同，词性也往往不同。读音有区别词性和词义的作用；根据使用情况不同，读音也不同，读音有区别用法的作用。
[0003]在学生的课本和学习资料中，会存在大量标有注音的多音字，但是现有的扫描笔技术方案中，仅支持文字的扫描与识别，无法识别出待扫描文本中对多音字的注音。因而在这种情形中，扫描笔无法准确的实现语音的合成，无法正确理解语义，无法基于此进行准确的翻译。

技术实现思路

[0004]本申请实施例提出了一种多音字处理方法装置、电子设备及存储介质，能够支持注音的扫描和识别，从而提高文本的识别效果。
[0005]第一方面，本申请实施例提供一种多音字处理方法，所述方法包括：
[0006]获取扫描图像；
[0007]对所述扫描图像进行切行，得到目标图像；...

【技术保护点】

【技术特征摘要】
1.一种多音字处理方法，其特征在于，所述方法包括：获取扫描图像；对所述扫描图像进行切行，得到目标图像；对所述目标图像进行识别，得到所述至少一个注音和所述多个文字；基于所述至少一个注音，从所述多个文字中确定所述每个注音对应的多音字。2.根据权利要求1所述的方法，其特征在于，在所述至少一个注音与所述多个文字分别位于相邻行时；所述对所述扫描图像进行切行，得到目标图像，包括：对所述扫描图像进行切行，得到至少一个中间图像，每个中间图像包括文字行和注音行；对每个所述中间图像进行切行，得到至少一个目标图像，所述目标图像包括文字图像和注音图像。3.根据权利要求2所述的方法，其特征在于，所述基于所述至少一个注音，从所述多个文字中确定所述每个注音对应的多音字，包括：基于所述每个注音的起止坐标和所述每个文字的起止坐标，从所述多个文字中确定每个注音对应的至少一个候选文字；从所述每个注音对应的至少一个候选文字中确定每个注音对应的多音字。4.根据权利要求3所述的方法，其特征在于，所述对所述目标图像进行识别，得到所述至少一个注音和所述多个文字，包括：使用拼音识别模型对所述注音图像进行识别，得到所述注音图像中的多个拼音字母；将所述拼音字母之间的距离小于或等于阈值的连续相邻的至少一个拼音字母划分为一个注音，得到所述至少一个注音，并记录每个注音的所述起止坐标；使用文字识别模型对所述文字图像进行识别，得到所述多个文字，并记录每个所述文字的所述起止坐标。5.根据权利要求3或4所述的方法，其特征在于，所述注音的起止坐标与所述候选文字的起止坐标全部或部分重叠。6.根据权利要求1所述的方法，其特征在于，在所述至少一个注音与所述多个文字位于同一行时；所述对所述目标图像进行识别，得到所述至少一个注音和所述多个文字，包括：使用文字识别模型对所述目标图像从左到右进行识别，当在文字识别模型下识别出第一符号时，使用拼音识...

【专利技术属性】
技术研发人员：王田，王晓斐，高群，
申请(专利权)人：安徽淘云科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人