文字识别方法及装置、电子设备、计算机可读介质制造方法及图纸

技术编号：36421000 阅读：27 留言：0更新日期：2023-01-20 22:28

本申请的实施例揭示了一种文字识别方法及装置、电子设备、计算机可读介质。该方法包括：将待处理图像输入至训练好的文字识别模型中；通过文字识别模型对待处理图像含有的图像内容进行文字识别得到初始文字识别结果，以及进行场景分类得到场景分类结果，并根据场景分类结果对初始文字识别结果进行修正处理，得到待处理图像对应的目标文字信息；将所述目标文字信息作为目标初始文字识别结果输出。本申请的实施例可以提高文字识别模型的计算效率，节约模型的成本，以及提高文字识别模型的识别准确率。确率。确率。

全部详细技术资料下载

【技术实现步骤摘要】
文字识别方法及装置、电子设备、计算机可读介质

[0001]本申请涉及文字识别
，具体涉及一种文字识别方法及装置、电子设备、计算机可读介质。

技术介绍

[0002]基于光学字符识别(Optical Character Recognition，OCR)的文字识别技术是计算机视觉领域中的一个重要分支，可以被广泛应用于交通标志识别、电子文档识别、证件识别等领域中。在实际应用中，由于业务量大且业务类型繁多，一般要求识别多个不同场景中的文字，针对不同的场景通常会设计不同的文字识别模型，然后采用模型在线组合的方式，将多个不同场景的文字识别模型进行组合，以满足不同场景的文字识别需求。但随着兼容场景的增多，需要将更多的文字识别模型进行在线组合，一方面，使得文字识别模型的识别成本不断增加；另一方面，多个文字识别模型中可能存在重复的功能处理模块，对文字识别的效率存在一定影响。

技术实现思路

[0003]为解决上述技术问题，本申请的实施例提供了一种文字识别方法及装置、电子设备、计算机可读介质。
[0004]根据本申请实...

【技术保护点】

【技术特征摘要】
1.一种文字识别方法，其特征在于，包括：将待处理图像输入至训练好的文字识别模型中；通过所述文字识别模型对所述待处理图像含有的图像内容进行文字识别得到初始文字识别结果，以及进行场景分类得到场景分类结果，并根据所述场景分类结果对所述初始文字识别结果进行修正处理，得到所述待处理图像对应的目标文字信息；将所述目标文字信息作为目标初始文字识别结果输出。2.根据权利要求1所述的方法，其特征在于，所述根据所述场景分类结果对所述初始文字识别结果进行修正处理，得到所述待处理图像对应的目标文字信息，包括：根据所述场景分类结果确定与所述场景分类结果相匹配的掩码向量；根据所述掩码向量对初始文字识别结果进行修正处理，得到所述待处理图像对应的目标文字信息。3.根据权利要求2所述的方法，其特征在于，所述初始文字识别结果包括字符信息，所述场景分类结果包括所述字符信息分别属于各个场景的概率值；所述根据所述场景分类结果确定与所述场景分类结果相匹配的掩码向量，包括：将所述概率值大于预设阈值的场景对应的掩码向量设置为第一数值，以及将所述概率值大于预设阈值的场景对应的掩码向量设置为第二数值，得到与所述场景分类结果相匹配的掩码向量；其中，所述第一数值和所述第二数值为归一化处理后的数值。4.根据权利要求2所述的方法，其特征在于，所述初始文字识别结果包括字符概率向量；所述根据所述掩码向量对初始文字识别结果进行修正处理，得到所述待处理图像对应的目标文字信息，包括：将所述掩码向量与所述字符概率向量进行求乘积运算，得到运算结果；其中，所述掩码向量包括归一化处理后的第一数值和第二数值；将所述运算结果作为所述待处理图像对应的目标文字信息。5.根据权利要求1所述的方法，其特征在于，所述初始文字识别结果包括字符信息；所述进行场景分类得到场景分类结果，包括：获取候选的多个场景；其中，所述多个场景包括从语言类型进行划分的多个场景，或者从业务类型进行划分的多个场景；对所述字符信息属于各个场景的概率值进行运算，得到所述字符信息分别属于各个场景的概率值，将所述字符信息分别属于各个场景的概率值作为所述场景分类...

【专利技术属性】
技术研发人员：陈利军，王语斌，徐敏，
申请(专利权)人：同盾网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人