文本确定方法和装置制造方法及图纸

技术编号:43114672 阅读:20 留言:0更新日期:2024-10-26 09:53
本公开涉及图像识别技术领域,尤其涉及一种文本确定方法、装置。其中,该文本确定方法,包括:获取待识别图像对应的文本;对所述文本进行文本特征抽取,获取所述文本对应的音形码特征;采用所述文本对应的音形码,在所述音形码特征对应的目标音形码知识图谱中获取文字相似度列表;根据所述文本对应的音形码和所述文字相似度列表,确定所述文本中不满足文本要求的文字。本公开通过音形码特征,可以根据文字相似度列表确定文字,减少采用单一的OCR系统进行识别出现形似字识别准确性较低、误识别字数数量较多的情况可以提高文字识别的准确性,可以提高识别质量。

【技术实现步骤摘要】

本公开涉及图像识别,尤其涉及一种文本确定方法和装置


技术介绍

1、随着科学技术的发展,文本识别已经成为人们日常生活中必不可少的一部分。例如可以对纸质的文档进行拍照之后获取该纸质文档对应的文本。在识别过程中,例如可以采用ocr识别。在ocr的基础上,植入计算机深度学习的人工智能技术,采用语义推理和语义分析,对于ocr未识别的字符,可根据该字符上下文语句信息并结合eai的语义网络的知识库,进行未识别部分的字符信息补全。在语义推理的过程中,只有当未识别字符上下文片段中的变量节点与语义知识库中语句匹配完全成功时,才将匹配结果输出,能够解决ocr技术的缺陷。但是采用单一的ocr系统进行识别会出现形似字识别准确性较低、误识别字数数量较多使得识别质量较差的情况。


技术实现思路

1、本公开提供一种文本确定方法和装置,以减少音形相似出现的误识别率高的情况,可以提高文字识别的准确性。本公开的技术方案如下:

2、本公开实施例提供一种文本确定方法,包括:

3、获取待识别图像对应的文本;</p>

4、对所本文档来自技高网...

【技术保护点】

1.一种文本确定方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取待识别图像对应的文本,包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求3所述的方法,其特征在于,所述方法还包括:

6.根据权利要求3所述的方法,其特征在于,所述在所述音形码特征对应的音形码相似度知识图谱中获取文字相似度列表,包括:

7.根据权利要求1所述的方法,其特征在于,所述根据所述文本对应的音形码和所述文字相似度列表,确定所述文...

【技术特征摘要】

1.一种文本确定方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取待识别图像对应的文本,包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求3所述的方法,其特征在于,所述方法还包括:

6.根据权利要求3所述的方法,其特征在于,所述在所述音形码特征对应的音形码相...

【专利技术属性】
技术研发人员:丁一钱育羡区晓江徐亮乔志勇
申请(专利权)人:中国移动通信集团广东有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1