文本识别方法、装置、设备及存储介质制造方法及图纸

技术编号:42221902 阅读:21 留言:0更新日期:2024-08-02 13:40
本申请实施例公开了一种文本识别方法、装置、设备及存储介质,先对图片进行特征提取,得到视觉特征,然后对视觉特征进行处理,得到文本识别结果,该文本识别结果以标记语言表述图片中的文本内容及其版面信息,也就是说,基于本申请生成了更加丰富的文本识别结果,提高了文本识别的智能性。

【技术实现步骤摘要】

本申请涉及人工智能,更具体地说,涉及一种文本识别方法、装置、设备及存储介质


技术介绍

1、文本识别是指将图片上的文字内容识别出来,变成可编辑的文本序列,便于人们对图片中的文字信息进行提取,并进行进一步的处理,比如编辑校正、抽取关键信息、文本翻译等。

2、目前的文本识别方法只能识别图片中的文本内容,智能性较差。


技术实现思路

1、有鉴于此,本申请提供了一种文本识别方法、装置、设备及存储介质,以提高文本识别的智能性。

2、为了实现上述目的,现提出的方案如下:

3、一种文本识别方法,包括:

4、对图片进行特征提取,得到视觉特征;

5、对所述视觉特征进行处理,得到文本识别结果,所述文本识别结果以标记语言表述所述图片中的文本内容以及所述文本内容的版面信息。

6、上述方法,可选的,所述对图片进行特征提取,包括:

7、对所述图片进行编码,得到初始特征图;

8、基于预学习的多个采样参数对所述初始特征图进行下采样,得到所述视觉特征本文档来自技高网...

【技术保护点】

1.一种文本识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对图片进行特征提取,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于预学习的多个采样参数对所述初始特征图进行下采样,包括:

4.根据权利要求1所述的方法,其特征在于,所述对所述视觉特征进行处理,包括:

5.根据权利要求1所述的方法,其特征在于,所述文本识别结果中文本内容的排序符合自然人阅读所述图片时对文本内容的阅读顺序。

6.根据权利要求1-5任一项所述的方法,其特征在于,对图片进行特征提取,对所述视觉特征进行处理的过程包括:通过特...

【技术特征摘要】

1.一种文本识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对图片进行特征提取,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于预学习的多个采样参数对所述初始特征图进行下采样,包括:

4.根据权利要求1所述的方法,其特征在于,所述对所述视觉特征进行处理,包括:

5.根据权利要求1所述的方法,其特征在于,所述文本识别结果中文本内容的排序符合自然人阅读所述图片时对文本内容的阅读顺序。

6.根据权利要求1-5任一项所述的方法,其特征在于,对图片进行特征提取,对所述视觉特征进行处理的过程包括:通过特征提取模型对所述图片进行特征提取,通过大模型对所述视觉特征进行处理;所述特征提取...

【专利技术属性】
技术研发人员:刘辰宇殷保才潘嘉殷兵胡金水谢名亮余文鑫晏黔东崔燕平张晋王士进刘聪胡国平
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1