【技术实现步骤摘要】
图片中文本的提取方法、装置、设备及可读存储介质
[0001]本申请涉及图片处理
,更具体的说,是涉及一种图片中文本的提取方法、装置、设备及可读存储介质。
技术介绍
[0002]在一些场景(比如,政法行业中,司法机关办案人员在办理案件过程,将纸质卷宗转化为电子卷宗的时候)中,往往需要提取图片中的文本。
[0003]现有技术中,图片只能以文件或二进制流的形式进行存储,如果要提取图片中的文本,需要利用诸如OCR(Optical Character Recognition,光学字符识别)之类的图片文本识别方法对图片中的文本进行识别提取,无法在图片浏览的时候,通过直接对图片中文本进行选择和复制操作实现图片中文本的提取。
[0004]因此,如何提供一种能够在浏览图片的同时对图片中文本进行直接提取的图片中文本的提取方法,成为本领域技术人员亟待解决的问题。
技术实现思路
[0005]鉴于上述问题,本申请提出了一种图片中文本的提取方法、装置、设备及可读存储介质。具体方案如下:
[0006]一种图片 ...
【技术保护点】
【技术特征摘要】
1.一种图片中文本的提取方法,其特征在于,所述方法包括:获取待进行文本提取的图片;将所述图片的存储格式转换为目标存储格式,所述目标存储格式中包括所述图片的字符串编码结果和所述图片的文本识别结果,所述图片的文本识别结果包括文本内容信息;对所述预设存储格式进行解析,生成显示内容,所述显示内容包括所述图片以及所述文本内容信息,所述文本内容信息处于可编辑状态。2.根据权利要求1所述的方法,其特征在于,所述将所述图片的存储格式转换为目标存储格式,包括:对所述图片进行字符串编码,得到所述图片的字符串编码结果;对所述图片进行文本识别,得到所述图片的文本识别结果;将所述图片的字符串编码结果和所述图片的文本识别结果进行封装,得到所述图片的目标存储格式。3.根据权利要求2所述的方法,其特征在于,所述对所述图片进行字符串编码,得到所述图片的字符串编码结果,包括:采用Base64编码方式对所述图片进行字符串编码,得到所述图片的字符串编码结果。4.根据权利要求2所述的方法,其特征在于,所述对所述图片进行文本识别,得到所述图片的文本识别结果,包括:采用光学字符识别OCR技术,对所述图片进行文本识别,得到所述图片的文本识别结果。5.根据权利要求2所述的方法,其特征在于,所述将所述图片的字符串编码结果和所述图片的文本识别结果进行封装,得到所述图片的目标存储格式,包括:将所述图片的字符串编码结果和所述图片的文本识别结果进行加密,得到加密后的图片的字符串编码结果和加密后的图片的文本识别结果;对所述加密后的图片的字符串编码结果和所述加密后的图片的文本识别结果进行封装,得到所述图片的目标...
【专利技术属性】
技术研发人员:胡国彪,洪响斌,刘江,昕宇,胡运强,李磊,
申请(专利权)人:讯飞智元信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。