一种针对国产瘦客户机的图片内容提取方法技术

技术编号:23765267 阅读:29 留言:0更新日期:2020-04-11 19:29
本发明专利技术提供了一种针对国产瘦客户机的图片内容提取方法。所述方法包括基于国产操作系统内核的WINE兼容子系统和MODI内容提取子系统。首先启动基于国产操作系统内核的WINE兼容子系统,该子系统启动后会注册并拦截Windows相关的系统调用,再启动MODI内容提取子系统,并注入到WINE兼容子系统中,两个系统启动完成后即可提供图片中文内容提取服务。调用者选择要提取内容的图片文件,将路径传入给MODI内容提取子系统,后者借助于WINE兼容子系统进行系统调用转换,提取图片中的中文文本后,返回给调用者。本方法具有较高的中文内容识别率,对瘦客户机操作系统环境无侵入性,不残留使用痕迹,尤其对瘦客户机内存资源占有较小,具有广泛适用性。

A method of image content extraction for domestic thin client

【技术实现步骤摘要】
一种针对国产瘦客户机的图片内容提取方法
涉及信息安全领域,尤其涉及一种保密单位的软硬件国产化的内容审计应用领域。
技术介绍
国产瘦客户机多是基于Linux内核,硬件性能弱,内存较小。目前在这一平台上的图片内容提取的主流方法是基于GoogleTesseract项目的OCR技术,但对于中文的识别率较低,并且该方法需要安装软件,对客户机操作系统有侵入性,也会带来额外的依赖冲突,导致软件兼容性不佳,而识别率较高的基于国产liveCD操作系统的MicrosoftOfficeDocumentImaging虚拟机方案对客户机内存要求比较大,无法适用于瘦客户机场景。
技术实现思路
一种针对国产瘦客户机的图片内容提取方法,包括:基于国产操作系统内核的WINE兼容子系统和MODI内容提取子系统;基于国产操作系统内核的WINE兼容子系统,用于实现国产操作系统系统调用与Windows系统调用之间的代理、转换与兼容模块,对于待提取客户机系统无侵入性,无需在其中安装任何组件,避免了依赖冲突,也不残留提取痕迹,占用内存小,对瘦客户机广泛兼本文档来自技高网...

【技术保护点】
1.一种针对国产瘦客户机的图片内容提取方法,包括:/n基于国产操作系统内核的WINE 兼容子系统和MODI内容提取子系统。/n

【技术特征摘要】
1.一种针对国产瘦客户机的图片内容提取方法,包括:
基于国产操作系统内核的WINE兼容子系统和MODI内容提取子系统。


2.根据权利要求1所述的一种针对国产瘦客户机的图片内容提取方法,其特征在于:
基于国产操作系统内核的WINE兼容子系统,用于实现国产操作系统系统调用与Windows系统调用之间的代理、转换与兼容模块,对于...

【专利技术属性】
技术研发人员:傅涛郑秩王力王路路梁旭
申请(专利权)人:博智安全科技股份有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1