一种基于深度学习的近距离屏幕监控方法技术

技术编号:32827850 阅读:25 留言:0更新日期:2022-03-26 20:33
本发明专利技术公开了一种基于深度学习的近距离屏幕监控方法,首先通过摄像头获取被监控屏幕的图像,并对其进行预处理;采用自适应的方法对从预处理后的屏幕图像进行近距离校正;并采用无监督的方法使用连接的三个W

【技术实现步骤摘要】
一种基于深度学习的近距离屏幕监控方法


[0001]本专利技术涉及图像处理
,具体为一种基于深度学习的近距离屏幕监控方法。

技术介绍

[0002]近年来,人工智能在医疗卫生领域的应用变得日益流行。人工智能中的视觉图像识别技术在医疗场所中发挥着不可缺少的作用。其利用计算机及相关软硬件设备,通过对采集的图像信息进行特征信息提取,然后对图像进行相应的处理,可以为医疗工作人员提供相应的帮助。
[0003]传统医疗工作人员的工作中不仅仅需要对病人进行诊断,还需要对于一些特定的医疗设备进行长时间不断的监测。随着人们对于医疗越来越重视和目前人口老龄化、慢性病、新发突发传染病带来的医疗巨大挑战使得医疗工作者的工作负担增重,难以长时间不间断的进行设备的监测。传统的工作方式已经无法满足医疗工作者的需求。
[0004]随着深度学习在图像处理领域的快速发展,许多技术如OCR(Optical Character Recognition,光学字符识别),图像识别等越来越成熟,已逐步应用到了医疗领域中,比如医学影像识别,辅助诊断等。它们在一定程度上减少了本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的近距离屏幕监控方法,其特征在于,包括以下步骤:步骤1:通过摄像头获取被监控屏幕的图像,并对屏幕图像进行预处理;步骤2:近距离校正:采用自适应的方法对从预处理后的屏幕图像进行近距离校正;步骤3:目标区域分割:采用无监督的方法使用连接的三个W

GAN网络从校正后的屏幕图像中分割出目标区域;步骤4:所需文本区域检测:采用DBNet的方法从分割出的目标区域中提取出所需数据文本的边框,获得相应的文本图像;步骤5:对文本图像进行识别,获得屏幕数据。2.根据权利要求1所述的基于深度学习的近距离屏幕监控方法,其特征在于,所述步骤2具体为:步骤2.1:将预处理后的屏幕图像作为输入,对其进行卷积操作,然后全连接回归出空间变换系数;步骤2.2:将变化后的目标图片的每个像素坐标位置通过矩阵运算的方式,与得到的仿射变换矩阵系数矩阵进行矩阵运算,计算出目标图片中的每个像素坐标位置所对应的原图片的坐标位置;矩阵变化公式如下:其中,和表示原始图片的坐标,和表示目标图片的坐标,A
θ
表示通过全连接所得到的仿射变换的系数,θ
11
、θ
12
、θ
13
、θ
21
、θ
22
和θ
23
为具体的6个仿射系数;步骤2.3:根据所得到的原始像素坐标的位置信息,在原始图片中进行采样,采取双线性插值的方法,将原始图片中的像素复制到目标图片中去,得到校正后的屏幕图像。3.根据权利要求1所述的基于深度学习的近距离屏幕监控方法,其特征在于,所述步骤3具体为:步骤3.1:训练第一个W

GAN网络建立原始图像和其边缘图像的映射:将校正后的文本图像输入,使用Sobel算法获得输入图像的边缘图像,使用获得的边缘图像训练边缘图像的生成器,并在使用Sobel算法获得的边缘图片中添加高斯噪声;W

GAN的损失函数如下:其中,θ
G
,θ
D
表示生成器和判别器的参数,e为使用Sobel算法生成的边缘图像,z为生成器生成的边缘图像;和分别表示判别器判断真实边缘图片和生成边缘图片的期望;D(e)和D(z)分别表示判别器判断真实图片和生成图片为真实图片的概率;步骤3...

【专利技术属性】
技术研发人员:杨路汪恺璇刘展望朱涛
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1