【技术实现步骤摘要】
基于RPA和AI的图像识别方法及电子设备
[0001]本专利技术涉及人工智能领域,具体涉及基于RPA和AI的图像识别方法及电子设备。
技术介绍
[0002]机器人流程自动化(Robotic Process Automation,RPA)是一种用于实现用户界面自动化技术的软件工具。它能够按照预先设定好的业务规则和逻辑去完成相应的动作,即以固定的逻辑执行预先编排好的规则,也就是说RPA本身并不具有学习的能力,因此当RPA与AI结合后相当于是在基于规则的自动化基础之上增加了基于人工智能和认知技术的推理、判断和决策能力,可以实现真正的智能流程自动化。
[0003]目前大环境中,电脑办公已经是常态化的现象,然而部分工作还是需要纸质版报告或图表,但是在进行远程交接的时候,就需要电子版的报告、图表等,人为重新制表耗时耗力,所以出现了对图像中的文本进行识别的技术,利用电子设备对纸质版图表进行扫描,利用计算机进行文字识别,获取图像中的文本字符,让机器代替人去进行证件审核乃至于文本审核,首先需要让机器看到人所能看到的,因此在RPA进行数 ...
【技术保护点】
【技术特征摘要】
1.基于RPA和AI的图像识别方法,其特征在于,包括:获取扫描文件灰度图;对扫描文件灰度图进行高斯模糊得到模糊区域后再进行阈值分割得到扫描文件二值图,提取扫描文件二值图中每个模糊区域中所有的中轴线,该中轴线是由位于同一条直线上的像素点构成,并获取每条中轴线的字符角度;利用扫描文件二值图中每条中轴线的字符角度及各字符角度的频率计算该扫描文件二值图的方向混乱程度,根据扫描文件二值图的方向混乱程度对该扫描文件是否为平整纸面进行判断,若该扫描文件为平整纸面直接对该扫描文件使用OCR技术进行文本字符的识别和提取;若该扫描文件为非平整纸面,利用每条中轴线的字符角度所出现的频率计算该中轴线上像素点为褶皱像素点的初始概率;获取每条中轴线上所有像素点在扫描文件灰度图中的灰度值,将每条中轴线上灰度值最小的像素点作为该中轴线上的参考点;利用每条中轴线上的每个像素点与该中轴线的参考点之间的距离对该中轴线上像素点为褶皱像素点的初始概率进行修改,得到每条中轴线上像素点为褶皱像素点的最终概率;获取所有中轴线在扫描文件灰度图中的交点,根据扫描文件灰度图中每个像素点到最近距离的交点的距离、及该最近距离的交点所在的中轴线上像素点为褶皱像素点的概率计算扫描文件灰度图中每个像素点的参考权重;利用最近邻分类器结合每个像素点的参考权重对OCR中文本字符的匹配程度进行修正,利用OCR中修正后的文本字符的匹配程度对扫描文件进行图像识别提取文本内容。2.根据权利要求1所述的基于RPA和AI的图像识别方法,其特征在于,所述扫描文件二值图的方向混乱程度的计算公式如下:其中,为扫描文件二值图的方向混乱程度,为中轴线的字符角度的数量,为中轴线的字符角度的序号,表示扫描文件灰度图的中轴线的第种字符角度,表示扫描文件灰度图的中轴线的第种字符角度的频率。3.根据权利要求1所述的基于RPA和AI的图像识别方法,其特征在于,所述计算扫描文件灰度图中每个像素点的参考权重的过程为:将存在多个方向的中轴线像素点记为交点,即中轴线的交点,获取扫描文件灰度图中的所有交点;根据扫描文件灰度图中每个像素点到最近距离的交点的距离和该最近距离的交点所在的中轴线像素点组为褶皱像素点的概率计算扫描文件灰度图中每个像素点的参考权重,计算公式如下:
其中,为扫描文件灰度图中第个像素点的参考权重,为扫描文件灰度图中第个像素点到与该像素点最近距离的交点的距离,表示与第个像素点最近距离的交点,表示存在与该像素点最近距离交点的中轴线上像素点为褶皱像素点的概率的最大值。4.根据权利要求1所述的基于RPA和AI的图像识别方法,其特征在于,所述每条中轴线的字符角度及各字符角度的频率的获取方法为:将每条中轴线像素点连接起来得到中轴线,将每条中轴线像素点组成的中轴线向量与水平方向的夹角作为该中轴线的字符角度,并将与看作同一种字符角度情况,统计不同的字符角度的频率得到各字符角度的频率。5.根据权利要求1所述的基于RPA和AI的图像识别方法,其特征在于,所述每条中轴线上像素点为褶皱像素点的最终概率的计算方法如下:...
【专利技术属性】
技术研发人员:刘艳,卢小鹏,
申请(专利权)人:富璟科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。