【技术实现步骤摘要】
文本识别系统的优化方法、计算机设备及存储介质
本申请涉及人工智能领域,尤其涉及一种文本识别系统的优化方法、计算机设备以及计算机可读存储介质。
技术介绍
在医疗科技中,涉及到万千诊断文本的处理,因此,文本识别系统的优化也成了一道关卡。目前为了利用云端或服务器的大数据处理能力,主流的文本识别系统的优化中都是将系统部署在服务端或者云端。但由于文本涉及病人的个人隐私,若都集中到服务端,万一服务端受到攻击就会容易引起个人隐私泄露,造成的后果不堪设想。上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本申请的主要目的在于提供一种文本识别系统的优化方法、计算机设备以及计算机可读存储介质,旨在解决利用服务器的大数据处理能力优化文本识别系统时,容易导致用户隐私信息泄露的问题。为实现上述目的,本申请提供一种文本识别系统的优化方法,所述文本识别系统的优化方法包括以下步骤:获取OCR模型的训练样本,所述训练样本包括文本图片;将所述训练样本输入所述OCR
【技术保护点】
1.一种文本识别系统的优化方法,其特征在于,所述文本识别系统的优化方法包括以下步骤:/n获取OCR模型的训练样本,所述训练样本包括文本图片;/n将所述训练样本输入所述OCR模型进行训练;/n将训练得到的模型参数上传至服务器,其中,所述服务器对多个文本识别系统上传的模型参数进行优化,并将优化后的模型参数反馈至每个文本识别系统;/n根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代。/n
【技术特征摘要】
1.一种文本识别系统的优化方法,其特征在于,所述文本识别系统的优化方法包括以下步骤:
获取OCR模型的训练样本,所述训练样本包括文本图片;
将所述训练样本输入所述OCR模型进行训练;
将训练得到的模型参数上传至服务器,其中,所述服务器对多个文本识别系统上传的模型参数进行优化,并将优化后的模型参数反馈至每个文本识别系统;
根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代。
2.如权利要求1所述的文本识别系统的优化方法,其特征在于,所述根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代的步骤之后,还包括:
在所述OCR模型迭代结束后,获取准确率最高的模型参数构建训练完成的OCR模型。
3.如权利要求1所述的文本识别系统的优化方法,其特征在于,所述将所述训练样本输入所述OCR模型进行训练的步骤之前,还包括:
对所述训练样本进行预处理,所述预处理包括图片去模糊处理、图片矫正处理和像素归一化处理中的至少一个。
4.如权利要求1-3中任一项所述的文本识别系统的优化方法,其特征在于,所述根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代之后,还包括:
在所述OCR模型训练完成后,将所述OCR模型转换为IR中间表达式;
根据本地硬件信息,将所述IR中间表达式转换为应用于本地硬件的代码;
根据所述代码进行所述OCR模型的本地部署。
5.如权利要求4所述的文本识别系统的优化方法,其特征在于,所述根据本地硬件信息,将所述IR中间表达式转换为应用于本地硬件的代码的步骤之前,还包括:
对所述IR中间表达式的卷积进行优化,以缩短所述IR中间表达式对应的运行时间。
<...
【专利技术属性】
技术研发人员:洪振厚,王健宗,瞿晓阳,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。