文本识别系统的优化方法、计算机设备及存储介质技术方案

技术编号：26690573 阅读：42 留言：0更新日期：2020-12-12 02:41

本申请涉及人工智能，公开了一种文本识别系统的优化方法，包括以下步骤：获取OCR模型的训练样本，所述训练样本包括文本图片；将所述训练样本输入所述OCR模型进行训练；将训练得到的模型参数上传至服务器，其中，所述服务器对多个文本识别系统上传的模型参数进行优化，并将优化后的模型参数反馈至每个文本识别系统；根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代。本申请还公开了一种计算机设备以及计算机可读存储介质。本申请通过只分享文本数据对应的OCR模型参数到服务器进行优化，既能利用服务器的大数据处理能力优化文本识别系统，又能避免用户隐私信息泄露。

全部详细技术资料下载

【技术实现步骤摘要】
文本识别系统的优化方法、计算机设备及存储介质
本申请涉及人工智能领域，尤其涉及一种文本识别系统的优化方法、计算机设备以及计算机可读存储介质。
技术介绍
在医疗科技中，涉及到万千诊断文本的处理，因此，文本识别系统的优化也成了一道关卡。目前为了利用云端或服务器的大数据处理能力，主流的文本识别系统的优化中都是将系统部署在服务端或者云端。但由于文本涉及病人的个人隐私，若都集中到服务端，万一服务端受到攻击就会容易引起个人隐私泄露，造成的后果不堪设想。上述内容仅用于辅助理解本申请的技术方案，并不代表承认上述内容是现有技术。
技术实现思路
本申请的主要目的在于提供一种文本识别系统的优化方法、计算机设备以及计算机可读存储介质，旨在解决利用服务器的大数据处理能力优化文本识别系统时，容易导致用户隐私信息泄露的问题。为实现上述目的，本申请提供一种文本识别系统的优化方法，所述文本识别系统的优化方法包括以下步骤：获取OCR模型的训练样本，所述训练样本包括文本图片；将所述训练样本输入所述OCR模型进行训练；将训练得到的模型参数上传至服务器，其中，所述服务器对多个文本识别系统上传的模型参数进行优化，并将优化后的模型参数反馈至每个文本识别系统；根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代。进一步地，所述根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代的步骤之后，还包括：在所述OCR模型迭代结束后，获取准确率最高的模型参数构建训练完成的OC...

【技术保护点】
1.一种文本识别系统的优化方法，其特征在于，所述文本识别系统的优化方法包括以下步骤：/n获取OCR模型的训练样本，所述训练样本包括文本图片；/n将所述训练样本输入所述OCR模型进行训练；/n将训练得到的模型参数上传至服务器，其中，所述服务器对多个文本识别系统上传的模型参数进行优化，并将优化后的模型参数反馈至每个文本识别系统；/n根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代。/n

【技术特征摘要】
1.一种文本识别系统的优化方法，其特征在于，所述文本识别系统的优化方法包括以下步骤：
获取OCR模型的训练样本，所述训练样本包括文本图片；
将所述训练样本输入所述OCR模型进行训练；
将训练得到的模型参数上传至服务器，其中，所述服务器对多个文本识别系统上传的模型参数进行优化，并将优化后的模型参数反馈至每个文本识别系统；
根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代。

2.如权利要求1所述的文本识别系统的优化方法，其特征在于，所述根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代的步骤之后，还包括：
在所述OCR模型迭代结束后，获取准确率最高的模型参数构建训练完成的OCR模型。

3.如权利要求1所述的文本识别系统的优化方法，其特征在于，所述将所述训练样本输入所述OCR模型进行训练的步骤之前，还包括：
对所述训练样本进行预处理，所述预处理包括图片去模糊处理、图片矫正处理和像素归一化处理中的至少一个。

4.如权利要求1-3中任一项所述的文本识别系统的优化方法，其特征在于，所述根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代之后，还包括：
在所述OCR模型训练完成后，将所述OCR模型转换为IR中间表达式；
根据本地硬件信息，将所述IR中间表达式转换为应用于本地硬件的代码；
根据所述代码进行所述OCR模型的本地部署。

5.如权利要求4所述的文本识别系统的优化方法，其特征在于，所述根据本地硬件信息，将所述IR中间表达式转换为应用于本地硬件的代码的步骤之前，还包括：
对所述IR中间表达式的卷积进行优化，以缩短所述IR中间表达式对应的运行时间。

<...

【专利技术属性】
技术研发人员：洪振厚，王健宗，瞿晓阳，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人