文本识别系统的优化方法、计算机设备及存储介质技术方案

技术编号:26690573 阅读:42 留言:0更新日期:2020-12-12 02:41
本申请涉及人工智能,公开了一种文本识别系统的优化方法,包括以下步骤:获取OCR模型的训练样本,所述训练样本包括文本图片;将所述训练样本输入所述OCR模型进行训练;将训练得到的模型参数上传至服务器,其中,所述服务器对多个文本识别系统上传的模型参数进行优化,并将优化后的模型参数反馈至每个文本识别系统;根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代。本申请还公开了一种计算机设备以及计算机可读存储介质。本申请通过只分享文本数据对应的OCR模型参数到服务器进行优化,既能利用服务器的大数据处理能力优化文本识别系统,又能避免用户隐私信息泄露。

【技术实现步骤摘要】
文本识别系统的优化方法、计算机设备及存储介质
本申请涉及人工智能领域,尤其涉及一种文本识别系统的优化方法、计算机设备以及计算机可读存储介质。
技术介绍
在医疗科技中,涉及到万千诊断文本的处理,因此,文本识别系统的优化也成了一道关卡。目前为了利用云端或服务器的大数据处理能力,主流的文本识别系统的优化中都是将系统部署在服务端或者云端。但由于文本涉及病人的个人隐私,若都集中到服务端,万一服务端受到攻击就会容易引起个人隐私泄露,造成的后果不堪设想。上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本申请的主要目的在于提供一种文本识别系统的优化方法、计算机设备以及计算机可读存储介质,旨在解决利用服务器的大数据处理能力优化文本识别系统时,容易导致用户隐私信息泄露的问题。为实现上述目的,本申请提供一种文本识别系统的优化方法,所述文本识别系统的优化方法包括以下步骤:获取OCR模型的训练样本,所述训练样本包括文本图片;将所述训练样本输入所述OCR模型进行训练;将训练得到的模型参数上传至服务器,其中,所述服务器对多个文本识别系统上传的模型参数进行优化,并将优化后的模型参数反馈至每个文本识别系统;根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代。进一步地,所述根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代的步骤之后,还包括:在所述OCR模型迭代结束后,获取准确率最高的模型参数构建训练完成的OCR模型。进一步地,所述将所述训练样本输入所述OCR模型进行训练的步骤之前,还包括:对所述训练样本进行预处理,所述预处理包括图片去模糊处理、图片矫正处理和像素归一化处理中的至少一个。进一步地,所述根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代之后,还包括:在所述OCR模型训练完成后,将所述OCR模型转换为IR中间表达式;根据本地硬件信息,将所述IR中间表达式转换为应用于本地硬件的代码;根据所述代码进行所述OCR模型的本地部署。进一步地,所述根据本地硬件信息,将所述IR中间表达式转换为应用于本地硬件的代码的步骤之前,还包括:对所述IR中间表达式的卷积进行优化,以缩短所述IR中间表达式对应的运行时间。进一步地,所述根据所述代码进行所述OCR模型的本地部署的步骤之后,还包括:检测到目标文本图片时,将所述目标文本图片输入到本地部署的OCR模型;获取本地部署的OCR模型的输出值,作为所述目标文本图片对应的文本信息。为实现上述目的,本申请还提供一种文本的识别方法,所述文本识别系统的优化方法包括以下步骤:服务器接收到多个文本识别系统上传的模型参数时,对所述模型参数进行优化,其中,每个文本识别系统获取OCR模型的训练样本,将所述训练样本输入所述OCR模型进行训练,并将训练得到的模型参数上传至所述服务器,所述训练样本包括文本图片;将优化后的模型参数反馈至每个文本识别系统,以供每个文本识别系统根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代。进一步地,所述服务器接收到多个文本识别系统上传的模型参数时,对所述模型参数进行优化的步骤包括:服务器接收到多个文本识别系统上传的模型参数时,分别确定每种类别的模型参数对应的平均值;将所述平均值作为优化后的模型参数。为实现上述目的,本申请还提供一种计算机设备,所述计算机设备包括:所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的文本识别系统的优化程序,所述文本识别系统的优化程序被所述处理器执行时实现如上述文本识别系统的优化方法的步骤。为实现上述目的,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有文本识别系统的优化程序,所述文本识别系统的优化程序被处理器执行时实现如上述文本识别系统的优化方法的步骤。本申请提供的文本识别系统的优化方法、计算机设备以及计算机可读存储介质,获取OCR模型的训练样本,所述训练样本包括文本图片;将所述训练样本输入所述OCR模型进行训练;将训练得到的模型参数上传至服务器,其中,所述服务器对多个文本识别系统上传的模型参数进行优化,并将优化后的模型参数反馈至每个文本识别系统;根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代。这样,通过只分享文本数据对应的OCR模型参数到服务器进行优化,既能利用服务器的大数据处理能力优化文本识别系统,又能避免用户隐私信息泄露。附图说明图1为本申请一实施例中文本识别系统的优化方法步骤示意图;图2为本申请一实施例中文本识别系统的优化方法另一步骤示意图;图3为本申请一实施例中文本识别系统的优化方法又一步骤示意图;图4为本申请一实施例中文本识别系统的优化方法再一步骤示意图;图5为本申请一实施例中文本识别系统的优化方法再一步骤示意图;图6为本申请一实施例中文本识别系统的优化方法再一步骤示意图;图7为本申请一实施例中文本识别系统的优化方法再一步骤示意图;图8为本申请一实施例的计算机设备的结构示意框图。本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。参照图1,在一实施例中,所述文本识别系统的优化方法包括:步骤S10、获取OCR模型的训练样本,所述训练样本包括文本图片。本实施例中,实施例终端为计算机设备,如文本识别系统(例如医疗诊断文本识别系统)、智能终端等。以下以实施例终端为文本识别系统为例进行说明。需要说明的是,OCR(OpticalCharacterRecognition,光学字符识别)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。可选的,本实施例的OCR模型为CNN(ConvolutionalNeuralNetworks)+LSTM(LongShort-TermMemory)+CTC(ConnectionistTemporalClassfication)结构组成的深度学习模型。其中,CNN卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络(FeedforwardNeuralNetworks),是深度学习(deeplearning)的代表算法之一。卷积神经网络具有表征学习(representationlearning)能力,能够按其阶层结构对输入信息进行平移不变分类。其中,LSTM长短期记忆网络是一种时间循环神经网络,是为了解决一般的RNN(RecurrentNeuralNetwork)循环神经网络存在的长期依赖本文档来自技高网...

【技术保护点】
1.一种文本识别系统的优化方法,其特征在于,所述文本识别系统的优化方法包括以下步骤:/n获取OCR模型的训练样本,所述训练样本包括文本图片;/n将所述训练样本输入所述OCR模型进行训练;/n将训练得到的模型参数上传至服务器,其中,所述服务器对多个文本识别系统上传的模型参数进行优化,并将优化后的模型参数反馈至每个文本识别系统;/n根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代。/n

【技术特征摘要】
1.一种文本识别系统的优化方法,其特征在于,所述文本识别系统的优化方法包括以下步骤:
获取OCR模型的训练样本,所述训练样本包括文本图片;
将所述训练样本输入所述OCR模型进行训练;
将训练得到的模型参数上传至服务器,其中,所述服务器对多个文本识别系统上传的模型参数进行优化,并将优化后的模型参数反馈至每个文本识别系统;
根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代。


2.如权利要求1所述的文本识别系统的优化方法,其特征在于,所述根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代的步骤之后,还包括:
在所述OCR模型迭代结束后,获取准确率最高的模型参数构建训练完成的OCR模型。


3.如权利要求1所述的文本识别系统的优化方法,其特征在于,所述将所述训练样本输入所述OCR模型进行训练的步骤之前,还包括:
对所述训练样本进行预处理,所述预处理包括图片去模糊处理、图片矫正处理和像素归一化处理中的至少一个。


4.如权利要求1-3中任一项所述的文本识别系统的优化方法,其特征在于,所述根据所述服务器反馈的模型参数对所述OCR模型进行更新迭代之后,还包括:
在所述OCR模型训练完成后,将所述OCR模型转换为IR中间表达式;
根据本地硬件信息,将所述IR中间表达式转换为应用于本地硬件的代码;
根据所述代码进行所述OCR模型的本地部署。


5.如权利要求4所述的文本识别系统的优化方法,其特征在于,所述根据本地硬件信息,将所述IR中间表达式转换为应用于本地硬件的代码的步骤之前,还包括:
对所述IR中间表达式的卷积进行优化,以缩短所述IR中间表达式对应的运行时间。

<...

【专利技术属性】
技术研发人员:洪振厚王健宗瞿晓阳
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1