对识别结果进行辅助修改的方法和装置制造方法及图纸

技术编号：27879819 阅读：10 留言：0更新日期：2021-03-31 01:12

本说明书实施例提供了对识别结果进行辅助修改的方法和装置。根据实施例的方法，首先将通过终端设备识别得到的参考识别结果对应输出到预先根据语义特征划分好的语义分割单元中，通过将从语义分割单元中输出的与参考识别结果相关的目标文本输入到预先训练的修改结果预测模型中，该修改结果预测模型通过至少两组样本集训练得到，每一组样本集中包括一个样本目标文本与一个样本识别结果，此后，用户可以根据从修改结果预测模型中输出的辅助修改结果完成对识别结果的修改。

全部详细技术资料下载

【技术实现步骤摘要】
对识别结果进行辅助修改的方法和装置
本说明书一个或多个实施例涉及计算机
，尤其涉及对识别结果进行辅助修改的方法和装置。
技术介绍
目前，利用终端设备对待识别的目标进行自动识别的技术得到了广泛的应用，为人们的生活提供了便利。比如，光学字符识别(OpticalCharacterRecognition，OCR)技术能够将纸张上的字符识别为计算机文字，其已被广泛应用于证件识别、车牌识别和文档识别等领域。在对待识别的目标进行自动识别，得到识别结果后，该识别结果中往往会存在错误。因此，需要提供一种对识别结果进行辅助修改的方案。
技术实现思路
本说明书一个或多个实施例描述了对识别结果进行辅助修改的方法和装置，能够提供辅助修改结果，从而通过该辅助修改结果加快用户对终端的识别结果的修改过程。根据第一方面，提供了对识别结果进行辅助修改的方法，包括：在语义分割单元中输出终端设备对待识别文本的参考识别结果；获取所述语义分割单元中当前输出的与所述参考识别结果相关的目标文本；将该目标文本输入预先训练的修改结果预测模型；其中，所述修改结果预测模型通过至少两组样本集训练得到，每一组样本集中包括一个样本目标文本与一个样本识别结果；获得该修改结果预测模型输出的所述参考识别结果对应的辅助修改结果。在一个实施例中，所述修改结果预测模型包括：纠错模型；所述样本集包括：第一样本集；所述第一样本集中的样本目标文本为：对样本待识别文本识别后得到的样本参考识别结果；r>所述第一样本集中的样本识别结果为：根据该样本参考识别结果最终确定的识别结果；与所述参考识别结果相关的目标文本包括：所述参考识别结果对应的文本；所述参考识别结果对应的辅助修改结果包括：所述纠错模型输出的第一辅助修改结果。在一个实施例中，所述修改结果预测模型进一步包括：用户修改预测模型；所述样本集进一步包括：第二样本集；所述第二样本集中的样本目标文本为：用户输入的样本修改信息；所述第二样本集中的样本识别结果为：根据该样本修改信息最终确定的识别结果；在获得所述纠错模型输出的第一辅助修改结果之后，进一步包括：接收用户在所述语义分割单元中当前输入的修改信息；将当前输入的修改信息输入所述用户修改预测模型；由所述用户修改预测模型输出第二辅助修改结果。在一个实施例中，所述第二辅助修改结果不包括所述第一辅助修改结果。在一个实施例中，所述修改结果预测模型包括：用户修改预测模型；所述样本集包括：第二样本集；所述第二样本集中的样本目标文本为：用户输入的样本修改信息；所述第二样本集中的样本识别结果为：根据该样本修改信息最终确定的识别结果；与所述参考识别结果相关的目标文本包括：用户根据所述参考识别结果在所述语义分割单元中输入的修改信息；所述参考识别结果对应的辅助修改结果包括：所述用户修改预测模型输出的第三辅助修改结果。在一个实施例中，所述修改结果预测模型包括seq2seq语言模型。在一个实施例中，所述seq2seq语言模型的编解码器包括：基于循环神经网络的编解码器、基于长短时记忆网络的编解码器以及基于Transformer模型的编解码器中的任一个。在一个实施例中，在所述获得所述语义分割单元中输出的所述参考识别结果对应的辅助修改结果之后，进一步包括：将用户选择的一个辅助修改结果作为所述参考识别结果对应的最终识别结果。根据第二方面，提供了对识别结果进行辅助修改的装置，包括：参考识别结果输出模块，配置为在语义分割单元中输出终端设备对待识别文本的参考识别结果；目标文本获取模块，配置为获取所述语义分割单元中当前输出的与所述参考识别结果输出模块输出的所述参考识别结果相关的目标文本；辅助修改结果获得模块，配置为将所述目标文本获取模块获得的该目标文本输入预先训练的修改结果预测模型；其中，所述修改结果预测模型通过至少两组样本集训练得到，每一组样本集中包括一个样本目标文本与一个样本识别结果；获得该修改结果预测模型输出的所述参考识别结果对应的辅助修改结果。在一个实施例中，所述修改结果预测模型包括：纠错模型；所述样本集包括：第一样本集；所述第一样本集中的样本目标文本为：对样本待识别文本识别后得到的样本参考识别结果；所述第一样本集中的样本识别结果为：根据该样本参考识别结果最终确定的识别结果；与所述参考识别结果相关的目标文本包括：所述参考识别结果对应的文本；所述参考识别结果对应的辅助修改结果包括：所述纠错模型输出的第一辅助修改结果。在一个实施例中，所述修改结果预测模型进一步包括：用户修改预测模型；所述样本集进一步包括：第二样本集；所述第二样本集中的样本目标文本为：用户输入的样本修改信息；所述第二样本集中的样本识别结果为：根据该样本修改信息最终确定的识别结果；所述辅助修改结果获得模块，进一步配置为执行如下操作：接收用户在所述语义分割单元中当前输入的修改信息；将当前输入的修改信息输入所述用户修改预测模型；由所述用户修改预测模型输出所述参考识别结果对应的第二辅助修改结果。在上述装置的一个实施例中，所述第二辅助修改结果不包括所述第一辅助修改结果。在一个实施例中，所述修改结果预测模型包括：用户修改预测模型；所述样本集包括：第二样本集；所述第二样本集中的样本目标文本为：用户输入的样本修改信息；所述第二样本集中的样本识别结果为：根据该样本修改信息最终确定的识别结果；与所述参考识别结果相关的目标文本包括：用户根据所述参考识别结果在所述语义分割单元中输入的修改信息；所述参考识别结果对应的辅助修改结果包括：所述用户修改预测模型输出的第三辅助修改结果。在一个实施例中，所述修改结果预测模型包括seq2seq语言模型。在一个实施例中，所述seq2seq语言模型的编解码器包括：基于循环神经网络的编解码器、基于长短时记忆网络的编解码器和基于Transformer模型的编解码器中的任一个。根据第三方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行上述任一项所述的方法。根据第四方面，提供了一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现执行上述任一项所述的方法。根据本说明书实施例提供的方法和装置，将由终端设备对待识别文本进行识别后得到的参考识别结果从语义分割单元中输出，然后获取语义分割单元中当前输出的与参考识别结果相关的目标文本，如此，通过将该目标文本输入到预先训练好的修改结果预测模型中，从而得到与语义分割单元对应的辅助修改结果。由此可见，本说明书实施例提供的方案通过预先训练的修改结果预测模型，可以获得用于用户对参考识别结果进行辅助修改的辅助修改结果。后续，用户通过从辅助本文档来自技高网...

【技术保护点】
1.对识别结果进行辅助修改的方法，包括：/n在语义分割单元中输出终端设备对待识别文本的参考识别结果；/n获取所述语义分割单元中当前输出的与所述参考识别结果相关的目标文本；/n将该目标文本输入预先训练的修改结果预测模型；其中，所述修改结果预测模型通过至少两组样本集训练得到，每一组样本集中包括一个样本目标文本与一个样本识别结果；/n获得该修改结果预测模型输出的所述参考识别结果对应的辅助修改结果。/n

【技术特征摘要】
1.对识别结果进行辅助修改的方法，包括：
在语义分割单元中输出终端设备对待识别文本的参考识别结果；
获取所述语义分割单元中当前输出的与所述参考识别结果相关的目标文本；
将该目标文本输入预先训练的修改结果预测模型；其中，所述修改结果预测模型通过至少两组样本集训练得到，每一组样本集中包括一个样本目标文本与一个样本识别结果；
获得该修改结果预测模型输出的所述参考识别结果对应的辅助修改结果。

2.根据权利要求1所述的方法，其中，所述修改结果预测模型包括：纠错模型；所述样本集包括：第一样本集；
所述第一样本集中的样本目标文本为：对样本待识别文本识别后得到的样本参考识别结果；
所述第一样本集中的样本识别结果为：根据该样本参考识别结果最终确定的识别结果；
与所述参考识别结果相关的目标文本包括：所述参考识别结果对应的文本；
所述参考识别结果对应的辅助修改结果包括：所述纠错模型输出的第一辅助修改结果。

3.根据权利要求2所述的方法，其中，所述修改结果预测模型进一步包括：用户修改预测模型；所述样本集进一步包括：第二样本集；
所述第二样本集中的样本目标文本为：用户输入的样本修改信息；
所述第二样本集中的样本识别结果为：根据该样本修改信息最终确定的识别结果；
在获得所述纠错模型输出的参考识别结果对应的第一辅助修改结果之后，进一步包括：
接收用户在所述语义分割单元中当前输入的修改信息；
将当前输入的修改信息输入所述用户修改预测模型；
由所述用户修改预测模型输出所述参考识别结果对应的第二辅助修改结果。

4.根据权利要求3所述的方法，其中，所述第二辅助修改结果中不包括所述第一辅助修改结果。

5.根据权利要求1所述的方法，其中，所述修改结果预测模型包括：用户修改预测模型；所述样本集包括：第二样本集；
所述第二样本集中的样本目标文本为：用户输入的样本修改信息；
所述第二样本集中的样本识别结果为：根据该样本修改信息最终确定的识别结果；
与所述参考识别结果相关的目标文本包括：用户根据所述参考识别结果在所述语义分割单元中输入的修改信息；
所述参考识别结果对应的辅助修改结果包括：所述用户修改预测模型输出的第三辅助修改结果。

6.根据权利要求1至5中任一所述的方法，其中，所述修改结果预测模型包括seq2seq语言模型。

7.根据权利要求6所述的方法，其中，所述seq2seq语言模型的编解码器包括：基于循环神经网络的编解码器、基于长短时记忆网络的编解码器以及基于Transformer模型的编解码器中的任一个。

8.根据权利要求1至5中任一所述的方法，其中，在所述获得所述语义分割单元中输出的所述参考识别结果对应的辅助修改结果之后，进一步包括：
将用户选择的一个辅助修改结果作为所述参考识别结果对应的最终识别结果。

9.对识别结果进行辅助修改的装置，包括：
参考识别结果输出模块，配置为在语义分...

【专利技术属性】
技术研发人员：李哲，李若愚，王伟，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人