The embodiment of the invention discloses a modified word recognition method and terminal, including | the method to generate correction request correction request includes Amendment to be written, to be amended text from the recognition by optical character recognition technology of stored images and text on the picture and text recognition results generated text feature image; the text in the picture stored in the text and the amendment to be corresponding to the text; text features and features of images and text of the text of the pre deposit are compared to obtain several candidate text text text similarity, characteristic features of some candidate text and the corresponding image characters is higher than the preset standard value; to display the number of candidate text for the user to choose; to detect if the user selects candidate text from several candidate text, the candidate text is selected to replace text recognition results Text to be corrected. The embodiment of the invention can reduce the operation of users and improve the correction efficiency through the method.
【技术实现步骤摘要】
一种文字识别的修正方法以及终端
本专利技术涉及电子
,尤其涉及一种文字识别的修正方法以及终端。
技术介绍
光学字符识别技术简称为OCR(OpticalCharacterRecognition)识别技术,是一种通过光学技术对文字进行识别的图像识别技术。光学字符识别技术现已被广泛地应用到自动识别技术研究的领域。例如建立网络图书馆时,将纸质书籍扫描后以文件的形式存入电子识别,再通过OCR文字识别后以文本文件的形式展示。由于OCR识别时经常出现识别错误的情况,尤其识别相似的文字时出现识别混淆的情况,且识别出错后,一般是依靠用户手动编辑修改,即用户在键盘中输入正确的文字,但是该修正方式需要用户繁琐的操作,而导致修正的效率低。
技术实现思路
本专利技术实施例提供一种文字识别的修正方法以及终端,可以减少用户的操作,提高修正的效率。第一方面,本专利技术实施例提供了一种文字识别的修正方法,方法包括:生成修正请求,修正请求包括待修正的文字,待修正的文字选自于利用光学字符识别技术识别预存图片上的图像文字而生成的文字识别结果;获取在预存图片中与待修正的文字相对应的图像文字的文字特征;将图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字,若干候选文字的文字特征与相对应的图像文字的文字特征的相似度高于预设标准值;显示若干候选文字以供用户选择;若检测到用户从若干候选文字中选择了候选文字,将被选择的候选文字替换所述文字识别结果中的待修正的文字。另一方面,本专利技术实施例提供了一种终端,终端包括:导出单元、获取单元、对比单元、显示单元以及替换单元。其中,导出单元用于生成修正 ...
【技术保护点】
一种文字识别的修正方法,其特征在于,包括:生成修正请求,所述修正请求包括待修正的文字,所述待修正的文字选自于利用光学字符识别技术识别预存图片上的图像文字而生成的文字识别结果;获取在所述预存图片中与所述待修正的文字相对应的图像文字的文字特征;将所述图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字,所述若干候选文字的文字特征与相对应的所述图像文字的文字特征的相似度高于预设标准值;显示所述若干候选文字以供用户选择;若检测到用户从所述若干候选文字中选择了候选文字,将被选择的候选文字替换所述文字识别结果中的待修正的文字。
【技术特征摘要】
1.一种文字识别的修正方法,其特征在于,包括:生成修正请求,所述修正请求包括待修正的文字,所述待修正的文字选自于利用光学字符识别技术识别预存图片上的图像文字而生成的文字识别结果;获取在所述预存图片中与所述待修正的文字相对应的图像文字的文字特征;将所述图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字,所述若干候选文字的文字特征与相对应的所述图像文字的文字特征的相似度高于预设标准值;显示所述若干候选文字以供用户选择;若检测到用户从所述若干候选文字中选择了候选文字,将被选择的候选文字替换所述文字识别结果中的待修正的文字。2.根据权利要求1所述方法,其特征在于,所述生成修正请求包括:检测是否存在用户从所述文字识别结果中选择文字的操作;若存在选择文字的操作,生成修正请求,所述修正请求包括被选择的文字,所述被选择的文字为所述待修正的文字。3.根据权利要求1所述的方法,其特征在于,所述生成修正请求包括:检测所述文字识别结果中是否有预设的文字,所述预设的文字是预先设置的基于光学字符识别时出错频率高于特定值的文字;若有预设的文字,生成修正请求,所述修正请求包括所述预设的文字,所述预设的文字为所述待修正的文字。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据待修正文字的笔画数量划分若干等级,不同的等级对应的所述预设标准值不同;将所述图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字之前,所述方法还包括:识别所述待修正的文字的笔画数量;根据笔画数量获取相对应的所述预设标准值。5.根据权利要求1所述的方法,其特征在于,若待修正的文字包括词组,所述将所述图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字,包括:将待修正的文字中每个文字对应的所述图像文字的文字特征分别与预存文字的文字特征进行对比来获取所述每个文字对应的候选文字;根据所述待修正的文字中所述每个文字对应的候选文字进行组合以形成若干词组;获取所述若干词组中每个文字与相对应的图像文字的文字特征的相似度;计算出所述若干词组中每个词组的相似度,所述每个词组的相似度为获取的每个词组中每个文字与相对应的图像文字的文字特征的相似度的平均值;将所述若干词组中词组的相似度高于预设标准值的词组设置为所述候选文字。6.一种终端,其特征在于,所述终端包括:导出单元,用于生成修正请求,所述修正请求...
【专利技术属性】
技术研发人员:江克俊,刘海强,曹晓杰,
申请(专利权)人:深圳市金立通信设备有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。