英文语句的扫描纠错方法、装置及计算机可读存储介质制造方法及图纸

技术编号:38105282 阅读:15 留言:0更新日期:2023-07-06 09:26
本发明专利技术公开了一种英文语句的扫描纠错方法,包括以下步骤:获取当前扫描到的英文语句;根据深度学习模型检查所述英文语句的异常词组;选取符合所述异常词组语义的词组对所述英文语句进行修正形成修正后的英文语句。本发明专利技术还公开了一种装置及计算机可读存储介质,本发明专利技术能够基于语义上下文,快速准确地确定出错词对应的正确词,以此对错误语句进行纠正,可提高识别英文纠错准确率。高识别英文纠错准确率。高识别英文纠错准确率。

【技术实现步骤摘要】
英文语句的扫描纠错方法、装置及计算机可读存储介质


[0001]本专利技术涉及扫读笔应用
,尤其涉及一种英文语句的扫描纠错方法、装置及计算机可读存储介质。

技术介绍

[0002]识别功能作为线上扫读笔最基本的且最核心的功能,识别准确率是用户购买的最重要的标准,用户快速或慢速扫描可能导致摄像头采集的图片存在丢帧问题,从而极容易出现漏字母、字母顺序错误、多字母的情况,导致用户无法得到正确的扫描结果。因此对于英文识别准确率的提升,采用英文单词自动纠错技术是必不可少一种方式。
[0003]目前的英文单词扫描纠错方法通过采用单词查表的方式,如果错误则通过编辑距离查找正确的词,由于编辑距离和错词相近的词可能有多个。用来筛选正确词的处理方法,难以获得准确正确词,即无法保障纠错后的词为用户扫描的单词。也就是说,目前英文扫描纠错方法的准确率较低,难以满足实际纠错需求。

技术实现思路

[0004]本申请实施例通过提供一种英文语句的扫描纠错方法、装置及计算机可读存储介质,旨在解决现有英文扫描纠错方法的准确率过低的技术问题。
[0005]为解决上述技术问题,本申请提供了一种英文语句的扫描纠错方法,包括以下内容:获取当前扫描到的英文语句;根据深度学习模型检查所述英文语句的异常词组;选取符合所述异常词组语义的词组对所述英文语句进行修正形成修正后的英文语句。
[0006]可选的,所述选取符合所述异常词组的单词对所述英文语句进行修正的步骤包括:确认所述英文语句是否存在备用单词库;若存在所述备用单词库,自所述备用单词库中选取高频出现且符合所述异常词组语义的单词对所述英文语句进行修正。
[0007]可选的,所述确认所述英文语句是否存在备用单词库的步骤之前,还包括:以预设的NLP分词法确认所述英文语句是否存在错误单词;在确认所述英文语句存在错误单词时,自候选余料词库中筛选高频单词生成所述备选单词库。
[0008]可选的,所述以预设的NLP分词法确认所述英文语句是否存在错误单词的步骤,包括:应用所述NLP分词法对所述英文语句分词;核验分词结果以确定所述英文语句是否存在错误单词。
[0009]可选的,所述在确认所述英文语句存在错误单词的步骤,包括:确认所述错误词组在所述英文语句的位置,并在所述位置标记目标序列;对已标记所述目标序列的英文语句进行预处理并得出预处理结果。
[0010]可选的,所述选取符合所述异常词组语义的词组对所述英文语句进行修正形成修正后的英文语句的步骤之后,还包括:以预设的拼写错误模型对修正后的所述英文语句进行数据测试验证;并在确认所述英文语句验证无误后输出所述英文语句。
[0011]可选的,所述英文语句的扫描纠错方法还包括:采集英语词库数据,以采集到的英语词库数据创建数据语料库;根据所述数据语料库创建网络模型,以创建的所述网络模型对所述数据语料库的数据进行模型学习和训练并生成深度学习模型。
[0012]可选的,所述英文语句的扫描纠错方法还包括:根据所述数据语料库的数据创建拼写错误模型;在所述拼写错误模型中设置拼写错误算法以验证纠错后的英语长句。
[0013]此外,为实现上述目的,本专利技术还提供了一种英文语句的扫描纠错装置,所述英文语句的扫描纠错装置包括存储器、处理器以及存储在所述存储器并可在所述处理器上运行的英文语句的扫描纠错程序,所述英文语句的扫描纠错程序被所述处理器执行时实现如上所述英文语句的扫描纠错方法的各个步骤。
[0014]本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有英文语句的扫描纠错程序,所述英文语句的扫描纠错程序被所述处理器执行时实现如上所述的英文语句的扫描纠错方法的各个步骤。
[0015]本申请所提供一种英文单词扫描纠错方法,获取当前扫描到的英文语句;根据深度学习模型检查所述英文语句的异常词组;选取符合所述异常词组语义的词组对所述英文语句进行修正形成修正后的英文语句。本申请所公开的
技术实现思路
,能够基于语义上下文,快速准确地确定出错词对应的正确词,以此对错误语句进行纠正,可提高识别英文纠错准确率。
附图说明
[0016]图1是本专利技术实施例方案涉及的硬件运行环境的终端结构示意图。;图2为英文语句的扫描纠错方法第一实施例的流程示意图;图3为英文语句的扫描纠错方法第二实施例的流程示意图;图4为英文语句的扫描纠错方法第三实施例的流程示意图。
[0017]实施方式
[0018]为了更好的理解上述技术方案,下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0019]参照图1,图1为本专利技术实施例方案涉及的硬件运行环境多终端结构示意图。
[0020]如图1所示,该终端可以包括:处理器101,例如CPU,存储器102,通信总线103。其中,通信总线103用于实现这些组件之间的连接通信。存储器103可以是高速RAM存储器,也可以是稳定的存储器(non

volatile memory),例如磁盘存储器。
[0021]存储器102可选的还可以是独立于前述处理器101的存储装置。作为一种计算机存储介质的存储器102中可以包括英文语句的扫描纠错程序。处理器101可以用于调用存储器102中存储的英文语句的扫描纠错程序,并执行以下操作:获取当前扫描到的英文语句;根据深度学习模型检查所述英文语句的异常词组;选取符合所述异常词组语义的词组对所述英文语句进行修正形成修正后的英文语句。
[0022]在一实施例中,处理器101可以调用存储器102中存储的英文语句的扫描纠错程序,还执行以下操作:确认所述英文语句是否存在备用单词库;若存在所述备用单词库,自所述备用单词库中选取高频出现且符合所述异常词组语义的单词对所述英文语句进行修正。
[0023]在一实施例中,处理器101可以调用存储器102中存储的英文语句的扫描纠错程序,还执行以下操作:以预设的NLP分词法确认所述英文语句是否存在错误单词;在确认所述英文语句存在错误单词时,自候选余料词库中筛选高频单词生成所述备选单词库。
[0024]在一实施例中,处理器101可以调用存储器102中存储的英文语句的扫描纠错程序,还执行以下操作:应用所述NLP分词法对所述英文语句分词;核验分词结果以确定所述英文语句是否存在错误单词。
[0025]在一实施例中,处理器101可以调用存储器102中存储的英文语句的扫描纠错程序,还执行以下操作:确认所述错误词组在所述英文语句的位置,并在所述位置标记目标序列;对已标记所述目标序列的英文语句进行预处理并得出预处理结果。
[0026]在一实施例中,处理器101可以调用存储器102中存储的英文语句的扫描纠错程序,还执行以下操作:以预设的拼写错误模型对修正后的所述英文语句进行数据测试验证本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种英文语句的扫描纠错方法,其特征在于,所述英文语句的扫描纠错方法包括以下步骤:获取当前扫描到的英文语句;根据深度学习模型检查所述英文语句的异常词组;选取符合所述异常词组语义的词组对所述英文语句进行修正形成修正后的英文语句。2.如权利要求1所述的英文语句的扫描纠错方法,其特征在于,所述选取符合所述异常词组的单词对所述英文语句进行修正的步骤包括:确认所述英文语句是否存在备用单词库;若存在所述备用单词库,自所述备用单词库中选取高频出现且符合所述异常词组语义的单词对所述英文语句进行修正。3.如权利要求2所述的英文语句的扫描纠错方法,其特征在于,所述确认所述英文语句是否存在备用单词库的步骤之前,还包括:以预设的NLP分词法确认所述英文语句是否存在错误单词;在确认所述英文语句存在错误单词时,自候选余料词库中筛选高频单词生成所述备选单词库。4.如权利要求3所述的英文语句的扫描纠错方法,其特征在于,所述以预设的NLP分词法确认所述英文语句是否存在错误单词的步骤,包括:应用所述NLP分词法对所述英文语句分词;核验分词结果以确定所述英文语句是否存在错误单词。5.如权利要求3所述的英文语句的扫描纠错方法,其特征在于,所述在确认所述英文语句存在错误单词的步骤,包括:确认所述错误词组在所述英文语句的位置,并在所述位置标记目标序列;对已标记所述目标序列的英文语句进行预处理并得出预处理结果。6.如权利要求1所述的英文语句的扫描纠错方...

【专利技术属性】
技术研发人员:罗辉马志宇伍炬彬李云军韦刚
申请(专利权)人:深圳市云希谷科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1