【技术实现步骤摘要】
文本识别方法、装置及设备
本说明书涉及文本识别
,尤其涉及文本识别方法、装置及设备。
技术介绍
现有的文本识别方案大多数是单字符识别方案或短文本识别方案。其中,单字符识别方案通常是先获取单个字符,然后对单个字符进行分类,进而得到识别结果,该类方案具有成本高昂等缺陷。短文本识别方案对于较短文本的识别具有优势,但如果面临几十个字符以上的长度的长文本识别,则准确率大幅下降。
技术实现思路
为克服相关技术中存在的问题,本说明书提供了文本识别方法、装置及设备。根据本说明书实施例的第一方面,提供一种文本识别方法,所述方法包括:利用已训练的切割模型确定待识别文本图像的一个或多个切割位置;根据所述一个或多个切割位置,将所述待识别文本图像切割为至少两个子图像;将各个子图像输入至已训练的文本识别模型,由所述文本识别模型识别输入的子图像的语义特征信息,并结合语义特征信息上下文识别出子图像对应的文本信息;根据识别出的各子图像对应的文本信息,识别所述待识别文本图像。可选的,所述 ...
【技术保护点】
1.一种文本识别方法,其特征在于,包括:/n利用已训练的切割模型确定待识别文本图像的一个或多个切割位置;/n根据所述一个或多个切割位置,将所述待识别文本图像切割为至少两个子图像;/n将各个子图像输入至已训练的文本识别模型,由所述文本识别模型识别输入的子图像的语义特征信息,并结合语义特征信息上下文识别出子图像对应的文本信息;/n根据识别出的各子图像对应的文本信息,识别所述待识别文本图像。/n
【技术特征摘要】
1.一种文本识别方法,其特征在于,包括:
利用已训练的切割模型确定待识别文本图像的一个或多个切割位置;
根据所述一个或多个切割位置,将所述待识别文本图像切割为至少两个子图像;
将各个子图像输入至已训练的文本识别模型,由所述文本识别模型识别输入的子图像的语义特征信息,并结合语义特征信息上下文识别出子图像对应的文本信息;
根据识别出的各子图像对应的文本信息,识别所述待识别文本图像。
2.根据权利要求1所述的方法,其特征在于,所述文本识别模型中包括:双向长短时记忆网络BLSTM;
所述BLSTM在当前子图像为输入的首个子图像时,结合下一子图像的初始隐状态携带的语义特征信息识别出当前子图像对应的文本信息;
所述BLSTM在当前子图像为输入的最后一个子图像时,结合上一子图像的最终隐状态携带的语义特征信息识别出当前子图像对应的文本信息;
所述BLSTM在当前子图像不为输入的首个子图像、最后一个子图像时,结合上一子图像的最终隐状态和/或下一子图像的初始隐状态分别携带的语义特征信息识别出当前子图像对应的文本信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述文本识别模型识别出的各子图像对应的文本信息,识别所述待识别文本图像,包括:
按照所述各子图像在所述待识别文本图像中的排列顺序,将各子图像对应的文本信息进行拼接,根据拼接结果确定所述待识别文本图像对应的文本。
4.根据权利要求1所述的方法,其特征在于,所述切割模型通过如下方式训练得到:
配置增强学习算法的如下输入参数:环境、动作空间、状态空间和奖励,利用配置好参数的增强学习算法训练得到所述切割模型;其中,
所述环境包括:样本单行文本图像,所述样本单行文本图像标注有对应文本;
所述动作空间包括:对所述样本单行文本图像中设定大小窗口内的切割动作;
所述状态空间包括:所述样本单行文本图像被切割之后得到的两个样本子图像;
所述奖励基于拼接结果是否匹配所述样本单行文本图像的标注文本而确定;所述拼接结果利用文本识别模型分别对两个所述样本子图像的识别结果拼接得到。
5.根据权利要求4所述的方法,其特征在于,所述利用已训练的切割模型确定待识别文本图像的一个或多个切割位置,包括:
从所述待识别文本图像中获取待评估窗口图像,将所述待评估窗口图像输入至所述切割模型中,由所述切割模型在所述待评估窗口图像中获取切割位置;其中,所述待评估窗口图像的大小与所述设定大小窗口的大小相匹配。
6.根据权利要求1所述的方法,其特征在于,利用预先切割的多个样本切割图像训练文本识别模型,直至文本识别模型的识别能力...
【专利技术属性】
技术研发人员:程战战,
申请(专利权)人:杭州海康威视数字技术股份有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。