【技术实现步骤摘要】
一种文本识别中识别网络与语言模型的联合优化方法
[0001]本专利技术属于模式识别与人工智能
,特别涉及一种文本识别中识别网络与语言模型的联合优化方法。
技术介绍
[0002]随着深度学习技术的发展和相关硬件的逐渐完善,越来越多用于文本识别的人工智能神经网络被应用于实际生产和生活中。但是,复杂的背景、多种多样的书写风格和字体格式、庞大的字符种类数量使得识别效果仍然较差。人类在识别文本时,通常会结合语义信息进行快速而准确的识别。因而,如何设计一种能够高效利用识别网络的输出信息并结合语义进行推理的语言模型成为一项重要的研究课题。现有的方法通常将语言模型作为识别网络的后处理,对于识别网络的输出,通过传统的统计语言模型或者基于循环神经网络的语言模型进行处理,没有考虑到识别网络和语言模型是相互促进、相辅相成的。
技术实现思路
[0003]本专利技术为了实现文本行识别,提供一种文本识别中识别网络与语言模型的联合优化方法,该方案联合优化识别网络和语言模型,可以极大地提升识别准确率,具有很高的使用价值。
[00 ...
【技术保护点】
【技术特征摘要】
1.一种文本识别中识别网络与语言模型的联合优化方法,其特征在于,包括:采集文本数据,将所述文本数据划分为训练集和测试集,并设置文本行标签;构建识别网络,将所述文本数据输入所述识别网络,获得第一概率分布;构建语言模型,将所述概率分布输入所述语言模型,通过建模语义,获得第二概率分布;将所述训练集和所述文本行标签输入识别网络和语言模型串联组成的网络进行训练,获得目标网络;将所述测试集和所述文本行标签输入所述目标网络,获得识别结果。2.根据权利要求1所述的文本识别中识别网络与语言模型的联合优化方法,其特征在于,采集所述文本数据包括采集文本语料合成数据、现有文本行数据、待测文本行数据;将所述文本数据划分为训练集和测试集包括,将所述文本语料合成数据以及所述现有文本行数据作为训练集,所述待测文本行数据作为测试集。3.根据权利要求2所述的文本识别中识别网络与语言模型的联合优化方法,其特征在于,设置所述文本行标签包括基于所述文本语料合成数据的文本语料和单字数据,合成联机和脱机文本行的同时返回标签信息;基于所述现有文本行数据,读取记录的文本行标签。4.根据权利要求1所述的文本识别中识别网络与语言模型的联合优化方法,其特征在于,所述文本识别网络采用CTC识别网络或Attention识别网络;采用所述CTC识别网络,对于需要识别的输入X,输出为概率分布p
ctc
;所述概率分布p
ctc
表示为:其中Net
ctc
表示基于CTC的识别神经网络,T为时间点数量,n
cls
为字符类别数;采用所述Attention识别网络,对于需要识别的输入,输出为概率分布p
attn
:其中,Net
attn
表示基于Attention的识别神经网络,T为时间点数量,n
cls
为字符类别数。5.根据权利要求1所述的文本识别中识别网络与语言模型的联合优化方法,其特征在于,获得所述第二概率分布还包括,针对不同的文本类别,初始化不同的可学习嵌入;基于所述可学习嵌入构建可微分的预测嵌入;构建Transformer编码层;基于所述Transformer编码层构建基于Transformer编码器的语言模型,将所述可微分的预测嵌入作为所述语言模型的输入,获得建模语义后的特征;基于所述建模语义后的特征,通过分类器获得所述第二概率分布。6.根据权利要求5所述的文本识别中识别网络与语言模型的联合优化方法,其特征在于,所述可学习嵌入为针对CTC识别网络的第一可学习嵌入或针对Attention识别网络的第二...
【专利技术属性】
技术研发人员:彭德智,金连文,李鸿亮,谢灿宇,
申请(专利权)人:华南理工大学珠海现代产业创新研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。