文本识别方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:40597464 阅读:13 留言:0更新日期:2024-03-12 22:00
本发明专利技术公开了一种文本识别方法、装置、电子设备及可读存储介质,应用于计算机视觉技术领域。其中,方法包括获取经过预训练过程处理的文本类型识别模型,根据其模型结构特点确定能够自动选择微调过程中的待调整参数的参数选择网络。根据文本数据训练样本集的各文本样本的预测值和对应的文本类型标签、文本类型识别模型在训练过程中的稀疏度损失得到损失函数,并结合文本数据训练样本集及文本识别任务对文本类型识别模型的各待更新参数进行微调,从而得到能够对输入的待处理文本进行文本类型识别的文本类型识别模型。本发明专利技术可以解决相关技术对文本类型识别模型进行微调时有效性和灵活性差的问题,能够提升文本类型识别精准度和识别效率。

【技术实现步骤摘要】

本专利技术涉及计算机视觉,特别是涉及一种文本识别方法、装置、电子设备及可读存储介质


技术介绍

1、随着人工智能技术的快速普及应用,为不同任务的执行提供了通用化基础模型的预训练模型被广泛应用。为了与实际下游任务相适配,同时兼顾模型微调的效率与资源占用情况,通常固定大部分预训练参数,对预训练模型的少量或额外的模型参数进行微调。

2、计算机视觉技术中的自然语言处理任务中的文本识别任务通常使用传统的大型预训练语言模型作为文本类型识别模型来实现文本类型的识别,在对该类大型预训练语言模型进行微调时,通常利用稀疏矩阵表示参数变化,并通过引入固定的辅助参数实现对文本类型识别模型的参数进行调整。但是,由于不同层的辅助参数的秩的选取、辅助参数的位置均依赖人工经验试错,无法保证对不同文本类型识别模型均能有效,且文本类型识别模型训练过程中的辅助参数的个数是固定的,灵活性较差。

3、鉴于此,实现对文本类型识别模型有效且灵活的参数调整,提升文本类型识别精准度和识别效率,是所属领域技术人员需要解决的技术问题。


术实现思路<本文档来自技高网...

【技术保护点】

1.一种文本识别方法,其特征在于,包括:

2.根据权利要求1所述的文本识别方法,其特征在于,所述根据所述文本类型识别模型对所述文本数据训练样本集的各文本样本的预测值和对应的文本类型标签、所述文本类型识别模型在训练过程中的稀疏度损失,共同确定损失函数,包括:

3.根据权利要求2所述的文本识别方法,其特征在于,所述获取所述文本类型识别模型在预测时的精度损失信息,包括:

4.根据权利要求2所述的文本识别方法,其特征在于,所述获取所述文本类型识别模型在训练过程中的稀疏度损失,包括:

5.根据权利要求1所述的文本识别方法,其特征在于,所述利用所述文本...

【技术特征摘要】

1.一种文本识别方法,其特征在于,包括:

2.根据权利要求1所述的文本识别方法,其特征在于,所述根据所述文本类型识别模型对所述文本数据训练样本集的各文本样本的预测值和对应的文本类型标签、所述文本类型识别模型在训练过程中的稀疏度损失,共同确定损失函数,包括:

3.根据权利要求2所述的文本识别方法,其特征在于,所述获取所述文本类型识别模型在预测时的精度损失信息,包括:

4.根据权利要求2所述的文本识别方法,其特征在于,所述获取所述文本类型识别模型在训练过程中的稀疏度损失,包括:

5.根据权利要求1所述的文本识别方法,其特征在于,所述利用所述文本数据训练样本集,基于文本识别任务和所述损失函数,对所述文本类型识别模型的各待更新参数进行调整,包括:

6.根据权利要求5所述的文本识别方法,其特征在于,所述利用所述文本数据训练样本集,基于文本识别任务和所述损失函数,对所述文本类型识别模型的各待更新参数进行调整,包括:

7.根据权利要求1所述的文本识别方法,其特征在于,所述根据所述文本类型识别模型的模型结构特点确定参数选择网络,包括:

8.根据权利要求7所述的文本识别方法,其特征在于,所述模型结构特点根据所述文本类型识别模型的模型规模确定,所述基于所述文本类型识别模型的模型结构特点,确定参数选择网络的辅助参数与所述文本类型识别模型的目标模型结构的映射关系,包括:

9.根据权利要求8所述的文本识别方法,其特征在于,所述确定参数选择网络的辅助参数与所述文本类型识别模型的神经元之间的映射关系,包括:

10.根据权利要求7所述的文本识别方法,其特征在于,所述模型结构特点根据所述文本类型识别模型的模型规模和网络模型结构确定,所述基于所述文本类型识别模型的模型结构特点,确定参数选择网络的辅助参数与所述文本类型识别模型的目标模型结构的映射关系,包括:

11.根据权利要求10所述的文本识别方法,其特征在于,所述确定参数选择网络的辅助参数与所述文本类型识别模型的目标模型子结构之间的映射关系,包括:

12.根据权利要求11所述的文本识别方法,其特征在于,所述文本类型识别模型采用来自变换器的双向编码器表征量bert模型,所述目标模型结构为至少一个编码器层的注意力模块和中间层模块;所述确定参数选择网络的辅助参数与所述...

【专利技术属性】
技术研发人员:李兵兵王彦伟朱克峰黄伟李仁刚
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1