一种适配任务的语言处理方法及装置、存储介质、计算机设备制造方法及图纸

技术编号:40136388 阅读:24 留言:0更新日期:2024-01-23 22:56
本发明专利技术公开了一种适配任务的语言处理方法及装置、存储介质、计算机设备,属于自然语言处理技术领域,主要在于解决现有技术对预训练语言模型进行参数调整后得到的语言模型在处理下游任务时效果不佳的问题,包括:获取预训练的语言处理主模型,并获取语言处理主模型中各个线性变换层的参数矩阵和偏差项;获取与下游任务相对应的目标任务学习数据集,并在目标任务学习数据集上通过监督学习确定与各个参数矩阵或偏差项相对应的参数微调函数;采用参数微调函数对语言处理主模型的各个线性变换层进行参数微调处理,得到与下游任务相对应的语言处理子模型;并基于语言处理子模型实现了对下游任务的语言处理。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,适应于数字医疗,特别是涉及一种适配任务的语言处理方法及装置、存储介质、计算机设备


技术介绍

1、预训练语言模型是经过大规模通用语料库经过自监督预训练得到的神经网络模型,在自监督预训练过程中,语料库中的通用领域知识已经被嵌入到了语言模型的参数中。随着数字医疗的不断发展,越来越多的任务需要语言模型进行处理,比如病例解析中的实体识别,语义依存分析等,还有健康管理中的食材分类,基于历史对话进行锻炼/食谱推荐等。为了将预训练语言模型中的知识更好地适配到下游任务中,通常需要对预训练语言模型的参数进行调整。

2、目前,采用参数高效微调的方法对预训练语言模型进行参数调整,比如adapter,lora,p-tuning等方法。但是,由于现有的参数微调方法只是对模型的特定部分做了修饰或微调,而没有深入到语言处理模型的细粒度结构中,从而导致采用现有的参数高效微调方法无法在各种下游任务上获得较好的语言处理或分析效果。


技术实现思路

1、有鉴于此,本专利技术提供一种适配任务的语言处理方法及装置本文档来自技高网...

【技术保护点】

1.一种适配任务的语言处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取与下游任务相对应的目标任务学习数据集之前,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述在所述目标任务学习数据集上通过监督学习确定与各个所述参数矩阵和所述偏差项相对应的参数微调函数之前,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,

5.根据权利要求4所述的方法,其特征在于,所述在所述目标任务学习数据集上通过监督学习确定与各个所述参数矩阵和所述偏差项相对应的参数微调函数包括:

6.根据权利要求5所...

【技术特征摘要】

1.一种适配任务的语言处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取与下游任务相对应的目标任务学习数据集之前,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述在所述目标任务学习数据集上通过监督学习确定与各个所述参数矩阵和所述偏差项相对应的参数微调函数之前,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,

5.根据权利要求4所述的方法,其特征在于,所述在所述目标任务学习数据集上通过监督学习确定与各个所述参数矩阵和所述偏差项相对应的参数微调函数包括:

6.根据权利要求5所述的方法,其特征在于,所述...

【专利技术属性】
技术研发人员:朱威
申请(专利权)人:平安科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1