【技术实现步骤摘要】
自然语言处理、模型训练方法、装置、设备及存储介质
[0001]本公开涉及信息
,尤其涉及一种自然语言处理、模型训练方法、装置、设备及存储介质。
技术介绍
[0002]目前的自然语言理解任务可以由机器来执行,但是,需要具备能够对自然语言进行处理的机器学习模型。由于针对自然语言理解任务的目标任务数据较少,因此,在采用少量的目标任务数据对该机器学习模型进行训练之前,通常会对该机器学习模型进行预训练。
[0003]但是,目前预训练的目标和自然语言理解任务的目标不同,例如,目前预训练的目标是让机器学习模型恢复出被污染的文本,而自然语言理解任务的目标是解决具体的问题,例如,识别命名实体、完成抽取式问答、情感分析、完成多选式问答等。因此,若采用目前的预训练方法对该机器学习模型进行预训练,将会导致经过预训练后的机器学习模型无法用于处理自然语言理解任务,并且难以通过少量的目标任务数据校准预训练后的机器学习模型,从而导致微调后的机器学习模型依然不够精准。
技术实现思路
[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种自然语言处理、模型训练方法、装置、设备及存储介质,以提高微调后的机器学习模型的准确性。
[0005]第一方面,本公开实施例提供一种自然语言处理方法,包括:
[0006]获取超链接所标记的第一目标信息;
[0007]从所述第一目标信息的主页文章中获取所述第一目标信息对应的第一查询,从所述第一目标信息的至少一个引用文章中获取所述第一目标信息的至 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,其中,所述方法包括:获取超链接所标记的第一目标信息;从所述第一目标信息的主页文章中获取所述第一目标信息对应的第一查询,从所述第一目标信息的至少一个引用文章中获取所述第一目标信息的至少一个第一上下文信息;根据所述第一目标信息、所述第一查询、所述至少一个第一上下文信息对机器学习模型进行预训练,得到预训练后的机器学习模型;从自然语言理解任务提供的样本文本中确定出第二目标信息,生成所述第二目标信息对应的第二查询,并采用所述样本文本、所述第二查询和所述第二目标信息对所述预训练后的机器学习模型进行训练。2.根据权利要求1所述的方法,其中,所述机器学习模型包括编码器和抽取器,所述编码器的输出是所述抽取器的输入;根据所述第一目标信息、所述第一查询、所述至少一个第一上下文信息对机器学习模型进行预训练,得到预训练后的机器学习模型,包括:针对所述至少一个第一上下文信息中的每个第一上下文信息,将所述第一查询和所述第一上下文信息作为所述编码器的输入,使得所述编码器输出所述第一查询中每个文本单元的表示向量和所述第一上下文信息中每个文本单元的表示向量;通过所述抽取器计算所述第一上下文信息中每个文本段分别作为所述第一查询对应的答案的概率,所述每个文本段分别由所述第一上下文信息中连续的至少一个文本单元构成;根据所述概率、所述第一目标信息在所述第一上下文信息中的位置信息,对所述机器学习模型进行预训练,得到预训练后的机器学习模型。3.根据权利要求2所述的方法,其中,通过所述抽取器计算所述第一上下文信息中每个文本段分别作为所述第一查询对应的答案的概率,包括:通过所述抽取器计算从第i个文本单元到第j个文本单元连续的至少一个文本单元构成的文本段作为所述第一查询对应的答案的概率,j大于或等于i,i大于或等于N+1,N+1是所述第一上下文信息中的第一个文本单元在所述编码器的输入中对应的索引,所述概率是根据所述第i个文本单元的表示向量和所述第j个文本单元的表示向量计算得到的。4.根据权利要求2所述的方法,其中,根据所述概率、所述第一目标信息在所述第一上下文信息中的位置信息,对所述机器学习模型进行预训练之前,所述方法还包括:通过所述抽取器计算所述第一查询和所述第一上下文信息的相关度,所述相关度是根据所述第一查询和所述第一上下文信息整体的表示向量计算得到的;根据所述概率、所述第一目标信息在所述第一上下文信息中的位置信息,对所述机器学习模型进行预训练,包括:根据所述相关度、所述概率、所述第一目标信息在所述第一上下文信息中的位置信息,对所述机器学习模型进行预训练。5.根据权利要求1所述的方法,其中,从所述第一目标信息的主页文章中获取所述第一目标信息对应的第一查询,包括:将所述第一目标信息的主页文章中的前至少一个句子作为所述第一目标信息对应的第...
【专利技术属性】
技术研发人员:徐蔚文,李昕,张雯轩,邴立东,司罗,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。