一种模型训练方法、业务执行方法、装置以及存储介质制造方法及图纸

技术编号:43864273 阅读:19 留言:0更新日期:2024-12-31 18:51
本说明书提供的一种模型训练方法、业务执行方法、装置以及存储介质,可以首先获取文本数据,将文本数据输入到预设的大语言模型中,以使大语言模型对文本数据进行语义分析,以确定出文本数据所对应的各文本要素信息,并根据各文本要素信息,生成用于对文本数据从至少部分角度进行总结的总结文本,以将总结文本与文本数据进行匹配,得到总结文本与文本数据之间的匹配结果,作为实际匹配结果,将文本数据以及总结文本输入到待训练的语言模型中,以使语言模型生成文本数据与总结文本之间的匹配结果,作为待验证匹配结果,根据待验证匹配结果和实际匹配结果之间的偏差,确定损失值,并根据损失值,对待训练的语言模型进行训练。

【技术实现步骤摘要】

本说明书涉及计算机,尤其涉及一种模型训练方法、业务执行方法、装置以及存储介质


技术介绍

1、近年来,随着计算机技术以及人工智能技术的发展,语言模型的应用逐渐广泛。语言模型可以根据用户提供的个人数据来执行相关的问答业务。例如,用户可以向语言模型输入文本(如:一篇新闻)和问题语句(如:该文本是否描述了a地区近期经济数据的变化?),进而语言模型可以对接收到的文本和问题语句进行分析与处理,并将结果返回给用户。

2、目前,为了使得语言模型在实际应用过程中能够对用户所输入的内容进行准确的分析并得出结果,可以在前期对语言模型进行训练的过程中采用人为的方式设置不同的问题语句来引导语言模型给出相应的回答,以使语言模型学习到对不同的问题语句进行分析与处理的能力。例如,在对语言模型进行训练的过程中,当语言模型的输入是一篇新闻时,问题语句可以是“该文章是否为财经类的新闻?”,以此来引导语言模型对该文章是否属于财经类的新闻进行判断。或者,问题语句也可以是“该文章是否描述了近期股市行情的变动?”,以此来引导语言模型对该文章中是否存在对近期股市行情的变动的内容进行判断。<本文档来自技高网...

【技术保护点】

1.一种模型训练方法,包括:

2.如权利要求1所述的方法,将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并根据所述各文本要素信息,生成用于对所述文本数据从至少部分角度进行总结的总结文本,具体包括:

3.如权利要求2所述的方法,将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并从所述各文本要素信息中选取至少一个目标要素信息,具体包括:

4.如权利要求2所述的方法,将所述文本数据输入到预设的大...

【技术特征摘要】

1.一种模型训练方法,包括:

2.如权利要求1所述的方法,将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并根据所述各文本要素信息,生成用于对所述文本数据从至少部分角度进行总结的总结文本,具体包括:

3.如权利要求2所述的方法,将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并从所述各文本要素信息中选取至少一个目标要素信息,具体包括:

4.如权利要求2所述的方法,将所述文本数据输入到预设的大语言模型中,以使所述大语言模型对所述文本数据进行语义分析,以确定出所述文本数据所对应的各文本要素信息,并从所述各文本要素信息中选取至少一个目标要素信息,具体包括:

5.如权利要求1所述的方法,将所述文本数据...

【专利技术属性】
技术研发人员:周书恒祝慧佳
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1