System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及人工智能,具体为自然语言处理和深度学习等。
技术介绍
1、随着社会的发展,会议已经成为人们日常工作中的重要环节。然而,传统的会议方式必须有人参加,且参加会议会耗费大量的时间精力。对于一些模式固定、议题简单的会议,如任务下达类、问题资讯类、进度汇报类、宣传讲座类的会议,其实不需要本人亲自参与。这些会议只需要理解会议内容,生成纪要和待办,并在会议上进行问答响应即可。
2、目前,参会者可以使用会议助手来代替自己参会。会议助手可以采用各种技术手段,如语音识别、文本分析等,全程记录会议内容,并能基于发言对象,做初步的分类整理。然而,会议助手无法进行对话。
技术实现思路
1、本公开实施例提出了一种会议助手模型训练方法、装置、设备、存储介质以及程序产品。
2、第一方面,本公开实施例提出了一种会议助手模型训练方法,包括:获取目标参会者在历史会议中的问答对数据;基于问答对数据,生成样本,其中,样本包括样本问题和样本答案;将样本问题作为输入,将样本答案作为监督,对预训练的大语言模型进行训练,得到会议助手模型。
3、第二方面,本公开实施例提出了一种会议助手参会方法,包括:获取当前会议的语音数据;将语音数据转换成对应的文字信息;响应于确定文字信息中包含对目标参会者的问题信息,将文字信息输入至会议助手模型,得到答案信息,其中,会议助手模型是利用目标参会者在历史会议中的问答对数据对预先训练的大语言模型进行微调得到的;将答案信息转换成对应的语音信息,并发送给当前会议
4、第三方面,本公开实施例提出了一种会议助手模型训练装置,包括:获取模块,被配置成获取目标参会者在历史会议中的问答对数据;生成模块,被配置成基于问答对数据,生成样本,其中,样本包括样本问题和样本答案;训练模块,被配置成将样本问题作为输入,将样本答案作为监督,对预训练的大语言模型进行训练,得到会议助手模型。
5、第四方面,本公开实施例提出了一种会议助手参会装置,包括:获取模块,被配置成获取当前会议的语音数据;第一转换模块,被配置成将语音数据转换成对应的文字信息;预测模块,被配置成响应于确定文字信息中包含对目标参会者的问题信息,将文字信息输入至会议助手模型,得到答案信息,其中,会议助手模型是利用目标参会者在历史会议中的问答对数据对预先训练的大语言模型进行微调得到的;第二转换模块,被配置成将答案信息转换成对应的语音信息,并发送给当前会议的其他参会者。
6、第五方面,本公开实施例提出了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面或第二方面描述的方法。
7、第六方面,本公开实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面或第二方面描述的方法。
8、第七方面,本公开实施例提出了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如第一方面或第二方面描述的方法。
9、本公开实施例提供了一种会议助手模型训练方法,基于参会者在历史会议中的问答对数据对预训练的大语言模型进行训练,以得到会议助手模型。通过大语言模型强大的语言理解能力和对话能力,使参会助手模型能够在会议上自然语言对话。并且,利用参会者在历史会议中的问答对数据,对大语言模型进行模型重训,使参会助手模型拥有参会者的语言风格、表达方式和知识储备,更加贴近参会者本人。参会助手模型利用其强大的逻辑推理能力、文本生成能力、语言理解能力和对话能力来完全代替参会者,不仅提高了会议效率,节省了参会时间,还减少了因参会者时间冲突而错过会议的情况发生。
10、本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
本文档来自技高网...【技术保护点】
1.一种会议助手模型训练方法,包括:
2.根据权利要求1所述的方法,其中,所述基于所述问答对数据,生成样本,包括:
3.根据权利要求2所述的方法,其中,所述基于所述问答对数据,生成样本,还包括:
4.根据权利要求1-3中任一项所述的方法,其中,在所述将所述样本问题作为输入,将所述样本答案作为监督,对预训练的大语言模型进行训练,得到会议助手模型之前,还包括:
5.一种会议助手参会方法,包括:
6.根据权利要求5所述的方法,其中,所述方法还包括:
7.根据权利要求6所述的方法,其中,所述方法还包括:
8.一种会议助手模型训练装置,包括:
9.根据权利要求8所述的装置,其中,所述生成模块进一步被配置成:
10.根据权利要求9所述的装置,其中,所述生成模块进一步被配置成:
11.根据权利要求8-10中任一项所述的装置,其中,所述装置还包括:
12.一种会议助手参会装置,包括:
13.根据权利要求12所述的装置,其中,所述装置还包括:
15.一种电子设备,包括:
16.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法。
17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。
...【技术特征摘要】
1.一种会议助手模型训练方法,包括:
2.根据权利要求1所述的方法,其中,所述基于所述问答对数据,生成样本,包括:
3.根据权利要求2所述的方法,其中,所述基于所述问答对数据,生成样本,还包括:
4.根据权利要求1-3中任一项所述的方法,其中,在所述将所述样本问题作为输入,将所述样本答案作为监督,对预训练的大语言模型进行训练,得到会议助手模型之前,还包括:
5.一种会议助手参会方法,包括:
6.根据权利要求5所述的方法,其中,所述方法还包括:
7.根据权利要求6所述的方法,其中,所述方法还包括:
8.一种会议助手模型训练装置,包括:
9.根据权利要求8所述的装置,其中,所述生...
【专利技术属性】
技术研发人员:闫光远,张守元,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。