【技术实现步骤摘要】
本公开涉及人工智能,尤其涉及深度学习与大语言模型,具体涉及一种用于大语言模型的标注方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
技术介绍
1、人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
2、近来,生成式人工智能取得了长足的进展。大语言模型(llm)可以接收用户的自然语言输入,并且输出自然语言式的回复结果。希望获得针对大语言模型的标注数据。
3、在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
技
<本文档来自技高网...【技术保护点】
1.一种用于大语言模型的标注方法,包括:
2.根据权利要求1所述的方法,其中,基于所述多个评分获得针对所述多个响应文本中的至少一个响应文本的标注文本包括:
3.根据权利要求2所述的方法,其中,获得与所述多个响应文本对应的多个评分包括:针对所述多个响应文本中的每一个响应文本,获得从预定的多个有序级别中选择的一个级别作为该响应文本的评分,并且
4.根据权利要求1-3中任一项所述的方法,其中,基于所述多个评分获得针对所述多个响应文本中的至少一个响应文本的标注文本包括:
5.根据权利要求1-4中任一项所述的方法,其中,基于所述多
...【技术特征摘要】
1.一种用于大语言模型的标注方法,包括:
2.根据权利要求1所述的方法,其中,基于所述多个评分获得针对所述多个响应文本中的至少一个响应文本的标注文本包括:
3.根据权利要求2所述的方法,其中,获得与所述多个响应文本对应的多个评分包括:针对所述多个响应文本中的每一个响应文本,获得从预定的多个有序级别中选择的一个级别作为该响应文本的评分,并且
4.根据权利要求1-3中任一项所述的方法,其中,基于所述多个评分获得针对所述多个响应文本中的至少一个响应文本的标注文本包括:
5.根据权利要求1-4中任一项所述的方法,其中,基于所述多个评分获得针对所述多个响应文本中的至少一个响应文本的标注文本包括:
6.根据权利要求1-5中任一项所述的方法,其中,所述差异性要求指示以下中的至少一项:响应文本的分词之间的差异性,基于奖励模型的差异性。
7.根据权利要求1-6中任一项所述的方法,还包括在获得与所述多个响应文本对应的多个评分之前:
8.根据权利要求7所述的方法,其中,获得与所述多个响应文本对应的多个批评数据包括:通过对所述多个响应文本中的每个响应文本与所述请求文本的匹配程度进行检查,获得所述多个批评数据。
9.根据权利要求7或8所述的方法,其中,获得与所述多个响应文本对应的多个批评数据包括:通过对所述多个响应文本中的每个响应文本中记载的事实的正确性进行检查,获得所述多个批评数据。
10.根据权利要求7-9中任一项所述的方法,其中,获得与所述多个响应文本对应的多个批评数据包括:通过对所述多个响应文本中的每个响应文本的语言表达进行检查,获得所述多个批评数据。
11.根据权利要求7-10中任一项所述的方法,其中,获得与所述多个响应文本对应的多个批评数据包括:通过对与所述多个响应文本中的每个响应文本的逻辑的正确性进行检查,获得所述多个批评数据。
12.根据权利要求1-11中任一项所述的方法,其中,获得通过大语言模型针对请求文本的满足差异性要求的多个响应文本包括:
13.一种用于大语言模型的标注装置,包括:
14.根据权利要求13所述的装置,其中,所述标注获得单元...
【专利技术属性】
技术研发人员:戴岱,吴华,胡刚强,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。