【技术实现步骤摘要】
人机交互的数据处理方法及服务器
[0001]本申请涉及计算机技术,尤其涉及一种人机交互的数据处理方法及服务器。
技术介绍
[0002]自然语言是人类逻辑和思维的重要载体,在人机交互,甚至通用人工智能领域具有非常重大的意义。但是因为自然语言的复杂性和模糊性,一直以来缺少直接面向无约束的自然语言的机器设施。
[0003]随着人工智能的发展,大模型被广泛应用于自然语言处理领域的人机交互中。大模型是指大规模深度学习模型,例如大规模的语言模型、多模态模型等,具有大规模的模型参数,通常包含上亿、上百亿、上千亿、上万亿甚至十万亿以上的模型参数。
[0004]多轮交互能力是目前人机交互模型具备重要价值能力,如何客观评估这些人机交互模型的多轮交互能力非常重要。对于相同的输入指令,由于不同的人机交互模型产出的结果不一样,导致评估人机交互模型与人类的多轮交互能力时难以统一用一套预先准备好的指令,因此难以做到公平地测评不同人机交互模型的多轮交互能力,不利于模型迭代中选择多轮交互能力较好的优质模型、不利于控制上线模型进行多轮交互的质量,导致人机交互质量差。
技术实现思路
[0005]本申请提供一种人机交互的数据处理方法及服务器,用以解决无法公平地测评不同人机交互模型的多轮交互能力,不利于模型迭代中选择多轮交互能力较好的优质模型、不利于控制上线模型进行多轮交互的质量,导致人机交互质量差问题。
[0006]第一方面,本申请提供一种人机交互的数据处理方法,包括:获取预先标注的至少一次会话的多轮交互信息,一次会 ...
【技术保护点】
【技术特征摘要】
1.一种人机交互的数据处理方法,其特征在于,包括:获取预先标注的至少一次会话的多轮交互信息,一次会话的多轮交互信息包括多轮输入信息和各轮输入信息的预先标注的响应信息;根据预先标注的任意一次会话的多轮输入信息和各轮输入信息对应的预先标注的响应信息,确定所述会话中各轮输入信息的上文信息,并将所述会话中各轮输入信息和输入信息的上文信息输入人机交互模型,通过人机交互模型输出各轮输入信息的响应结果;根据所述至少一次会话中各轮输入信息、各轮输入信息的上文信息和响应结果,确定所述人机交互模型的多轮交互能力的测评信息;输出所述人机交互模型的多轮交互能力的测评信息。2.根据权利要求1所述的方法,其特征在于,所述根据预先标注的任意一次会话的多轮输入信息和输入信息的预先标注的响应信息,确定所述会话中各轮输入信息的上文信息,并将所述会话中各轮输入信息和各轮输入信息的上文信息输入人机交互模型,通过人机交互模型输出各轮输入信息的响应结果,包括:根据预先标注的任意一次会话的多轮输入信息和各轮输入信息的预先标注的响应信息,依次对所述会话中各轮输入信息进行如下交互处理:将所述会话的上下文信息作为本轮输入信息的上文信息,其中所述会话的上下文信息包括所述会话的历史交互信息;将本轮输入信息及所述会话的上下文信息输入人机交互模型,通过所述人机交互模型输出本轮输入信息的响应结果;更新所述会话的上下文信息,并使用本轮输入信息的预先标注的响应信息,替换更新后所述会话的上下文信息中本轮输入信息的响应结果。3.根据权利要求1所述的方法,其特征在于,所述根据预先标注的任意一次会话的多轮输入信息和各轮输入信息的预先标注的响应信息,确定所述会话中各轮输入信息的上文信息,包括:根据预先标注的任意一次会话的多轮输入信息和各轮输入信息的预先标注的响应信息,对于所述会话中的任一轮输入信息,将本轮之前的输入信息及输入信息的预先标注的响应信息,作为本轮输入信息的上文信息。4.根据权利要求1所述的方法,其特征在于,所述根据所述至少一次会话中各轮输入信息、各轮输入信息的上文信息和响应结果,确定所述人机交互模型的多轮交互能力的测评信息,包括:根据所述至少一次会话中各轮输入信息、各轮输入信息的上文信息和响应结果,确定各次会话中所述人机交互模型的交互质量信息;根据各次会话中所述人机交互模型的交互质量信息,确定所述人机交互模型的多轮交互能力的测评信息。5.根据权利要求4所述的方法,其特征在于,所述获取预先标注的至少一次会话的多轮交互信息之后,包括:标注各次会话覆盖的多轮交互能力,所述多轮交互能力至少包括如下类别:上下文相关、上下文无关、上下文一致。6.根据权利要求5所述的方法,其特征在于,所述根据各次会话中所述人机交互模型的
交互质量信息,确定所述人机交互模型的多轮交互能力的测评信息,包括:根据所述至少一次会话所覆盖的多轮交互能力,以及各次会话中所述人机交互模型的交互质量信息,根据覆盖同一类多轮交互能力的会话中所述人机交互模型的交互质量信息,计算得到所述人机交互模型在各类多轮交互能力维度的测评信息。7.根据权利要求6所述的方法,其特征在于,所述确定所述人机交互模型在各类多轮交互能力维度的测评信息之后,还包括:根据各类多轮交互能力对应的权重系数,将所述人机交互模型在各类多轮交互能力维度的测评信息加权综合,得到所述人机交互模型的多轮交互能力的综合测评信息;根据所述人机交互模型的多轮交互能力的综合测评信息,确定所述人机交互模型是否满足上线条件;输出所述人机交互模型的上线提示信息和/或所述人机交互模型的测评信息,所述上线提示信息指示所述人机交互模型是否满足上线条件。8.根据权利要求7所述的方法,其特征在于...
【专利技术属性】
技术研发人员:张一昌,林俊旸,周畅,周靖人,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。