人机交互的数据处理方法及服务器技术

技术编号：38134411 阅读：7 留言：0更新日期：2023-07-08 09:44

本申请提供一种人机交互的数据处理方法及服务器。本申请的方法，通过获取人机交互的指令，将指令输入实现人机交互的大模型，分别从伤害性、指令意图覆盖情况、事实性、内容质量的维度，对大模型输出的响应结果进行测评，得到响应结果在各个维度的响应质量信息；根据大模型输出的响应结果在各个维度的响应质量信息，计算大模型的响应质量信息，实现从伤害性、指令意图覆盖情况、事实性、内容质量等多个维度，对大模型的响应结果进行准确、全面、更细粒度地测评，基于大模型的响应质量信息指导大模型的上线判定、或更新大模型的优化版本、或选择优质的目标大模型，可提升基于大模型的人机对话的准确性，保证人机交互质量。保证人机交互质量。保证人机交互质量。

全部详细技术资料下载

【技术实现步骤摘要】
人机交互的数据处理方法及服务器

[0001]本申请涉及计算机技术，尤其涉及一种人机交互的数据处理方法及服务器。

技术介绍

[0002]自然语言是人类逻辑和思维的重要载体，在人机交互，甚至通用人工智能领域具有非常重大的意义。但是因为自然语言的复杂性和模糊性，一直以来缺少直接面向无约束的自然语言的机器设施。
[0003]随着人工智能的发展，大模型被广泛应用于自然语言处理领域的人机交互中。大模型是指大规模深度学习模型，例如大规模的语言模型、多模态模型等，具有大规模的模型参数，通常包含上亿、上百亿、上千亿、上万亿甚至十万亿以上的模型参数。
[0004]在大模型的迭代过程中，需要测评不同版本的大模型的优劣，以实现大模型迭代更新。在大模型上线之前，需要测评大模型的表现是否满足上线要求，以上线表现优异的大模型，避免上线表现较差的大模型。目前对于人机交互的大模型，通常仅在大模型输出的答复是否对用户有帮助、答复内容是否安全等简单维度，对模型的表现进行笼统地打分，测评维度单一，无法准确全面地测评大模型的响应质量，不利于模型迭代中选择优质模型、不利于控制上线模型的质量，导致人机交互质量差。

技术实现思路

[0005]本申请提供一种人机交互的数据处理方法及服务器，用以解决无法准确全面地测评大模型的响应质量，不利于模型迭代中选择优质模型和控制上线模型的质量，导致人机交互质量差的问题。
[0006]第一方面，本申请提供一种人机交互的数据处理方法，包括：获取人机交互的指令，将所述指令输入大模型，通过大模型输...

【技术保护点】

【技术特征摘要】
1.一种人机交互的数据处理方法，其特征在于，包括：获取人机交互的指令，将所述指令输入大模型，通过大模型输出所述指令的响应结果；分别从伤害性、指令意图覆盖情况、事实性、内容质量的维度，对所述大模型输出的响应结果进行测评，得到所述响应结果在各个维度的响应质量信息；根据所述大模型输出的响应结果在各个维度的响应质量信息，计算所述大模型的响应质量信息；输出所述大模型的响应质量信息，所述大模型的响应质量信息用于指导所述大模型的上线判定、或更新所述大模型的优化版本、或选择优质的目标大模型。2.根据权利要求1所述的方法，其特征在于，所述分别从伤害性、指令意图覆盖情况、事实性、内容质量的维度，对所述大模型输出的响应结果进行测评，得到所述响应结果在各个维度的响应质量信息，包括：任一所述维度对应多个质量类别，不同的质量类别对应不同的响应质量信息，针对各所述维度，确定所述大模型输出的响应结果在各所述维度的质量类别；根据所述响应结果在各所述维度的质量类别，确定所述响应结果在各所述维度的响应质量信息。3.根据权利要求2所述的方法，其特征在于，伤害性包括如下质量类别：无伤害、有伤害；指令意图覆盖情况包括如下质量类别：完全识别指令意图、部分识别指令意图、未能识别指令意图、不应拒绝的指令意图但拒绝；事实性包括如下质量类别：无事实性错误、常识性事实错误、知识性事实错误、同时出现常识性和知识性事实错误；内容质量包括如下质量类别：连贯性好、连贯性中、连贯性差。4.根据权利要求2所述的方法，其特征在于，所述针对各所述维度，确定所述响应结果在各所述维度的质量类别，包括：通过第一交互界面显示所述响应结果、以及各维度对应的质量类别，并提供对所述响应结果在各维度的质量类别的输入区域；响应于对所述第一交互界面的提交操作，获取所述输入区域内输入的所述响应结果在各维度的质量类别。5.根据权利要求1所述的方法，其特征在于，根据所述大模型输出的响应结果在各个维度的响应质量信息，计算所述大模型的响应质量信息，包括：根据所述大模型输出的各所述响应结果在各个维度的响应质量信息，以及各个维度的权重系数，计算各所述响应结果的综合质量信息；根据所述大模型输出的各响应结果的综合质量信息，计算所述大模型的响应质量信息。6.根据权利要求5所述的方法，其特征在于，还包括：显示各个维度的权重配置界面；获取在所述权重配置界面上配置的各个维度的权重系数。7.根据权利要求5所述的方法，其特征在于，所述通过大模型输出所述指令的响应结果之后，还包括：
输出所述响应结果；接收对所述响应结果标注的综合质量类别，所述综合质量类别包括：好、一般、差；所述根据所述大模型输出的各所述响应结果在各个维度的响应质量信息，综合计算各所述响应结果的综合质量信息之后，还包括：根据不同的综合质量类别对应的质量信息区间，将所述响应结果被标注的综合质量类别对应的质量信息区间，作为所述响应结果对应的质量信息区间；对所述指令的响应结果进行过滤，去除综合质量信息不在对应质量信息区间内的响应结果。8.根据权利要求1
‑
7中任一项所述的方法，其特征在于，所述获取人机交互的指令，将所述指令输入大模型，通过大模型输出所述指令的响应结果，包括：接收端侧设备发送的对多个大模型的响应质量测评请求；获取人机交互的指令，将所述指令分别输入所述多个大模型，得到...

【专利技术属性】
技术研发人员：张一昌，刘高，韩矞，马坚鑫，林俊旸，周畅，周靖人，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人