数据生成方法及装置、设备和介质制造方法及图纸

技术编号：39046919 阅读：15 留言：0更新日期：2023-10-10 11:59

本公开提供了一种数据生成方法及装置、设备和介质，涉及人工智能技术领域，尤其涉及自然语言处理和深度学习等技术领域。数据生成方法包括：基于来自用户的第一问询数据，生成第一回复数据；响应于接收到所述用户针对所述第一回复数据的负反馈，基于所述第一回复数据和所述负反馈，确定针对所述第一回复数据的第一反思结果，所述第一反思结果指示所述用户针对所述第一回复数据的反馈为负反馈的诊断原因；以及基于所述第一问询数据和所述第一反思结果，生成针对所述第一问询数据的第二回复数据。据。据。

全部详细技术资料下载

【技术实现步骤摘要】
数据生成方法及装置、设备和介质

[0001]本公开涉及人工智能
，尤其涉及自然语言处理和深度学习等领域，具体涉及一种数据生成方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]生成式语言大模型可以应用于各种自然语言处理任务，特别是能够根据用户的问询内容生成用于回复的自然语言文本，以实现与用户的交互。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明，否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地，除非另有指明，否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0005]本公开提供了一种数据生成方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0006]根据本公开的一方面，提供了一种数据生成方法，包括：基于来自用户的第一问询数据，生成第一回复数据；响应于接收到所述用户针对所述第一回复数据的负反馈，基于所述第一回复数据和所述负反馈，确定针对所述第一回复数据的第一反思结果，所述第一反思结...

【技术保护点】

【技术特征摘要】
1.一种数据生成方法，所述方法包括：基于来自用户的第一问询数据，生成第一回复数据；响应于接收到所述用户针对所述第一回复数据的负反馈，基于所述第一回复数据和所述负反馈，确定针对所述第一回复数据的第一反思结果，所述第一反思结果指示所述用户针对所述第一回复数据的反馈为负反馈的诊断原因；以及基于所述第一问询数据和所述第一反思结果，生成针对所述第一问询数据的第二回复数据。2.如权利要求1所述的方法，其中，所述基于来自用户的第一问询数据，生成第一回复数据包括：基于所述第一问询数据，确定用于深度学习模型的第一输入数据，所述深度学习模型用于基于输入数据生成回复数据；以及将所述第一输入数据输入所述深度学习模型，以获取所述第一回复数据，并且其中，所述基于所述第一问询数据和所述第一反思结果，生成针对所述第一问询数据的第二回复数据包括：基于所述第一问询数据和所述第一反思结果，确定用于所述深度学习模型的第二输入数据；以及将所述第二输入数据输入所述深度学习模型，以获取所述第二回复数据。3.如权利要求2所述的方法，其中，所述基于所述第一问询数据和所述第一反思结果，确定用于所述深度学习模型的第二输入数据包括：基于所述第一问询数据、所述第一反思结果和任务说明信息，确定所述第二输入数据，所述任务说明信息指示所述第二输入数据包括所述第一反思结果。4.如权利要求1
‑
3中任一项所述的方法，其中，所述基于所述第一回复数据和所述第一反馈，确定针对所述第一回复数据的第一反思结果包括：将所述第一回复数据和所述第一反馈输入反思生成网络，以获取所述反思生成网络输出的所述第一反思结果，其中，所述反思生成网络是利用样本语料进行训练得到的，所述样本语料包括样本回复数据、样本反馈和针对所述样本回复数据的样本反思结果。5.如权利要求1
‑
4中任一项所述的方法，其中，所述响应于接收到所述用户针对所述第一回复数据的负反馈，基于所述第一回复数据和所述负反馈，确定针对所述第一回复数据的第一反思结果包括：响应于接收到所述用户针对所述第一回复数据的第一反馈，并且响应于确定所述第一反馈为负反馈，基于所述第一回复数据和所述第一反馈，确定针对所述第一回复数据的第一反思结果。6.如权利要求1
‑
5中任一项所述的方法，还包括：响应于确定来自用户的第二问询数据与所述第一问询数据的相似度大于预设阈值，基于所述第一问询数据、所述第二回复数据和所述第二问询数据，生成针对所述第二问询数据的第三回复数据。7.如权利要求6所述的方法，还包括：将所述第一问询数据和所述第二回复数据存入记忆库，其中，所述响应于确定来自用户的第二问询数据与所述第一问询数据的相似度大于预
设阈值，基于所述第一问询数据、所述第二回复数据和所述第二问询数据，生成针对所述第二问询数据的第三回复数据包括：响应于确定来自用户的第二问询数据与所述记忆库中的第一问询数据的相似度大于所述预设阈值，从所述记忆库中获取所述第二回复数据；以及基于所述第一问询数据、所述第二回复数据和所述第二问询数据，生成所述第三回复数据。8.如权利要求1
‑
7中任一项所述的方法，其中，所述第一反思结果还包括针对所述第一回复数据的优化策略。9.一种数据生成装置，所述装置包括：第一生成单元，被配置为基于来自用户的第一问询数据，生成第一回复数据；确定单元，被配置为响应于接收到所述用户针对所述第一回复数据的负反馈，基于...

【专利技术属性】
技术研发人员：雷泽阳，鲍思琪，吴华，王海峰，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人