数据生成方法及装置、设备和介质制造方法及图纸

技术编号:39046919 阅读:15 留言:0更新日期:2023-10-10 11:59
本公开提供了一种数据生成方法及装置、设备和介质,涉及人工智能技术领域,尤其涉及自然语言处理和深度学习等技术领域。数据生成方法包括:基于来自用户的第一问询数据,生成第一回复数据;响应于接收到所述用户针对所述第一回复数据的负反馈,基于所述第一回复数据和所述负反馈,确定针对所述第一回复数据的第一反思结果,所述第一反思结果指示所述用户针对所述第一回复数据的反馈为负反馈的诊断原因;以及基于所述第一问询数据和所述第一反思结果,生成针对所述第一问询数据的第二回复数据。据。据。

【技术实现步骤摘要】
数据生成方法及装置、设备和介质


[0001]本公开涉及人工智能
,尤其涉及自然语言处理和深度学习等领域,具体涉及一种数据生成方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]生成式语言大模型可以应用于各种自然语言处理任务,特别是能够根据用户的问询内容生成用于回复的自然语言文本,以实现与用户的交互。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0005]本公开提供了一种数据生成方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0006]根据本公开的一方面,提供了一种数据生成方法,包括:基于来自用户的第一问询数据,生成第一回复数据;响应于接收到所述用户针对所述第一回复数据的负反馈,基于所述第一回复数据和所述负反馈,确定针对所述第一回复数据的第一反思结果,所述第一反思结果指示所述用户针对所述第一回复数据的反馈为负反馈的诊断原因;以及基于所述第一问询数据和所述第一反思结果,生成针对所述第一问询数据的第二回复数据。
[0007]根据本公开的另一方面,提供了一种数据生成装置,包括:第一生成单元,被配置为基于来自用户的第一问询数据,生成第一回复数据;确定单元,被配置为响应于接收到所述用户针对所述第一回复数据的负反馈,基于所述第一回复数据和所述负反馈,确定针对所述第一回复数据的第一反思结果,所述第一反思结果指示所述用户针对所述第一回复数据的反馈为负反馈的诊断原因;以及第二生成单元,基于所述第一问询数据和所述第一反思结果,生成针对所述第一问询数据的第二回复数据。
[0008]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述数据生成方法。
[0009]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述数据生成方法。
[0010]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其中,计算机程序在被处理器执行时能够实现上述数据生成方法。
[0011]根据本公开的一个或多个实施例,可以提升回复数据生成的质量。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
[0014]图1示出了根据本公开示例性实施例的可以在其中实施本文描述的各种方法的示例性系统的示意图;
[0015]图2示出了根据本公开示例性实施例的数据生成方法的流程图;
[0016]图3示出了根据本公开示例性实施例的数据生成过程的示意图;
[0017]图4示出了根据本公开示例性实施例的数据生成装置的结构框图;
[0018]图5示出了能够用于实现本公开实施例的示例性电子设备的结构框图。
具体实施方式
[0019]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0020]在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
[0021]在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
[0022]相关技术中,当应用生成式语言模型来基于用户的输入数据生成回复数据时,通常是在模型训练阶段通过人工标注语料或是调整训练方式(例如优化损失函数或是进行强化学习)来增强模型的性能。而在模型的应用阶段,即数据生成过程中,通常仅是基于用户所输入的问询数据来直接生成回复数据,未能实现根据用户对回复数据的反馈来调整相应的回复数据,从而导致回复数据的质量无法充分满足用户的需求。
[0023]基于此,本公开提供了一种数据生成方法,在针对用户的问询数据生成初始的回复数据之后,当接收到用户对该回复数据的负反馈时,基于该负反馈自我诊断该回复数据得到负反馈的原因,进而生成针对该回复数据的反思结果,以基于该反思结果生成新的回复数据,从而使得回复数据更符合用户的需求,提升回复数据生成的质量。
[0024]下面将结合附图详细描述本公开的实施例。
[0025]图1示出了根据本公开的实施例可以将本文描述的各种方法和装置在其中实施的示例性系统100的示意图。参考图1,该系统100包括一个或多个客户端设备101、102、103、104、105和106、服务器120以及将一个或多个客户端设备耦接到服务器120的一个或多个通信网络110。客户端设备101、102、103、104、105和106可以被配置为执行一个或多个应用程序。
[0026]在本公开的实施例中,服务器120可以运行使得能够执行数据生成方法的一个或多个服务或软件应用。
[0027]在某些实施例中,服务器120还可以提供其他服务或软件应用,这些服务或软件应用可以包括非虚拟环境和虚拟环境。在某些实施例中,这些服务可以作为基于web的服务或云服务提供,例如在软件即服务(SaaS)模型下提供给客户端设备101、102、103、104、105和/或106的用户。
[0028]在图1所示的配置中,服务本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据生成方法,所述方法包括:基于来自用户的第一问询数据,生成第一回复数据;响应于接收到所述用户针对所述第一回复数据的负反馈,基于所述第一回复数据和所述负反馈,确定针对所述第一回复数据的第一反思结果,所述第一反思结果指示所述用户针对所述第一回复数据的反馈为负反馈的诊断原因;以及基于所述第一问询数据和所述第一反思结果,生成针对所述第一问询数据的第二回复数据。2.如权利要求1所述的方法,其中,所述基于来自用户的第一问询数据,生成第一回复数据包括:基于所述第一问询数据,确定用于深度学习模型的第一输入数据,所述深度学习模型用于基于输入数据生成回复数据;以及将所述第一输入数据输入所述深度学习模型,以获取所述第一回复数据,并且其中,所述基于所述第一问询数据和所述第一反思结果,生成针对所述第一问询数据的第二回复数据包括:基于所述第一问询数据和所述第一反思结果,确定用于所述深度学习模型的第二输入数据;以及将所述第二输入数据输入所述深度学习模型,以获取所述第二回复数据。3.如权利要求2所述的方法,其中,所述基于所述第一问询数据和所述第一反思结果,确定用于所述深度学习模型的第二输入数据包括:基于所述第一问询数据、所述第一反思结果和任务说明信息,确定所述第二输入数据,所述任务说明信息指示所述第二输入数据包括所述第一反思结果。4.如权利要求1

3中任一项所述的方法,其中,所述基于所述第一回复数据和所述第一反馈,确定针对所述第一回复数据的第一反思结果包括:将所述第一回复数据和所述第一反馈输入反思生成网络,以获取所述反思生成网络输出的所述第一反思结果,其中,所述反思生成网络是利用样本语料进行训练得到的,所述样本语料包括样本回复数据、样本反馈和针对所述样本回复数据的样本反思结果。5.如权利要求1

4中任一项所述的方法,其中,所述响应于接收到所述用户针对所述第一回复数据的负反馈,基于所述第一回复数据和所述负反馈,确定针对所述第一回复数据的第一反思结果包括:响应于接收到所述用户针对所述第一回复数据的第一反馈,并且响应于确定所述第一反馈为负反馈,基于所述第一回复数据和所述第一反馈,确定针对所述第一回复数据的第一反思结果。6.如权利要求1

5中任一项所述的方法,还包括:响应于确定来自用户的第二问询数据与所述第一问询数据的相似度大于预设阈值,基于所述第一问询数据、所述第二回复数据和所述第二问询数据,生成针对所述第二问询数据的第三回复数据。7.如权利要求6所述的方法,还包括:将所述第一问询数据和所述第二回复数据存入记忆库,其中,所述响应于确定来自用户的第二问询数据与所述第一问询数据的相似度大于预
设阈值,基于所述第一问询数据、所述第二回复数据和所述第二问询数据,生成针对所述第二问询数据的第三回复数据包括:响应于确定来自用户的第二问询数据与所述记忆库中的第一问询数据的相似度大于所述预设阈值,从所述记忆库中获取所述第二回复数据;以及基于所述第一问询数据、所述第二回复数据和所述第二问询数据,生成所述第三回复数据。8.如权利要求1

7中任一项所述的方法,其中,所述第一反思结果还包括针对所述第一回复数据的优化策略。9.一种数据生成装置,所述装置包括:第一生成单元,被配置为基于来自用户的第一问询数据,生成第一回复数据;确定单元,被配置为响应于接收到所述用户针对所述第一回复数据的负反馈,基于...

【专利技术属性】
技术研发人员:雷泽阳鲍思琪吴华王海峰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1