一种基于GPT-2的中文闲聊对话系统技术方案

技术编号：39281499 阅读：7 留言：0更新日期：2023-11-07 10:55

本发明专利技术涉及闲聊对话系统－文本生成－预训练模型技术领域，具体涉及一种基于GPT

全部详细技术资料下载

【技术实现步骤摘要】
一种基于GPT
‑
2的中文闲聊对话系统

[0001]本专利技术涉及闲聊对话系统－文本生成－预训练模型
，具体涉及一种基于GPT
‑
2的中文闲聊对话系统。

技术介绍

[0002]对话系统已经越来越引起人们的注意，对话系统的最新进展绝大多数是由深度学习技术所贡献的，这些技术已经在计算机视觉、自然语言处理领域取得了巨大成功。对于对话系统，深度学习技术可以通过利用大规模数据来学习有意义的特征表示和回复生成策略，同时只需要极少量手工特征。
[0003]具体而言，可以将现有对话系统大致分为了面向任务型与非面向任务型两种模型。面向任务的系统旨在帮助用户完成某些任务(例如查找产品，预订住宿和餐馆)，一般通过分解为多步决策的流水线，在每一轮对话做出合理决策，帮助完成任务型问答。系统首先理解人类所传达的信息，将其作为一种内部状态，然后根据对话状态的策略采取一系列相应的行为，最后将动作转化为自然语言的表现形式。非面向任务的系统在与人类交互过程中提供合理的反应和娱乐。通常，非面向任务的系统致力于在开放域与人交谈，虽然非面向任务的系统似乎在进行闲聊，但是却在许多实际的应用程序中占有一席之地，近80％在线购物场景中的对话都是闲聊消息，而处理这些信息与用户体验密切相关。
[0004]对于非面向任务的对话系统，通常也可以称为闲聊型对话系统。这类对话系统并不关注于某项特定的任务，其主要目标是和人们在开放领域展开对话。闲聊式对话系统的技术实现可以大致分为两类：检索式模型和生成式模型[1]。检索式...

【技术保护点】

【技术特征摘要】
1.一种基于GPT
‑
2的中文闲聊对话系统，其特征在于，包括以下步骤：S1、将一个对话会话中所有对话回合连接成一个长文本(N为序列长度)，并以表示文本结束的token作为结束标记；S2、使用top
‑
K采样来生成一系列假设，然后再利用P(Source|Hypothesis)来对假设进行重排，以此来惩罚安全回复；S3、训练一个逆序的语言模型作为评估模型，并对生成模型生成的多个回复重新排序，取loss最低的模型作为最终回复。2.根据权利要求1所述的一种基于GPT
‑
2的中文闲聊对话系统，其特征在于：所述步骤S1中，可将源句子(对话历史)记为将目标句子(基本真值响应)记为则P(T|S)的条件分布可以写为一系列条件概率的积：对于多轮对话实例T1，T2，...T
K
，上式可写为这本质上就是p(T
i
|T1，...T
i
‑1)的条件概率的积，最终，对单个目标p(T
K
，...，T2，|T1)的优化可以被视为是优化所有的p(T
i
|T1，
…
T
i
‑1)源
‑
目标对。3.根据权利要求2所述的一种基于GPT
‑
2的中文闲聊对话系统，其特征在于：所述步骤S3中，包括以下步骤：S301、训练两个模型：...

【专利技术属性】
技术研发人员：王春辉，
申请(专利权)人：识因智能科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人