当前位置: 首页 > 专利查询>湖南大学专利>正文

一种基于粗粒度和细粒度特征的对话生成方法及系统技术方案

技术编号:40739872 阅读:26 留言:0更新日期:2024-03-25 20:00
本发明专利技术公开了一种基于粗粒度和细粒度特征的对话生成方法及系统,方法包括:对当前对话历史、知识文档及真实回复进行预处理,以得到预处理后的对话历史、知识文档及真实回复序列;对对话历史、知识文档及真实回复序列进行编码,并在训练时优化粗粒度特征提取器从对话历史和知识文档序列中获取与回复相关的粗粒度特征的能力;生成回复时,细粒度特征生成器结合粗粒度特征、已生成的单词序列及对话历史序列以计算得到回复中下一个单词的细粒度特征,以预测生成回复的下一个单词。本发明专利技术通过同时考虑回复的粗粒度特征和细粒度特征,可以在对话生成中的上下文一致性和信息性之间取得合适的平衡,以提高回复的质量。

【技术实现步骤摘要】

本专利技术主要涉及自然语言处理对话生成领域,具体涉及一种基于粗粒度和细粒度特征的对话生成方法及系统


技术介绍

1、传统的生成式对话系统以对话历史作为输入,直接产生回复。然而,由于缺乏背景知识和常识知识等,对话生成模型倾向于生成使用频繁、安全性强的通用语句,如“好吧,我知道了”和“对不起,我不知道”。这些回复往往平淡乏味且缺乏具体信息,很难满足用户的需求。为了解决这个问题,需要将背景知识引入对话系统来促进对话理解,从而提升回复的质量,目前主要可以分为两类:非结构化文本文档和结构化的知识图谱。

2、随着互联网和大数据的发展,非结构化知识比结构化知识更容易获得,结构化知识是手工构建的,在很大程度上依赖于专家的经验。因此,通过引入与对话相关的非结构化知识文档和文本作为背景知识,丰富对话中有用的信息,可以产生信息更丰富和有趣的回答。madotto等人利用指针网络和多跳注意机制,有效地将知识库信息融入到对话生成过程。li等人提出了一种基于transformer的架构,它具有双向考虑编码器,将对话历史和文本知识一起用于多回合基于文档的对话。根据他们的工作,本文档来自技高网...

【技术保护点】

1.一种基于粗粒度和细粒度特征的对话生成方法,其特征在于,包括步骤:

2.根据权利要求1所述的基于粗粒度和细粒度特征的对话生成方法,其特征在于,步骤S101包括:

3.根据权利要求2所述的基于粗粒度和细粒度特征的对话生成方法,其特征在于,步骤S102包括:

4.根据权利要求3所述的基于粗粒度和细粒度特征的对话生成方法,其特征在于,步骤S1023包括:

5.根据权利要求3所述的基于粗粒度和细粒度特征的对话生成方法,其特征在于:

6.根据权利要求1所述的基于粗粒度和细粒度特征的对话生成方法,其特征在于,步骤S103包括:

...

【技术特征摘要】

1.一种基于粗粒度和细粒度特征的对话生成方法,其特征在于,包括步骤:

2.根据权利要求1所述的基于粗粒度和细粒度特征的对话生成方法,其特征在于,步骤s101包括:

3.根据权利要求2所述的基于粗粒度和细粒度特征的对话生成方法,其特征在于,步骤s102包括:

4.根据权利要求3所述的基于粗粒度和细粒度特征的对话生成方法,其特征在于,步骤s1023包括:

5.根据权利要求3所述的基于粗粒度和细粒度特征的对话生成方法,其特征在于:

6.根据权利要求1所述的基于粗粒度和细粒度特征的对话生成方法,其特征在于,步骤s103包括:

7.根据权利要求6所述...

【专利技术属性】
技术研发人员:赵欢黎珊查徐鹏
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1