一种会话理解生成方法和模型训练方法以及设备技术

技术编号:40081824 阅读:21 留言:0更新日期:2024-01-23 14:50
本申请公开了一种会话理解生成方法和模型训练方法以及设备,在进行模型训练时,将样本数据中的规则文本和用户信息文本分别切分为若干规则信息单元和用户信息单元,在进行推理决策时,基于各信息单元的语义向量,确定每个规则信息单元与每个用户信息单元的对齐分数和蕴涵状态概率分布,利用对齐分数和蕴涵状态概率分布,对蕴涵状态向量加权处理,得到各规则信息单元的综合蕴涵状态向量表示,基于所有规则信息单元的语义向量表示、综合蕴涵状态向量表示和对话初始问题的语义向量表示,决策推理状态类型,在决策出需要用户提供更多信息时,基于对话的问题序列,生成澄清问题。采用本申请可以降低资源开销、提高对话效率、提升用户对话体验。

【技术实现步骤摘要】

本专利技术涉及移动通信技术,特别是涉及一种会话理解生成方法和模型训练方法以及设备


技术介绍

1、目前,对于一些信息咨询服务,如专项补助政策咨询、电商购物活动咨询等,用户往往比较关注自己是否满足参加这些活动所要求的条件,同时,这些活动都具有相对应的业务文档以供客服人员参考,这一类咨询任务需要耗费大量的人工坐席人力成本。因此,使用机器自动化地对用户的咨询任务做出答复,可以提高效率、节省人力成本。为了满足这类需求,产生了会话式机器阅读理解技术,该技术需要基于描述业务的规则文档,通过多轮对话交互,来回答用户提出的初始咨询问题。该技术需要具备两项基础的自然语言处理能力:推理和生成。

2、为了具备推理能力,现有方法根据实际需求的特性,抽象出了四种推理状态,分别是:(一)不相关(用户的咨询问题和规则文档无关);(二)肯定(用户满足规则文档的要求);(三)否定(用户不满足规则文档的要求);(四)需要更多信息(根据与用户的对话无法做出判断)。推理能力的目标是结合对话历史和规则文档从这四种状态中做出恰当的选择。对于推理模型设计而言,现有方法首先将规则文档用指针网本文档来自技高网...

【技术保护点】

1.一种会话理解生成模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述信息文本进行切分包括:

3.根据权利要求1所述的方法,其特征在于,所述弱监督对齐标签的获取方法包括:

4.根据权利要求1所述的方法,其特征在于,所述确定该规则信息单元与每个所述用户信息单元的蕴涵状态概率分布包括:

5.根据权利要求1所述的方法,其特征在于,所述利用所述对齐分数和所述蕴涵状态概率分布,对所述蕴涵状态分析网络的蕴涵状态向量进行加权处理,得到该规则信息单元对应的综合蕴涵状态向量表示包括:

6.根据权利要求1所述的...

【技术特征摘要】

1.一种会话理解生成模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述信息文本进行切分包括:

3.根据权利要求1所述的方法,其特征在于,所述弱监督对齐标签的获取方法包括:

4.根据权利要求1所述的方法,其特征在于,所述确定该规则信息单元与每个所述用户信息单元的蕴涵状态概率分布包括:

5.根据权利要求1所述的方法,其特征在于,所述利用所述对齐分数和所述蕴涵状态概率分布,对所述蕴涵状态分析网络的蕴涵状态向量进...

【专利技术属性】
技术研发人员:罗洋洋田时雨王小捷袁彩霞
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1