一种摘要信息生成方法及相关装置制造方法及图纸

技术编号:39330198 阅读:7 留言:0更新日期:2023-11-12 16:06
本申请提供了一种摘要信息生成方法以及相关装置。本申请实施例可应用于自然语言处理技术领域。其方法包括:获取角色对话信息;对角色对话信息进行特征提取,生成对话特征向量;通过多分支序列标注模型中的M个类别信息标注模块对对话特征向量进行处理,得到M个类别信息预测概率分布向量;根据每个类别信息预测概率分布向量对应的N个类别信息预测概率值,从N个对话语句中确定M组类别摘要语句;对M组类别摘要语句中的每组类别摘要语句进行拼接,生成M个类别摘要信息。本申请实施例提供的方法,提高了摘要信息生成的准确性,避免了从角色对话信息提取到每个类别的摘要信息造成的重要信息遗漏的问题,可以适用于医疗对话摘要生成的场景。场景。场景。

【技术实现步骤摘要】
一种摘要信息生成方法及相关装置


[0001]本申请涉及自然语言处理
,尤其涉及一种摘要信息生成方法及相关装置。

技术介绍

[0002]对话摘要有助于总结整个对话的简要概述,能够更加有效地知晓对话表达的主要内容。在很多应用场景起到了举重若轻的作用,例如多人参与的会议、医患对话等。
[0003]在医疗对话摘要中,医疗对话摘要任务的重点是从医生和患者之间的对话中归纳出症状摘要和诊断摘要,归纳出的信息有助于帮助有相似问题的患者提供医疗服务,同样有利于辅助医生做出合适的诊断和提供合理的治疗方法。
[0004]目前,对话摘要生成方法主要是基于Seq2Seq神经网络模型的生成式方法,该方法一般是从头开始自回归生成的,因此存在解码速度慢的问题,并且不能很好地对输入文本进行有效复用,存在生成的症状摘要和诊断摘要质量较差,容易遗漏对医疗对话中关键信息。

技术实现思路

[0005]本申请实施例提供了一种摘要信息生成方法以及相关装置,解决现有技术中根据对话信息生成的摘要信息的质量较差的问题。
[0006]本申请的一方面提供一种摘要信息生成方法,包括:获取角色对话信息,其中,角色对话信息包括N个对话语句,N个对话语句中的每个对话语句携带角色标识,N为大于1的整数;对角色对话信息进行特征提取,生成对话特征向量,其中,对话特征向量包括N个对话语句特征值,N个对话语句特征值与N个对话语句对应;将对话特征向量作为多分支序列标注模型的输入,通过多分支序列标注模型中的M个类别信息标注模块对对话特征向量进行处理,得到M个类别信息预测概率分布向量,其中,每个类别信息预测概率分布向量包括N个类别信息预测概率值,每个类别信息预测概率值用于表征对话语句属于类别信息的可能性;根据M个类别信息预测概率分布向量中的每个类别信息预测概率分布向量对应的N个类别信息预测概率值,从N个对话语句中确定M组类别摘要语句,其中,M组类别摘要语句对应于M个类别信息;对M组类别摘要语句中的每组类别摘要语句进行拼接,生成M个类别摘要信息。
[0007]本申请的另一方面提供了一种摘要信息生成装置,包括:角色对话信息获取模块、特征提取模块、概率分布向量预测模块、类别摘要语句确定模块及类别摘要信息生成模块;具体的:角色对话信息获取模块,用于获取角色对话信息,其中,角色对话信息包括N个对话语句,N个对话语句中的每个对话语句携带角色标识,N为大于1的整数;
特征提取模块,用于对角色对话信息进行特征提取,生成对话特征向量,其中,对话特征向量包括N个对话语句特征值,N个对话语句特征值与N个对话语句对应;概率分布向量预测模块,用于将对话特征向量作为多分支序列标注模型的输入,通过多分支序列标注模型中的M个类别信息标注模块对对话特征向量进行处理,得到M个类别信息预测概率分布向量,其中,每个类别信息预测概率分布向量包括N个类别信息预测概率值,每个类别信息预测概率值用于表征对话语句属于类别信息的可能性,M为大于等于1的整数;类别摘要语句确定模块,用于根据M个类别信息预测概率分布向量中的每个类别信息预测概率分布向量对应的N个类别信息预测概率值,从N个对话语句中确定M组类别摘要语句,其中,M组类别摘要语句对应于M个类别信息;类别摘要信息生成模块,用于对M组类别摘要语句中的每组类别摘要语句进行拼接,生成M个类别摘要信息。
[0008]在本申请实施例的另一种实现方式中,概率分布向量预测模块,还用于:将对话特征向量中输入至M个类别信息标注模块中的每个类别信息标注模块的全连接层中,通过M个类别信息标注模块的全连接层对对话特征向量进行全连接处理,生成M个全连接特征向量,其中,每个全连接特征向量中包括N个全连接特征值;将M个全连接特征向量输入至M个类别信息标注模块中的每个类别信息标注模块的压缩函数层中,通过M个类别信息标注模块的压缩函数层对M个全连接特征向量进行压缩处理,生成M个类别信息预测概率分布向量。
[0009]在本申请实施例的另一种实现方式中,类别摘要语句确定模块,还用于:获取M个类别信息对应的M个概率阈值;根据N个对话语句中的每个对话语句对应的M个类别信息预测概率值及M个概率阈值,从N个对话语句中确定M组类别摘要语句,其中,类别摘要语句的类别信息预测概率值大于类别信息对应的概率阈值。
[0010]在本申请实施例的另一种实现方式中,角色对话信息获取模块,还用于:获取原始对话信息及至少一个角色信息,其中,原始对话信息包括N个原始语句;将N个原始语句与至少一个角色信息进行匹配,生成角色对话信息,其中,角色对话信息包括N个携带角色标识的原始语句。
[0011]在本申请实施例的另一种实现方式中,特征提取模块,还用于:将角色对话信息作为特征提取模型中的文本摘要层的输入,通过文本摘要层对角色对话信息进行隐层语义特征提取,生成隐层语义向量;将角色对话信息作为特征提取模型中的特征嵌入层的输入,通过特征嵌入层对角色对话信息进行特征映射,生成角色嵌入特征向量;将隐层语义向量与角色嵌入特征向量进行特征融合,生成对话特征向量。
[0012]在本申请实施例的另一种实现方式中,特征提取模块,还用于:将隐层语义向量与角色嵌入特征向量进行拼接,生成特征拼接向量;将特征拼接向量作为特征提取模型中的自注意力机制层进行特征融合,生成对话特征向量。
[0013]在本申请实施例的另一种实现方式中,类别摘要信息生成模块,还用于:
获取角色对话信息中的N个对话语句对应的N个原始序号,其中,原始序号用于表征对话语句在订单角色对话信息中的顺序编号;根据N个对话语句对应的N个原始序号,确定每组类别摘要语句中的每个对话语句的拼接序号;根据M组类别摘要语句中的每组类别摘要语句中的每个对话语句的拼接序号,对M组类别摘要语句中的每组类别摘要语句进行顺序拼接,生成M个类别摘要信息。
[0014]在本申请实施例的另一种实现方式中,概率分布向量预测模块,还用于将对话特征向量作为双分支序列标注模型的输入,通过双分支序列标注模型中的第一类别信息标注模块对对话特征向量进行处理,得到第一类别信息预测概率分布向量,以及通过双分支序列标注模型中的第二类别信息标注模块对对话特征向量进行处理,得到第二类别信息预测概率分布向量,其中,第一类别信息预测概率分布向量包括N个第一类别信息预测概率值,第一类别信息预测概率值用于表征对话语句属于第一类别信息的可能性,第二类别信息预测概率分布向量包括N个第二类别信息预测概率值,第二类别信息预测概率值用于表征对话语句属于第二类别信息的可能性;类别摘要语句确定模块,还用于根据N个第一类别信息预测概率值从N个对话语句中确定第一类别摘要句,以及根据N个第二类别信息预测概率值从N个对话语句中确定第二类别摘要句;类别摘要信息生成模块,还用于对第一类别摘要句进行拼接,生成第一类别摘要信息,以及对第二类别摘要句进行拼接,生成第二类别摘要信息。
[0015]在本申请实施例的另一种实现方式中,类别摘要语句确定模块,还用于:获取第一类别信息概率阈值;将N个对话语句对应的N个第一类别信息预本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种摘要信息生成方法,其特征在于,包括:获取角色对话信息,其中,所述角色对话信息包括N个对话语句,所述N个对话语句中的每个对话语句携带角色标识,N为大于1的整数;对所述角色对话信息进行特征提取,生成对话特征向量,其中,所述对话特征向量包括N个对话语句特征值,所述N个对话语句特征值与所述N个对话语句对应;将所述对话特征向量作为多分支序列标注模型的输入,通过所述多分支序列标注模型中的M个类别信息标注模块对所述对话特征向量进行处理,得到M个类别信息预测概率分布向量,其中,每个所述类别信息预测概率分布向量包括N个类别信息预测概率值,每个所述类别信息预测概率值用于表征所述对话语句属于所述类别信息的可能性,M为大于等于1的整数;根据所述M个类别信息预测概率分布向量中的每个类别信息预测概率分布向量对应的N个类别信息预测概率值,从所述N个对话语句中确定M组类别摘要语句,其中,所述M组类别摘要语句对应于所述M个类别信息;对所述M组类别摘要语句中的每组类别摘要语句进行拼接,生成M个类别摘要信息。2.如权利要求1所述的摘要信息生成方法,其特征在于,所述将所述对话特征向量作为多分支序列标注模型的输入,通过所述多分支序列标注模型中的M个类别信息标注模块对所述对话特征向量进行处理,得到M个类别信息预测概率分布向量,包括:将所述对话特征向量中输入至所述M个类别信息标注模块中的每个类别信息标注模块的全连接层中,通过M个所述类别信息标注模块的全连接层对所述对话特征向量进行全连接处理,生成M个全连接特征向量,其中,每个全连接特征向量中包括N个全连接特征值;将所述M个全连接特征向量输入至所述M个类别信息标注模块中的每个类别信息标注模块的压缩函数层中,通过M个所述类别信息标注模块的压缩函数层对所述M个全连接特征向量进行压缩处理,生成M个类别信息预测概率分布向量。3.如权利要求1所述的摘要信息生成方法,其特征在于,所述根据所述M个类别信息预测概率分布向量中的每个类别信息预测概率分布向量对应的N个类别信息预测概率值,从所述N个对话语句中确定M组类别摘要语句,包括:获取M个类别信息对应的M个概率阈值;根据所述N个对话语句中的每个对话语句对应的M个类别信息预测概率值及所述M个概率阈值,从所述N个对话语句中确定M组类别摘要语句,其中,所述类别摘要语句的类别信息预测概率值大于所述类别信息对应的概率阈值。4.如权利要求1所述的摘要信息生成方法,其特征在于,所述获取角色对话信息,包括:获取原始对话信息及至少一个角色信息,其中,所述原始对话信息包括N个原始语句;将所述N个原始语句与所述至少一个角色信息进行匹配,生成角色对话信息,其中,所述角色对话信息包括N个携带角色标识的原始语句。5.如权利要求1所述的摘要信息生成方法,其特征在于,所述对所述角色对话信息进行特征提取,生成对话特征向量,包括:将所述角色对话信息作为特征提取模型中的文本摘要层的输入,通过所述文本摘要层对所述角色对话信息进行隐层语义特征提取,生成隐层语义向量;将所述角色对话信息作为特征提取模型中的特征嵌入层的输入,通过所述特征嵌入层
对所述角色对话信息进行特征映射,生成角色嵌入特征向量;将所述隐层语义向量与所述角色嵌入特征向量进行特征融合,生成对话特征向量。6.如权利要求5所述的摘要信息生成方法,其特征在于,所述将所述隐层语义向量与所述角色嵌入特征向量进行特征融合,生成对话特征向量,包括:将所述隐层语义向量与所述角色嵌入特征向量进行拼接,生成特征拼接向量;将所述特征拼接向量作为特征提取模型中的自注意力机制层进行特征融合,生成对话特征向量。7.如权利要求1所述的摘要信息生成方法,其特征在于,所述对所述M组类别摘要语句中的每组类别摘要语句进行拼接,生成M个类别摘要信息,包括:获取所述角色对话信息中的N个对话语句对应的N个原始序号,其中,所述原始序号用于表征所述对话语句在订单角色对话信息中的顺序编号;根据所述N个对话语句对应的N个原始序号,确定所述每组类别摘要语句中的每个对话语句的拼接序号;根据所述M组类别摘要语句中的每组类别摘要语句中的每个对话语句的拼接序号,对所述M组类别摘要语句中的每组类别摘要语句进行顺序拼接,生成M个类别摘要信息。8.如权利要求1所述的摘要信息生成方法,其特征在于,所述生成对话特征向量之后,还包括:将所述对话特征向量作为双分支序列标注模型的输入,通过所述双分支序列标注模型中的第一类别信息标注模块对所述对话特征向量进行处理,得到第一类别信息预测概率分布向量,以及通过所述双分支序列标注模型中的第二类别信息标注模块对所述对话特征向量进行处理,得到第二类别信息预测概率分布向量...

【专利技术属性】
技术研发人员:江旺杰黄予
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1