一种摘要信息生成方法及相关装置制造方法及图纸

技术编号：39330198 阅读：21 留言：0更新日期：2023-11-12 16:06

本申请提供了一种摘要信息生成方法以及相关装置。本申请实施例可应用于自然语言处理技术领域。其方法包括：获取角色对话信息；对角色对话信息进行特征提取，生成对话特征向量；通过多分支序列标注模型中的M个类别信息标注模块对对话特征向量进行处理，得到M个类别信息预测概率分布向量；根据每个类别信息预测概率分布向量对应的N个类别信息预测概率值，从N个对话语句中确定M组类别摘要语句；对M组类别摘要语句中的每组类别摘要语句进行拼接，生成M个类别摘要信息。本申请实施例提供的方法，提高了摘要信息生成的准确性，避免了从角色对话信息提取到每个类别的摘要信息造成的重要信息遗漏的问题，可以适用于医疗对话摘要生成的场景。场景。场景。

全部详细技术资料下载

【技术实现步骤摘要】
一种摘要信息生成方法及相关装置

[0001]本申请涉及自然语言处理
，尤其涉及一种摘要信息生成方法及相关装置。

技术介绍

[0002]对话摘要有助于总结整个对话的简要概述，能够更加有效地知晓对话表达的主要内容。在很多应用场景起到了举重若轻的作用，例如多人参与的会议、医患对话等。
[0003]在医疗对话摘要中，医疗对话摘要任务的重点是从医生和患者之间的对话中归纳出症状摘要和诊断摘要，归纳出的信息有助于帮助有相似问题的患者提供医疗服务，同样有利于辅助医生做出合适的诊断和提供合理的治疗方法。
[0004]目前，对话摘要生成方法主要是基于Seq2Seq神经网络模型的生成式方法，该方法一般是从头开始自回归生成的，因此存在解码速度慢的问题，并且不能很好地对输入文本进行有效复用，存在生成的症状摘要和诊断摘要质量较差，容易遗漏对医疗对话中关键信息。

技术实现思路

[0005]本申请实施例提供了一种摘要信息生成方法以及相关装置，解决现有技术中根据对话信息生成的摘要信息的质量较差的问题。
[0006...

【技术保护点】

【技术特征摘要】
1.一种摘要信息生成方法，其特征在于，包括：获取角色对话信息，其中，所述角色对话信息包括N个对话语句，所述N个对话语句中的每个对话语句携带角色标识，N为大于1的整数；对所述角色对话信息进行特征提取，生成对话特征向量，其中，所述对话特征向量包括N个对话语句特征值，所述N个对话语句特征值与所述N个对话语句对应；将所述对话特征向量作为多分支序列标注模型的输入，通过所述多分支序列标注模型中的M个类别信息标注模块对所述对话特征向量进行处理，得到M个类别信息预测概率分布向量，其中，每个所述类别信息预测概率分布向量包括N个类别信息预测概率值，每个所述类别信息预测概率值用于表征所述对话语句属于所述类别信息的可能性，M为大于等于1的整数；根据所述M个类别信息预测概率分布向量中的每个类别信息预测概率分布向量对应的N个类别信息预测概率值，从所述N个对话语句中确定M组类别摘要语句，其中，所述M组类别摘要语句对应于所述M个类别信息；对所述M组类别摘要语句中的每组类别摘要语句进行拼接，生成M个类别摘要信息。2.如权利要求1所述的摘要信息生成方法，其特征在于，所述将所述对话特征向量作为多分支序列标注模型的输入，通过所述多分支序列标注模型中的M个类别信息标注模块对所述对话特征向量进行处理，得到M个类别信息预测概率分布向量，包括：将所述对话特征向量中输入至所述M个类别信息标注模块中的每个类别信息标注模块的全连接层中，通过M个所述类别信息标注模块的全连接层对所述对话特征向量进行全连接处理，生成M个全连接特征向量，其中，每个全连接特征向量中包括N个全连接特征值；将所述M个全连接特征向量输入至所述M个类别信息标注模块中的每个类别信息标注模块的压缩函数层中，通过M个所述类别信息标注模块的压缩函数层对所述M个全连接特征向量进行压缩处理，生成M个类别信息预测概率分布向量。3.如权利要求1所述的摘要信息生成方法，其特征在于，所述根据所述M个类别信息预测概率分布向量中的每个类别信息预测概率分布向量对应的N个类别信息预测概率值，从所述N个对话语句中确定M组类别摘要语句，包括：获取M个类别信息对应的M个概率阈值；根据所述N个对话语句中的每个对话语句对应的M个类别信息预测概率值及所述M个概率阈值，从所述N个对话语句中确定M组类别摘要语句，其中，所述类别摘要语句的类别信息预测概率值大于所述类别信息对应的概率阈值。4.如权利要求1所述的摘要信息生成方法，其特征在于，所述获取角色对话信息，包括：获取原始对话信息及至少一个角色信息，其中，所述原始对话信息包括N个原始语句；将所述N个原始语句与所述至少一个角色信息进行匹配，生成角色对话信息，其中，所述角色对话信息包括N个携带角色标识的原始语句。5.如权利要求1所述的摘要信息生成方法，其特征在于，所述对所述角色对话信息进行特征提取，生成对话特征向量，包括：将所述角色对话信息作为特征提取模型中的文本摘要层的输入，通过所述文本摘要层对所述角色对话信息进行隐层语义特征提取，生成隐层语义向量；将所述角色对话信息作为特征提取模型中的特征嵌入层的输入，通过所述特征嵌入层
对所述角色对话信息进行特征映射，生成角色嵌入特征向量；将所述隐层语义向量与所述角色嵌入特征向量进行特征融合，生成对话特征向量。6.如权利要求5所述的摘要信息生成方法，其特征在于，所述将所述隐层语义向量与所述角色嵌入特征向量进行特征融合，生成对话特征向量，包括：将所述隐层语义向量与所述角色嵌入特征向量进行拼接，生成特征拼接向量；将所述特征拼接向量作为特征提取模型中的自注意力机制层进行特征融合，生成对话特征向量。7.如权利要求1所述的摘要信息生成方法，其特征在于，所述对所述M组类别摘要语句中的每组类别摘要语句进行拼接，生成M个类别摘要信息，包括：获取所述角色对话信息中的N个对话语句对应的N个原始序号，其中，所述原始序号用于表征所述对话语句在订单角色对话信息中的顺序编号；根据所述N个对话语句对应的N个原始序号，确定所述每组类别摘要语句中的每个对话语句的拼接序号；根据所述M组类别摘要语句中的每组类别摘要语句中的每个对话语句的拼接序号，对所述M组类别摘要语句中的每组类别摘要语句进行顺序拼接，生成M个类别摘要信息。8.如权利要求1所述的摘要信息生成方法，其特征在于，所述生成对话特征向量之后，还包括：将所述对话特征向量作为双分支序列标注模型的输入，通过所述双分支序列标注模型中的第一类别信息标注模块对所述对话特征向量进行处理，得到第一类别信息预测概率分布向量，以及通过所述双分支序列标注模型中的第二类别信息标注模块对所述对话特征向量进行处理，得到第二类别信息预测概率分布向量...

【专利技术属性】
技术研发人员：江旺杰，黄予，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人