答案摘要抽取方法、答案摘要抽取模型的训练方法及装置制造方法及图纸

技术编号：36643965 阅读：11 留言：0更新日期：2023-02-18 13:02

本申请公开了一种答案摘要抽取方法、答案摘要抽取模型的训练方法及装置，属于人工智能技术领域。所述方法包括：获取输入问题；基于输入问题，确定与输入问题对应的解答文本；将输入问题与解答文本输入至答案摘要抽取模型进行答案摘要抽取处理，得到与输入问题对应的答案摘要信息；其中，答案摘要抽取模型是以样本问题、样本解答文本以及样本解答文本中各文本单元对应的概率分布信息作为标签信息进行训练得到，概率分布信息由样本解答文本中候选答案与标注答案之间的相似度信息确定，且用于表征解答文本中文本单元分别为答案摘要的起始位置和结束位置的概率。本申请基于上述方法训练优化答案摘要抽取模型，提升模型抽取答案摘要的准确性和灵活性。要的准确性和灵活性。要的准确性和灵活性。

全部详细技术资料下载

【技术实现步骤摘要】
答案摘要抽取方法、答案摘要抽取模型的训练方法及装置

[0001]本申请涉及人工智能
，特别涉及一种答案摘要抽取方法、答案摘要抽取模型的训练方法及装置。

技术介绍

[0002]随着信息技术的快速发展，快速便捷地获取信息已成为用户的重要需求，智能问答服务收到广泛关注，如何快速准确地为用户提供所需的信息也成为了需要解决的重要难题。
[0003]为了方便用户快速精准地找到想要的信息，一些应用程序中一般会提供智能问答服务，例如智能客服、智能问诊等服务。相关技术中，智能问答服务一般将用户输入的问题输入至机器学习模型，进而输出与用户输入的问题相关的文本信息，并反馈给用户。其中，机器学习模型一般是以人工标注的答案作为标签信进行训练，标签值一般也是离散的数值，如0或1。
[0004]相关技术中，机器学习模型训练时使用的标签信息单一，对人工标注质量依赖性强，模型容易过拟合。

技术实现思路

[0005]本申请实施例提供了一种答案摘要抽取方法、答案摘要抽取模型的训练方法及装置，能够丰富样本的标签信息，降低了模型人工标注质量的依赖程度，有效防止模型过拟合，提升了模型抽取答案摘要的准确性和灵活性。
[0006]根据本申请实施例的一个方面，提供了一种答案摘要抽取方法，所述方法包括：
[0007]获取所述输入问题；
[0008]基于所述输入问题，确定与所述输入问题对应的解答文本；
[0009]将所述输入问题与所述解答文本输入至答案摘要抽取模型进行答案摘要抽取处理，得到与所述输入问...

【技术保护点】

【技术特征摘要】
1.一种答案摘要抽取方法，其特征在于，所述方法包括：获取所述输入问题；基于所述输入问题，确定与所述输入问题对应的解答文本；将所述输入问题与所述解答文本输入至答案摘要抽取模型进行答案摘要抽取处理，得到与所述输入问题对应的答案摘要信息；其中，所述答案摘要抽取模型是以样本问题、样本解答文本以及所述样本解答文本中各文本单元对应的概率分布信息作为标签信息进行训练得到的机器学习模型，所述概率分布信息由所述样本解答文本中至少一个候选答案与所述样本问题对应的标注答案之间的相似度信息确定，且用于表征所述解答文本中文本单元分别为预测答案摘要信息的起始位置和结束位置的概率。2.根据权利要求1所述的方法，其特征在于，所述将所述输入问题与所述解答文本输入至答案摘要抽取模型进行答案摘要抽取处理，得到与所述输入问题对应的答案摘要信息，包括：基于所述输入问题与所述解答文本，生成拼接字符序列；确定所述拼接字符序列中各个字符的字符特征；基于所述字符特征，得到所述输入问题与所述解答文本中各文本单元的文本单元特征；根据所述文本单元特征，确定所述解答文本中各文本单元对应的第一输出概率和第二输出概率，所述第一输出概率为所述各文本单元为所述答案摘要信息的起始位置的概率，所述第二输出概率为预测所述各文本单元为所述答案摘要信息的结束位置的概率；基于所述各文本单元对应的第一输出概率和第二输出概率，确定所述答案摘要信息。3.一种答案摘要抽取模型的训练方法，其特征在于，所述方法包括：获取样本问题、样本解答文本以及与所述样本问题对应的标注答案，所述样本解答文本包括至少一个候选答案；确定所述至少一个候选答案与所述标注答案之间的相似度信息；基于所述相似度信息，确定所述样本解答文本中各文本单元对应的概率分布信息，所述概率分布信息用于表征所述各文本单元分别为答案摘要信息的起始位置和结束位置的概率；将所述概率分布信息作为标签信息进行机器学习训练，得到答案摘要抽取模型，以使所述答案摘要抽取模型基于输入问题确定与所述输入问题对应的答案摘要信息。4.根据权利要求3所述的方法，其特征在于，所述概率分布信息包括第一概率分布，所述第一概率分布用于表征所述各文本单元为所述起始位置的概率，所述基于所述相似度信息，确定所述样本解答文本中各文本单元对应的概率分布信息，包括：对于所述各文本单元中的目标文本单元，获取以所述目标文本单元为所述起始位置的各个候选答案与所述标注答案之间的第一语义相似度信息；基于所述第一语义相似度信息，确定所述目标文本单元的第一概率；基于所述各文本单元的第一概率，确定所述第一概率分布，所述第一概率分布包括所述各文本单元为所述起始位置的第一概率。5.根据权利要求4所述的方法，其特征在于，所述概率分布信息还包括第二概率分布，
所述第二概率分布用于表征所述各文本单元为所述结束位置的概率，所述基于所述相似度信息，确定所述样本解答文本中各文本单元对应的概率分布信息，包括：对于所述目标文本单元，获取以所述目标文本单元为所述结束位置的各个候选答案与所述标注答案之间的第二语义相似度信息；基于所述第二语义相似度信息，确定所述目标文本单元的第二概率；基于所述各文本单元的第二概率，确定所述第二概率分布，所...

【专利技术属性】
技术研发人员：王唯康，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人