【技术实现步骤摘要】
一种答案文本的摘要提取方法及装置、电子设备及介质
[0001]本申请涉及自然语言处理
,尤其涉及一种答案文本的摘要提取方法及装置、电子设备及介质。
技术介绍
[0002]随着互联网的普及,人们越来越多地在互联网上搜索问题的答案信息。而互联网返回的往往是大量匹配后的答案信息,需要花费大量的时间进行浏览以识别有效的答案,用户体验差。
[0003]因此,对答案信息进行摘要提取变得尤为重要。
技术实现思路
[0004]有鉴于此,本公开实施例提供了一种答案文本的摘要提取方法及装置、电子设备及存储介质。
[0005]根据本公开实施例的第一方面,提供一种答案文本的摘要提取方法,包括:
[0006]获取第一文本长度的第一答案文本;
[0007]根据所述第一答案文本的文本类型和/或第一文本长度,从多个备选模型中确定目标模型;
[0008]使用所述目标模型处理所述第一答案文本,得到第二文本长度的第二答案文本,其中,所述第二文本长度短于所述第一文本长度,且所述第二答案文本与所述第一答案 ...
【技术保护点】
【技术特征摘要】
1.一种答案文本的摘要提取方法,其特征在于,包括:获取第一文本长度的第一答案文本;根据所述第一答案文本的文本类型和/或第一文本长度,从多个备选模型中确定目标模型;使用所述目标模型处理所述第一答案文本,得到第二文本长度的第二答案文本,其中,所述第二文本长度短于所述第一文本长度,且所述第二答案文本与所述第一答案文本的主旨含义相同。2.根据权利要求1所述的答案文本的摘要提取方法,其特征在于,所述备选模型包括以下至少之一:生成式模型,用于基于所述第一答案文本的内容,生成所述第二答案文本;抽取式模型,提取所述第一答案文本中已经存在的至少一个关键词和/或关键句,形成所述第二答案文本;综合模型,包括先后设置的所述抽取式模型和所述生成式模型,用于将所述第一答案文本依次经所述抽取式模型和所述生成式模型处理后,形成所述第二答案文本。3.根据权利要求2所述的答案文本的摘要提取方法,其特征在于,所述根据所述第一答案文本的文本类型和/或第一文本长度,从多个备选模型中确定目标模型,包括以下至少之一:若所述第一答案文本的文本类型为第一文本类型且所述第一文本长度位于第一区间范围,确定所述目标模型为所述生成式模型;若所述第一答案文本为第一文本类型且所述第一文本长度位于第二区间范围,确定所述目标模型为所述抽取式模型;若所述第一答案文本为第一文本类型且所述第一文本长度位于第三区间范围,确定所述目标模型为所述综合模型;其中,所述第二区间范围的最小值大于等于所述第一区间范围的最大值,所述第三区间范围的最小值大于等于所述第二区间范围的最大值。4.根据权利要求2所述的答案文本的摘要提取方法,其特征在于,所述根据所述第一答案文本的文本类型和/或第一文本长度,从多个备选模型中确定目标模型,还包括:若所述第一答案文本为第二文本类型或第三文本类型,且所述第一文本长度位于第四区域范围,确定所述目标模型为所述抽取式模型。5.根据权利要求2所述的答案文本的摘要提取方法,其特征在于,所述生成式模型,用于基于所述第一答案文本的内容,生成所述第二答案文本,包括:对所述第一答案文本进行分词处理,确定所述第一答案文本中的分词位置;在所述第一答案文本中的分词位置处插入预定的分隔符;将插入有所述分隔符的第一答案文本输入到所述生成式模型中,得到所述第二答案文本。6.根据权利要求5所述的答案文本的摘要提取方法,其特征在于,所述生成式模型为基于Transformers的双向编码器BERT的语言模型。7.根据权利要求2所述的答案文本的摘要提取方法,其特征在于,所述抽取式模型,提取所述第一答案文本中已经...
【专利技术属性】
技术研发人员:花新宇,代文,陈帅,
申请(专利权)人:北京小米松果电子有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。