文本参数抽取方法、设备及存储介质技术

技术编号:42200744 阅读:24 留言:0更新日期:2024-07-30 18:47
本申请实施例提供一种文本参数抽取方法、设备及存储介质,涉及文本抽取技术领域。所述方法包括:获取与输入语句相匹配的问题模板以及对应的答案模板;筛选出与输入语句相匹配的目标问题模板,并从输入语句中抽取出至少一候选参数;基于至少一候选参数和目标问题模板确定若干候选问题语句;获取每一候选问题语句与输入语句的相似度结果,根据相似度结果选取目标问题语句,并确定对应的目标文本参数。本申请实施例通过在从输入句中提取得到若干候选参数之后,再基于这些候选参数构成若干候选问题语句,以根据候选问题语句与输入语句的相似度对候选参数进行二次筛选,从而有效提高输入语句与语料库模板的对齐效率和准确率。

【技术实现步骤摘要】

本申请涉及自然语言处理,具体而言,涉及一种文本参数抽取方法、设备及存储介质


技术介绍

1、文本参数抽取是自然语言处理领域的一个重要任务,通过从非结构化的自然语言文本中抽取出结构化信息,以将句子对齐下游迁移任务和语料库模板,从而实现智能问答等分析、检索和推理的任务。

2、目前,由于语料库模板的参数数量并不统一,且用户任意输入的文本多种多样,因此往往无法快速准确地从输入句中抽取出与语料库模板对齐的参数。综上,亟需一种能够提高对齐效率和准确率的文本参数抽取方案。


技术实现思路

1、本申请实施例的目的在于提供一种文本参数抽取方法、设备及存储介质,用以提高输入语句与语料库模板的对齐效率和准确率。

2、第一方面,本申请实施例提供了一种文本参数抽取方法,包括:

3、获取与输入语句相匹配的语料模板;其中,所述语料模板包括多个问题模板以及对应的一个答案模板;

4、从所述多个问题模板中筛选出与所述输入语句相匹配的目标问题模板,并基于所述输入语句与所述目标问题模板的对齐关系,从所述本文档来自技高网...

【技术保护点】

1.一种文本参数抽取方法,其特征在于,包括:

2.根据权利要求1所述的文本参数抽取方法,其特征在于,所述从所述多个问题模板中筛选出与所述输入语句相匹配的目标问题模板,包括:

3.根据权利要求2所述的文本参数抽取方法,其特征在于,所述确定所述输入语句的第一词性映射信息集,并确定每一所述问题模板的第二词性映射信息集,包括:

4.根据权利要求3所述的文本参数抽取方法,其特征在于,所述确定所述输入语句的第一SPO三元组以及所述问题模板的第二SPO三元组,并确定所述第一SPO三元组与所述第二SPO三元组的SPO匹配词,包括:

5.根据权利要求1所述的...

【技术特征摘要】

1.一种文本参数抽取方法,其特征在于,包括:

2.根据权利要求1所述的文本参数抽取方法,其特征在于,所述从所述多个问题模板中筛选出与所述输入语句相匹配的目标问题模板,包括:

3.根据权利要求2所述的文本参数抽取方法,其特征在于,所述确定所述输入语句的第一词性映射信息集,并确定每一所述问题模板的第二词性映射信息集,包括:

4.根据权利要求3所述的文本参数抽取方法,其特征在于,所述确定所述输入语句的第一spo三元组以及所述问题模板的第二spo三元组,并确定所述第一spo三元组与所述第二spo三元组的spo匹配词,包括:

5.根据权利要求1所述的文本参数抽取方法,其特征在于,所述基于所述至少一候选参数和所述目标问题模板确定若干候选问题语句,包括:

6.根据权利要求1所述的文本参数抽取方...

【专利技术属性】
技术研发人员:吴光鹏王蕴韬黄佳森余小军薛智慧
申请(专利权)人:北京天融信网络安全技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1