【技术实现步骤摘要】
一种基于BART的多任务语义解析模型
[0001]本专利技术属于自然语言处理
,尤其涉及一种基于BART的多任务语义解析模型。
技术介绍
[0002]传统的知识图谱问答中语义解析算法采用多步骤流水线的方式,首先识别用户的意图与问题的类型,再进行实体关系抽取,最后根据预先定义的查询模板进行槽位填充,组成完整的SPARQL查询语句检索数据库,返回用户答案。多步骤流水线的语义解析方式将任务划分为不同的阶段,对任务进行分解,操作灵活、可解释性强,但是任务的级联分解会导致错误的累积和放大;当设计多种实体与关系或者推理问答时,模型表现较差,从而影响问答任务的性能。
技术实现思路
[0003]针对上述问题,本专利技术第一方面提供了一种基于BART的多任务语义解析模型,所述模型包括词嵌入层、BART编码层、领域分类器、BART解码层、概率解码器、SPARQL解码器和语法检查器;所述词嵌入层将输入问题中每个字符转化为向量表示,并输入BART编码层;所述BART编码层学习字符向量深层的语义信息并进行编码,将最后一层编码的隐含层向量表示分别输入领域分类器和BART解码层;所述领域分类器对最后一层隐含层向量进行文本分类,以求得该问题所属领域;所述BART解码层根据问题编码信息和上文解码信息,通过语言模型产生完整的解码信息;所述概率解码器模块对BART解码器最后一层输出的向量进行语义信息增强解码,并将解码信息输入SPARQL解码器模块;所述SPARQL解码器模块根据解码策略和领域信息,循环生成SPARQL查询语句,并将语 ...
【技术保护点】
【技术特征摘要】
1.一种基于BART的多任务语义解析模型,其特征在于:所述模型包括词嵌入层、BART编码层、领域分类器、BART解码层、概率解码器、SPARQL解码器和语法检查器;所述词嵌入层将输入问题中每个字符转化为向量表示,并输入BART编码层;所述BART编码层学习字符向量深层的语义信息并进行编码,将最后一层编码的隐含层向量表示分别输入领域分类器和BART解码层;所述领域分类器对最后一层隐含层向量进行文本分类,以求得该问题所属领域;所述BART解码层根据问题编码信息和上文解码信息,通过语言模型产生完整的解码信息;所述概率解码器对BART解码器最后一层输出的向量进行语义信息增强解码,并将解码信息输入SPARQL解码器模块;所述SPARQL解码器模块根据解码策略和领域信息,循环生成SPARQL查询语句,并将语句输入语法检查器模块;所述语法检查器用于检查SPARQL查询语句的语法错误。2.如权利要求1所述的一种基于BART的多任务语义解析模型,其特征在于:所述词嵌入层将输入问题中每个字符转化为向量表示,具体为:通过[CLS]、问句、[SEP]字符拼接组成输入数据,数据最大长度为512个字符,长则截断,短则通过[PAD]字符填充;在字典表中添加特殊字符“?x”、“?y”和SPARQL语法中的特殊字符;通过词语嵌入与位置嵌入相加得到每个输入字符的向量表示,计算公式如下所示:E
embedding
=E
word
+E
position
(1)其中,E
word
为字符的词嵌入向量,E
position
为位置嵌入向量,E
embedding
为输入字符的向量表示。3.如权利要求1所述的一种基于BART的多任务语义解析模型,其特征在于:所述BART使用标准的Transformer模型,包含6层Transformer编码器和6层Transformer解码器,所述BART编码层通过双向多头注意力机制综合学习不同子空间中的特征,捕捉更深层次的语义信息,具体为:Transformer编码器的多头注意力子层采用自注意力机制,为每个单词创建Query、Key和Value三个向量来计算自注意力得分,计算公式如下所示:和Value三个向量来计算自注意力得分,计算公式如下所示:Multihead(Q,K,V)=Concat(head1,head2,...,head
h
)W
O
(4)其中,Softmax为逻辑回归函数,Attention函数用Softmax函数计算自注意力,通过不同的组合计算多组自注意力head_i,Multihead(Q,K,V)通过Concat函数将多组自注意力进行连接,组合成为多头注意力;执行Transformer编码器的层归一化,防止出现协方差偏移问题,并通过残差连接以防
止梯度消失,计算公式如下所示;SubLayer=Layer_Normalization(x+(sublayer(x)))(5)x为当前层双头注意力运算结果,Sublayer(x)为下一层的双头注意力运算结果,两个运算结果直接相加即进行残差链接,并通过Layer_Normalization进行层归一化;通过前馈网络层与非线性激活函数ReLU,...
【专利技术属性】
技术研发人员:张卫山,王振琦,侯召祥,孙晨瑜,陈涛,
申请(专利权)人:中国石油大学华东,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。