【技术实现步骤摘要】
一种上下文选择方法、装置、电子设备及存储介质
本专利技术涉及人工智能
,具体涉及一种上下文选择方法、装置、电子设备及存储介质。
技术介绍
上下文选择是句法分析、机器翻译等过程的一个阶段,主要用于在解码器每次预测一个目标元素时,从源端的向量表示中选择上下文,以实现目标元素的预测。以编码器和解码器架构的句法分析模型为例,在进行句法分析时,源句子(需进行句法分析的自然语言句子可称为源句子)输入句法分析模型后,编码器可生成源句子相应的源端向量表示序列(该源端向量表示序列包含源句子中的每个源词的向量表示),解码器每次预测一个元素时(元素为句法分析结果的组成,由各个素构成的序列可形成句法分析结果),句法分析模型中的注意力层可从源端的向量表示中选择上下文,以辅助元素的预测,从而在完成各个元素的预测后,生成句法分析结果。上下文的选择主要通过注意力层实现,目前注意力层主要依赖基于概率的注意力机制,其通过生成一个离散概率分布,来表示当前预测的目标元素与源句子中源词的对齐概率,来实现上下文的选择。然而,本专利技术的专利技术人发现,基于概率的注意力机制并不能全面的捕捉上下文,如对句法分析场景中一些启发式的上下文并不能捕捉,导致上下文选择结果的精度降低,影响句法分析等结果的精度。
技术实现思路
有鉴于此,本专利技术实施例提供一种上下文选择方法、装置、电子设备及存储介质,以提升上下文选择的精度。为实现上述目的,本专利技术实施例提供如下技术方案:一种上下文选择方法,包括:获取源句子相应的源端向量表示序列;根据当前时刻需预测的目标元素,假定所述目标元素在源句子中对齐的目标源词;根据所述 ...
【技术保护点】
1.一种上下文选择方法,其特征在于,包括:获取源句子相应的源端向量表示序列;根据当前时刻需预测的目标元素,假定所述目标元素在源句子中对齐的目标源词;根据所述目标源词,从源句子中分隔出当前时刻相应的短语结构和半短语结构;其中,所述短语结构至少为确定性的;至少根据所述目标源词、所述短语结构、半短语结构和所述源端向量表示序列,确定当前时刻相应的上下文。
【技术特征摘要】
1.一种上下文选择方法,其特征在于,包括:获取源句子相应的源端向量表示序列;根据当前时刻需预测的目标元素,假定所述目标元素在源句子中对齐的目标源词;根据所述目标源词,从源句子中分隔出当前时刻相应的短语结构和半短语结构;其中,所述短语结构至少为确定性的;至少根据所述目标源词、所述短语结构、半短语结构和所述源端向量表示序列,确定当前时刻相应的上下文。2.根据权利要求1所述的上下文选择方法,其特征在于,所述根据当前时刻需预测的目标元素,假定所述目标元素在源句子中对齐的目标源词包括:假定所述目标元素的值类型为终结符,确定所述目标元素在所述源句子中对齐的目标源词;其中,所述目标元素可能的值类型包括:终结符,左括号和右括号。3.根据权利要求2所述的上下文选择方法,其特征在于,所述假定所述目标元素的值类型为终结符,确定所述目标元素在所述源句子中对齐的目标源词包括:在假定所述目标元素的值类型为终结符时,确定所述目标元素在已预测出的值类型为终结符的元素中所对应的序数;以所确定的序数,从源句子中确定相应序数的源词为所述目标源词。4.根据权利要求2-3任一项所述的上下文选择方法,其特征在于,所述根据所述目标源词,从源句子中分隔出当前时刻相应的短语结构包括:假定所述目标元素的值类型为右括号,从所述源句子中确定当前时刻相应的短语结构的起始词,将所述目标源词的前一词作为所述短语结构的末尾词,根据所述短语结构的起始词和末尾词确定当前时刻相应的短语结构。5.根据权利要求4所述的上下文选择方法,其特征在于,所述假定所述目标元素的值类型为右括号,从所述源句子中确定当前时刻相应的短语结构的起始词包括:在假定所述目标元素的值类型为右括号时,从已预测的元素中确定与所述目标元素最近的左括号开始的短语元素;确定该左括号开始的短语元素的后一预测出的值类型为终结符的元素,及确定所述后一预测出的值类型为终结符的元素,在已预测出的值类型为终结符的元素中所对应的序数,从源句子中确定该序数相应的源词为所述短语结构的起始词。6.根据权利要求2-3任一项所述的上下文选择方法,其特征在于,所述根据所述目标源词,从源句子中分隔出当前时刻相应的半短语结构包括:假定所述目标元素的值类型为左括号,以所述目标源词为所述半短语结构的起始词,设置所述半短语结构的末尾词为所述目标源词后任一未知的源词,形成所述半短语结构。7.根据权利要求1所述的上下文选择方法,其特征在于,所述至少根据所述目标源词、所述短语结构、半短语结构和所述源端向量表示序列,确定当前时刻相应的上下文包括:根据公式ct=φ(ρ(xb,xt-1),ρ(xt,?),xt,Ex)确定当前时刻相应的上下文;其中,ct表示当前时刻相应的上下文,xt为所述目标源词,xb为所述短语结构的起始词,Ex为所述源句子相应的源端向量表示序列,ρ(xb,xt-1)为当前时刻相应的短语结构,ρ(xt,?)为当前时刻相应的半短语结构。8.根据权利要求7所述的上下文选择方法,其特征在于,所述φ的定义包括:其中,θc表示基于确定性注意力机制的注意力层的参数,表示当前时刻相应的短语结构的起始词xb的向量表示,表示当前时刻相应的短语结构的末尾词的向量表示,表示所述目标源词的向量表示或,或,9.根据权利要求1所述的上下文选择方法,其特征在于,所述上下文选择方法由句法分析模型中的基于确定性注意力机制的注意...
【专利技术属性】
技术研发人员:刘乐茂,史树明,
申请(专利权)人:深圳市腾讯计算机系统有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。