一种基于深度神经网络的句子构式分析方法及装置制造方法及图纸

技术编号:37789436 阅读:8 留言:0更新日期:2023-06-09 09:19
本发明专利技术公开了一种基于深度神经网络的句子构式分析方法及装置,该方法包括:构建基于组块链的汉语构式语义表示机制;根据汉语构式语义表示机制,构建汉语构式的模板集,并建立汉语构式的标注数据集;基于汉语构式的标注数据集训练深度神经网络模型;将待分析句子输入训练后的深度神经网络模型,自动分析出句子的构式结构;本发明专利技术方法通过建立基于组块链的汉语构式语义表示机制和汉语构式的标注数据集,并采用深度神经网络模型自动分析句子的构式,不仅能分析句子内部构成部分的语义信息,还能分析构式本身所表示的意义,便于更准确地、更深入地实现汉语句子级的深层语义理解,有助于提升对外汉语教学的效率。提升对外汉语教学的效率。提升对外汉语教学的效率。

【技术实现步骤摘要】
一种基于深度神经网络的句子构式分析方法及装置


[0001]本专利技术涉及自然语言处理
,特别涉及一种基于深度神经网络的句子构式分析方法及装置。

技术介绍

[0002]对于不含构式的一般句子如例1,通常的句法分析和事件分析可给出其句法结构和事件结构,基于此可获取句子的主要意义。
[0003]例1:张三喝咖啡
[0004] 张三喝咖啡句法分析:主语谓语宾语事件语义:施事动作受事
[0005]但对于含有构式的句子如例2:传统分析方法却无法获取其较完整的意义。
[0006]例2:一锅饭吃了\吃不了十个人
[0007] 一锅饭吃了\吃不了十个人构式语义:容纳量容纳Trigger被容纳量
[0008]如果一个小学生或外国学生初次看到这样的句子,他们能够理解其中每个词的意思,但他们不一定知道整句话的意思。对于例2,除句法(“主



宾”关系,或主宾倒装句)和事件语义(“受事

动作

施事")的基本理解外,它还包含容纳量和被容纳量之间的关系,还需理解其特有的构式义才能真正理解其意义。
[0009]像例2这样的句式,用构式理论来解读,可以作出比较好的分析与解释。它可以看作容纳量数量构式,其中“一锅饭”表示容纳量,“十个人”表示被容纳量,“吃了\吃不了”表示容纳方式,所说的是动词前边那个量能够容纳(容纳不了)后面那个量。
[0010]当前,语言中存在大量的构式,但是由于构式的句法语义特征无法单纯从内部各个词语成分的句法语义特征简单相加得到,因此是当前自然语言处理中的难点和重点。
[0011]目前组合语义学作为自然语言处理领域的主流研究,认为短语和句子的语义由其组成部分的语义组合而成,其缺陷为未考虑短语和句子内部结构本身所包含的语义信息。
[0012]虽然构式语义学的发展为解决以上缺陷提供了理论支撑,它强调构式本身是有意义的,而且整体意义大于内部各成分意义之和。因此构式的语义分析不能仅靠其内部构成部分的语义信息,还需探讨构式本身所表示的意义。但是目前汉语构式的研究主要集中在语言学理论层面,缺乏大规模的构式语义标注资源以及相应的自动分析方法。

技术实现思路

[0013]有鉴于此,本专利技术提供至少解决上述部分技术问题的一种基于深度神经网络的句子构式分析方法及装置,该方法建立了基于组块链的汉语构式语义表示机制和汉语构式的标注数据集,并利用深度神经网络模型可以自动分析句子的构式,便于更准确地、更深入地实现汉语句子级的深层语义理解,有助于提升对外汉语教学的效率。
[0014]为实现上述目的,本专利技术采取的技术方案为:
[0015]第一方面,本专利技术实施例提供一种基于深度神经网络的句子构式分析方法,包括以下步骤:
[0016]S1、构建基于组块链的汉语构式语义表示机制;
[0017]S2、根据所述汉语构式语义表示机制,构建汉语构式的标注数据集;
[0018]S3、基于所述汉语构式的标注数据集训练深度神经网络模型,获得训练后的深度神经网络模型;
[0019]S4、将待分析句子输入训练后的深度神经网络模型,自动分析出所述句子的构式结构。
[0020]进一步的,所述步骤S1中,所述构建基于组块链的汉语构式语义表示机制,具体包括以下步骤:
[0021]S11、分析汉语构式的类型;
[0022]S12、基于所述汉语构式的类型,分析所述汉语构式内部所包含的各个语义成分;
[0023]S13、由所述语义成分构成线性组块链,获得表示所述汉语构式的组块链。
[0024]进一步的,所述步骤S2中,所述构建汉语构式的标注数据集,具体包括以下步骤:
[0025]S21、从目标语料库中进行语料选取;
[0026]S22、基于汉语构式的类型,并结合真实语料,构建汉语构式模板集;
[0027]S23、基于所述汉语构式模板集对句子进行构式标注,获得汉语构式的标注数据集。
[0028]进一步的,所述步骤S4中,所述将待分析句子输入训练后的所述深度神经网络模型,自动分析出所述句子的构式结构,具体包括以下步骤:
[0029]S41、在输入层,采用BERT模型来对输入的所述待分析句子进行编码,输出特征表示;
[0030]S42、在特征层,将所述BERT模型输出的特征表示输入至BiLSTM神经网络得到神经网络特征,并结合预设组合特征拼接后输入到隐藏层,得到相应的特征表示;
[0031]S43、在输出层,使用隐藏层的输出作为输入,采用Softmax计算输出所述句子的构式分析最优结果。
[0032]进一步的,所述步骤S11中,所述汉语构式的类型,包括:
[0033]动补结构、双及物结构、很+名词结构、容纳结构、A是A,B是B、V来V去+VP、V+NP+V+的、存在句式、兼语句式、把字句式和被字句式。
[0034]进一步的,所述步骤S23中,所述构式标注为:一个标注实例包含一个句子及其所包含的构式类型和构式成分。
[0035]进一步的,所述步骤S42中,所述预设组合特征,具体包括:
[0036]a.一元特征:对于任意状态,一元特征包括<Q0>、<Q1>、<Q2>;
[0037]b.二元特征:对于任意状态,二元特征包括<Q0,Q1>、<Q1,Q2>、<S0,T0>,<E0,T0>;
[0038]c.上下文结构特征:对于任意状态,上下文特征包括<S0,T
‑1,T0>、<S
‑1,T
‑1,S0,T0,>,<E
‑1,T
‑1,E0,T0>、<E
‑1,T
‑1,S0,T0>;
[0039]其中,Q0、Q1和Q2为该状态队列中待处理的词,T0为该状态stack中当前构式成分的类型,S0为当前构式成分的起始词,E0为当前构式成分的终止词,T
‑1为当前构式成分之前的
一个构式成分的类型,S
‑1为当前构式成分之前的一个构式成分的起始词,E
‑1为当前构式成分之前的一个构式成分的终止词。
[0040]第二方面,本专利技术实施例还提供一种基于深度神经网络的句子构式分析装置,该装置包括:
[0041]机制构建模块,用于构建基于组块链的汉语构式语义表示机制;
[0042]数据集构建模块,用于根据所述汉语构式语义表示机制,构建汉语构式的标注数据集;
[0043]训练模块,用于基于所述汉语构式的标注数据集训练深度神经网络模型,获得训练后的深度神经网络模型;...

【技术保护点】

【技术特征摘要】
1.一种基于深度神经网络的句子构式分析方法,其特征在于,包括以下步骤:S1、构建基于组块链的汉语构式语义表示机制;S2、根据所述汉语构式语义表示机制,构建汉语构式的标注数据集;S3、基于所述汉语构式的标注数据集训练深度神经网络模型,获得训练后的深度神经网络模型;S4、将待分析句子输入训练后的深度神经网络模型,自动分析出所述句子的构式结构。2.根据权利要求1所述的一种基于深度神经网络的句子构式分析方法,其特征在于,所述步骤S1中,所述构建基于组块链的汉语构式语义表示机制,具体包括以下步骤:S11、分析汉语构式的类型;S12、基于所述汉语构式的类型,分析所述汉语构式内部所包含的各个语义成分;S13、由所述语义成分构成线性组块链,获得表示所述汉语构式的组块链。3.根据权利要求2所述的一种基于深度神经网络的句子构式分析方法,其特征在于,所述步骤S2中,所述构建汉语构式的标注数据集,具体包括以下步骤:S21、从目标语料库中进行语料选取;S22、基于所述汉语构式的类型,并结合真实语料,构建汉语构式模板集;S23、基于所述汉语构式模板集对句子进行构式标注,获得汉语构式的标注数据集。4.根据权利要求1所述的一种基于深度神经网络的句子构式分析方法,其特征在于,所述步骤S4中,所述将待分析句子输入训练后的所述深度神经网络模型,自动分析出所述句子的构式结构,具体包括以下步骤:S41、在输入层,采用BERT模型来对输入的所述待分析句子进行编码,输出特征表示;S42、在特征层,将所述BERT模型输出的特征表示输入至BiLSTM神经网络得到神经网络特征,并结合预设组合特征拼接后输入到隐藏层,得到相应的特征表示;S43、在输出层,使用隐藏层的输出作为输入,采用Softmax计算输出所述句子的构式分析最优结果。5.根据权利要求2所述的一种基于深度神经网络的句子构式分析方法,其特征在于,所述步骤S11中,所述汉语构式的类型,包括:动补结构、双及物结构、很+名词结构、容纳结构、A是A,B是B、V来V去+VP、V+NP+V+的、存在句式、兼语句式、把字句式和被字句式。6.根据权利要求3所述的一种基于深度神经网络的句子构式分析方法,其特征在于,所述步骤S23中,所述构式标注为:一个标注实例包含一个...

【专利技术属性】
技术研发人员:吕晨
申请(专利权)人:广东外语外贸大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1