【技术实现步骤摘要】
一种基于深度神经网络的句子构式分析方法及装置
[0001]本专利技术涉及自然语言处理
,特别涉及一种基于深度神经网络的句子构式分析方法及装置。
技术介绍
[0002]对于不含构式的一般句子如例1,通常的句法分析和事件分析可给出其句法结构和事件结构,基于此可获取句子的主要意义。
[0003]例1:张三喝咖啡
[0004] 张三喝咖啡句法分析:主语谓语宾语事件语义:施事动作受事
[0005]但对于含有构式的句子如例2:传统分析方法却无法获取其较完整的意义。
[0006]例2:一锅饭吃了\吃不了十个人
[0007] 一锅饭吃了\吃不了十个人构式语义:容纳量容纳Trigger被容纳量
[0008]如果一个小学生或外国学生初次看到这样的句子,他们能够理解其中每个词的意思,但他们不一定知道整句话的意思。对于例2,除句法(“主
‑
动
‑
宾”关系,或主宾倒装句)和事件语义(“受事
‑
动作
‑
施事")的基本理解外,它还 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度神经网络的句子构式分析方法,其特征在于,包括以下步骤:S1、构建基于组块链的汉语构式语义表示机制;S2、根据所述汉语构式语义表示机制,构建汉语构式的标注数据集;S3、基于所述汉语构式的标注数据集训练深度神经网络模型,获得训练后的深度神经网络模型;S4、将待分析句子输入训练后的深度神经网络模型,自动分析出所述句子的构式结构。2.根据权利要求1所述的一种基于深度神经网络的句子构式分析方法,其特征在于,所述步骤S1中,所述构建基于组块链的汉语构式语义表示机制,具体包括以下步骤:S11、分析汉语构式的类型;S12、基于所述汉语构式的类型,分析所述汉语构式内部所包含的各个语义成分;S13、由所述语义成分构成线性组块链,获得表示所述汉语构式的组块链。3.根据权利要求2所述的一种基于深度神经网络的句子构式分析方法,其特征在于,所述步骤S2中,所述构建汉语构式的标注数据集,具体包括以下步骤:S21、从目标语料库中进行语料选取;S22、基于所述汉语构式的类型,并结合真实语料,构建汉语构式模板集;S23、基于所述汉语构式模板集对句子进行构式标注,获得汉语构式的标注数据集。4.根据权利要求1所述的一种基于深度神经网络的句子构式分析方法,其特征在于,所述步骤S4中,所述将待分析句子输入训练后的所述深度神经网络模型,自动分析出所述句子的构式结构,具体包括以下步骤:S41、在输入层,采用BERT模型来对输入的所述待分析句子进行编码,输出特征表示;S42、在特征层,将所述BERT模型输出的特征表示输入至BiLSTM神经网络得到神经网络特征,并结合预设组合特征拼接后输入到隐藏层,得到相应的特征表示;S43、在输出层,使用隐藏层的输出作为输入,采用Softmax计算输出所述句子的构式分析最优结果。5.根据权利要求2所述的一种基于深度神经网络的句子构式分析方法,其特征在于,所述步骤S11中,所述汉语构式的类型,包括:动补结构、双及物结构、很+名词结构、容纳结构、A是A,B是B、V来V去+VP、V+NP+V+的、存在句式、兼语句式、把字句式和被字句式。6.根据权利要求3所述的一种基于深度神经网络的句子构式分析方法,其特征在于,所述步骤S23中,所述构式标注为:一个标注实例包含一个...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。