一种成分句法分析方法、装置、设备及介质制造方法及图纸

技术编号:26651005 阅读:23 留言:0更新日期:2020-12-09 00:51
本发明专利技术提供一种成分句法分析方法、装置、设备及介质,所述的方法包括:包括:原始文本进行编码处理获取映射编码,并从所述映射编码中获取一种或者多种候选短语片段;对所述候选短语片段进行成分句法处理获取成分句法树,所述成分句法树的每个节点至少承载一个所述候选短语片段。将原始文本进行编码处理获取映射编码,并获取候选短语片段,该候选短语片段的形式包括一种或者多种,通过任意截取映射编码获取候选短语片段,判断候选短语片段是否为有成分,获取成分句法树,从而实现成分句法分析,避免截取每个字(或单词)或者字符需要相互独立预测,进而避免产生合并短语出现矛盾的问题。

【技术实现步骤摘要】
一种成分句法分析方法、装置、设备及介质
本专利技术涉及人工智能技术,特别是涉及一种成分句法分析方法、装置、设备及介质。
技术介绍
随着人工智能的发展,尤其是人机交互需求的日益增长,需要将人与计算机之间进行通信和信息交互,一般地,通过自然语言处理技术来实现人机交互。自然语言处理可以通过成分句法分析的方式分析出句子的短语结构句法树,可以广泛应用到各类自然语言处理的下游任务中。目前,成分句法分析中每个字(或单词)的预测相互独立,在合并短语中会出现相邻字(或单词)的预测位置与成分相矛盾的情况,进而成分句法分析的准确率较低。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种成分句法分析方法、装置、设备及介质,用于解决现有技术中成分句法分析的准确率较低的问题。为实现上述目的及其他相关目的,本专利技术提供一种成分句法分析方法,包括:原始文本进行编码处理获取映射编码,并从所述映射编码中获取一种或者多种候选短语片段;对所述候选短语片段进行成分句法处理获取成分句法树,所述成分句法树的每个节点至少承载一个所述候选短语本文档来自技高网...

【技术保护点】
1.一种成分句法分析方法,其特征在于,包括:/n对原始文本进行编码处理获取映射编码,并从所述映射编码中获取一种或者多种候选短语片段;/n对所述候选短语片段进行成分句法处理获取成分句法树,所述成分句法树的每个节点至少承载一个所述候选短语片段。/n

【技术特征摘要】
1.一种成分句法分析方法,其特征在于,包括:
对原始文本进行编码处理获取映射编码,并从所述映射编码中获取一种或者多种候选短语片段;
对所述候选短语片段进行成分句法处理获取成分句法树,所述成分句法树的每个节点至少承载一个所述候选短语片段。


2.根据权利要求1所述的成分句法分析方法,其特征在于,从所述映射编码中获取一种或者多种候选短语片段的步骤包括:
通过所述映射编码内的起始位和终止位来获取一种或者多种所述候选短语片段。


3.根据权利要求1或者2所述的成分句法分析方法,其特征在于,从所述映射编码中获取一种或者多种候选短语片段的步骤还包括:
设定编码长度阈值,从所述映射编码中获取小于或者等于所述编码长度阈值的候选短语片段。


4.根据权利要求1所述的成分句法分析方法,其特征在于,对所述候选短语片段进行成分句法处理获取成分句法树的步骤包括神经网络处理,所述神经网络处理包括:获取所述候选短语片段所对应的候选短语序列张量,将所述候选短语序列张量输入卷积神经网络或者循环神经网络中进行处理,获取候选短语向量。


5.根据权利要求4所述的成分句法分析方法,其特征在于,对所述候选短语片段进行成分句法处理获取成分句法树的步骤包括成分二分处理,所述成分二分处理的步骤包括:
将各个所述候选短语向量输入到二分分类器中,得到所述候选短语向量具有成分的概率;
设定概率阈值,并将低于所述概率阈值的候选短语向量进行过滤。


6.根据权利要求4或者5所述的成分句法分析方法,其特征在于,对所述候选短语片段进行成分句法处理获取成分句法树的步骤包括成分分类处理,所述成分分类处理的步骤包括:
将所述候选短语向量输入到成分分类器中,得到分类标签,所述分类标签包括无成分标签、成分标签,过滤所述无成分标签。


7.根据权利要求6所述的成分句法分析方法,其特征在于,通过所述成分标签对应的短语成分确定所述原始文本的成分句法树;所述候选短语片段是一个或多个字符。


8.一种成分句法分析装置,其特征在于,包括:
编码模块,用于...

【专利技术属性】
技术研发人员:姚志强周曦袁哲郝东温喆
申请(专利权)人:恒睿重庆人工智能技术研究院有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1