依存关系分类方法及相关设备技术

技术编号:26599415 阅读:23 留言:0更新日期:2020-12-04 21:22
本发明专利技术涉及人工智能技术领域,提供一种依存关系分类方法及相关设备。所述依存关系分类方法通过分词层对语句样本进行分词;通过词编码层根据语句样本的特征向量序列计算多个词语样本的词向量;通过感知层根据多个词语样本的词向量确定多个词语样本的核心词向量和依存词向量;通过仿射分类层根据任意两个词语样本的核心词向量和依存词向量对任意两个词语样本的依存关系进行分类;根据任意两个词语样本的依存关系分类结果和任意两个词语样本在语句样本中的依存关系标签对分类模型进行训练;通过训练后的分类模型对目标语句进行词语依存关系分类。本发明专利技术提升分类的准确性。此外,本发明专利技术还涉及区块链技术,分类结果可存储于区块链中。

【技术实现步骤摘要】
依存关系分类方法及相关设备
本专利技术涉及人工智能
,具体涉及一种依存关系分类方法、装置、计算机设备及计算机可读存储介质。
技术介绍
依存关系分类是自然语言处理过程中的一类关键技术。依存关系分类的准确性将影响自然语言处理的准确性。依存关系分类常存在分类不准确的问题。如何提升依存关系分类的准确性成为待解决的问题。
技术实现思路
鉴于以上内容,有必要提出一种依存关系分类方法、装置、计算机设备及计算机可读存储介质,其可以对目标语句进行词语依存关系分类,提升分类的准确性。本申请的第一方面提供一种依存关系分类方法,所述依存关系分类方法包括:获取语句样本、目标语句和分类模型,所述分类模型包括BERT层、字编码层、分词层、词编码层、感知层和仿射分类层;通过所述BERT层生成所述语句样本的第一字向量序列;通过所述分词层对所述语句样本进行分词,得到所述语句样本的多个词语样本;通过所述字编码层对所述语句样本进行编码,得到所述语句样本的第二字向量序列和第三字向量序列;>通过所述词编码层根本文档来自技高网...

【技术保护点】
1.一种依存关系分类方法,其特征在于,所述依存关系分类方法包括:/n获取语句样本、目标语句和分类模型,所述分类模型包括BERT层、字编码层、分词层、词编码层、感知层和仿射分类层;/n通过所述BERT层生成所述语句样本的第一字向量序列;/n通过所述分词层对所述语句样本进行分词,得到所述语句样本的多个词语样本;/n通过所述字编码层对所述语句样本进行编码,得到所述语句样本的第二字向量序列和第三字向量序列;/n通过所述词编码层根据所述语句样本的第一字向量序列、第二字向量序列、第三字向量序列计算所述多个词语样本的词向量;/n通过所述感知层根据所述多个词语样本的词向量确定所述多个词语样本的核心词向量和依存...

【技术特征摘要】
1.一种依存关系分类方法,其特征在于,所述依存关系分类方法包括:
获取语句样本、目标语句和分类模型,所述分类模型包括BERT层、字编码层、分词层、词编码层、感知层和仿射分类层;
通过所述BERT层生成所述语句样本的第一字向量序列;
通过所述分词层对所述语句样本进行分词,得到所述语句样本的多个词语样本;
通过所述字编码层对所述语句样本进行编码,得到所述语句样本的第二字向量序列和第三字向量序列;
通过所述词编码层根据所述语句样本的第一字向量序列、第二字向量序列、第三字向量序列计算所述多个词语样本的词向量;
通过所述感知层根据所述多个词语样本的词向量确定所述多个词语样本的核心词向量和依存词向量;
通过所述仿射分类层根据任意两个词语样本的核心词向量和依存词向量对所述任意两个词语样本的依存关系进行分类;
根据所述任意两个词语样本的依存关系分类结果和所述任意两个词语样本在所述语句样本中的依存关系标签对所述分类模型进行训练,得到训练后的分类模型;
通过所述训练后的分类模型对所述目标语句进行词语依存关系分类。


2.如权利要求1所述的依存关系分类方法,其特征在于,所述通过所述字编码层对所述语句样本进行编码包括:
对于所述语句样本中的每个字样本,获取所述字样本的位置信息和类型信息;
通过所述字编码层的第一字编码子层对所述字样本的位置信息进行编码,得到所述字样本的第二字向量;
依字序组合所述语句样本中的多个字样本的第二字向量,得到所述语句样本第二字向量序列;
通过所述字编码层的第二字编码子层对所述字样本的类型信息进行编码,得到所述字样本的第三字向量;
依字序组合所述语句样本中的多个字样本的第三字向量,得到所述语句样本第三字向量序列。


3.如权利要求1所述的依存关系分类方法,其特征在于,所述通过所述词编码层根据所述语句样本的第一字向量序列、第二字向量序列、第三字向量序列计算所述多个词语样本的词向量包括:
对于所述多个词语样本中的每个词语样本,确定组成所述词语样本的多个目标字样本;
对于每个目标字样本,根据所述目标字样本的第一字向量、第二字向量、第三字向量生成所述目标字样本的特征向量;
根据所述多个目标字样本的特征向量计算所述词语样本的词向量。


4.如权利要求3所述的依存关系分类方法,其特征在于,所述根据所述目标字样本的第一字向量、第二字向量、第三字向量生成所述目标字样本的特征向量包括:
连接所述目标字样本的第一字向量、第二字向量、第三字向量,得到所述目标字样本的特征向量;或
计算所述目标字样本的第一字向量、第二字向量和第三字向量的第一均值向量,将所述第一均值向量确定为所述目标字样本的特征向量。


5.如权利要求3所述的依存关系分类方法,其特征在于,所述根据所述多个目标字样本的特征向量计算所述词语样本的词向量包括:
计算...

【专利技术属性】
技术研发人员:马旭强郝正鸿王少军
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1