依赖关系的检测方法、装置及设备制造方法及图纸

技术编号:31023272 阅读:28 留言:0更新日期:2021-11-30 03:18
本申请提供一种依赖关系的检测方法、装置及设备,该方法包括:基于语句训练数据获取目标训练词语,确定目标训练词语的目标词性,确定目标训练词语与关联训练词语之间的目标依赖关系;确定目标训练词语中每个字的字向量,基于目标训练词语中所有字的字向量之和确定目标训练词语对应的训练词语特征;确定目标词性对应的训练词性特征,确定目标依赖关系对应的训练依赖特征;基于训练词语特征、训练词性特征和训练依赖特征,构建出目标训练特征,基于目标训练特征对初始依存文法模型进行训练,得到已完成训练的目标依存文法模型。通过本申请的技术方案,目标依存文法模型的检测准确率较高,训练后的目标依存文法模型比较小,提高训练准确率。训练准确率。训练准确率。

【技术实现步骤摘要】
依赖关系的检测方法、装置及设备


[0001]本申请涉及人工智能
,尤其是涉及一种依赖关系的检测方法、装置及设备。

技术介绍

[0002]机器学习是实现人工智能的一种途径,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习用于研究计算机如何模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习更加注重算法设计,使计算机能够自动地从数据中学习规律,并利用规律对未知数据进行预测。机器学习已经有了十分广泛的应用,如深度学习、数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、语音和手写识别等等。
[0003]在机器学习技术中,能够使机器理解自然语言是实现人工智能的基础,而为了使机器理解自然语言,在自然语言处理技术中通常会进行句法分析,句法分析对整个句子的理解起到关键性作用,句法分析是指对句子中的词语和语法进行分析。其中,依存文法分析是句法分析的一种主要实现方式,由于结构清晰、易于理解和标注、并且能够捕捉到词语之间的远距离搭配或修饰关本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种依赖关系的检测方法,其特征在于,所述方法包括:获取语句训练数据,所述语句训练数据包括多个训练词语、每个训练词语的词性、至少一个训练组的依赖关系,所述训练组包括两个训练词语;基于所述语句训练数据,获取目标训练词语,确定所述目标训练词语的目标词性,并确定所述目标训练词语与关联训练词语之间的目标依赖关系;确定所述目标训练词语中每个字的字向量,基于所述目标训练词语中所有字的字向量之和,确定所述目标训练词语对应的训练词语特征;以及,确定所述目标词性对应的训练词性特征,确定所述目标依赖关系对应的训练依赖特征;基于所述训练词语特征、所述训练词性特征和所述训练依赖特征,构建出目标训练特征,并基于所述目标训练特征对已配置的初始依存文法模型进行训练,得到已完成训练的目标依存文法模型;其中,所述目标依存文法模型用于检测语句检测数据内的各检测词语之间的依赖关系。2.根据权利要求1所述的方法,其特征在于,所述基于所述目标训练词语中所有字的字向量之和,确定所述目标训练词语对应的训练词语特征,包括:基于所述目标训练词语中所有字的字向量之和,确定所有字的字向量平均值,并基于所述字向量平均值确定所述目标训练词语对应的训练词语特征。3.根据权利要求1所述的方法,其特征在于,所述确定所述目标词性对应的训练词性特征,确定所述目标依赖关系对应的训练依赖特征,包括:通过所述目标词性查询词性映射表,得到与所述目标词性对应的训练词性特征;以及,通过所述目标依赖关系查询依赖关系映射表,得到与所述目标依赖关系对应的训练依赖特征;其中,所述词性映射表包括词性与词性特征的对应关系,所述依赖关系映射表包括依赖关系与依赖特征的对应关系。4.根据权利要求1所述的方法,其特征在于,所述基于所述语句训练数据,获取目标训练词语,包括:采用基于转移的语义依存分析方法,将所述语句训练数据切分为多个动作序列,动作序列包括转移动作和配置数据,所述配置数据包括堆栈数据、序列数据和依存结果;其中,所述序列数据用于存储所述语句训练数据中的多个训练词语,所述堆栈数据用于存储从所述序列数据中取出的训练词语,所述依存结果用于存储所述堆栈数据中的训练词语之间的依赖关系;从所述堆栈数据中选取K1个训练词语作为目标训练词语,从所述序列数据中选取K2个训练词语作为目标训练词语;所述确定所述目标训练词语与关联训练词语之间的目标依赖关系,包括:基于所述配置数据中的所述依存结果中已存储的训练词语之间的依赖关系,确定所述目标训练词语与关联训练词语之间的目标依赖关系。5.根据权利要求1所述的方法,其特征在于,基于所述目标训练特征对已配置的初始依存文法模型进行训练,得到已完成训练的目标依存文法模型包括:将所述目标训练特征输入给初始依存文法模型,由所述初始依存文法模型采用立方函数对所述目标训练特征进行处理,得到目标特征值;基于所述目标特征值对所述初始依存文法模型进行调整,得到调整后的依存文法模型,并确定所述调整后的依存文法模型是否已收敛;如果否,则将所述调整后的依存文法模型作为初始依存文法模型,并返回执行将所述
目标训练特征输入给初始依存文法模型的操作;如果是,则将所述调整后的依存文法模型作为目标依存文法模型。6.一种依赖关系的检测方法,其特征在于,所述方法包括:获取语句检测数据,所述语句检测数据包括多个检测词语、每个检测词语的词性;基于所述语句检测数据,获取目标检测词语,确定所述目标检测词语的目标词性,确定所述目标检测词语与关联检测词语之间的目标依赖关系;确定所述目标检测词语中每个字的字向量,基于所述目标检测词语中所有字的字向量之和,确定所述目标检测词语对应的检测词语特征;以及,确定所述目标词性对应的检测词性特征,确定所述目标依赖关系对应的检测依赖特征;基于所述检测词语特征、所述检测词性特征和所述检测依赖特征,构建出目标检测特征,并将所述目标检测特征输入给已完成训练的目标依存文法模型,得到所述语句检测数据内的两个检测词语之间的依赖关系。7.根据权利要求6所述的方法,其特征在于,所述基于所述目标检测词语中所有字的字向量之和,确定所述目标检测词语对应的检测词语特征,包括:基于所述目标检测词语中所有字的字向量之和,确定所有字的字向量平均值,并基于所述字向量平均值确定所述目标检测词语对应的检测词语特征。8.根据权利要求6所述的方法,其特征在于,所述确定所述目标词性对应的检测词性特征,确定所述目标依赖关系对应的检测依赖特征,包括:通过所述目标词性查询词性映射表,得到与所述目标词性对应的检测词性特征;以及,通过所述目标依赖关系查询依赖关系映射表,得到与所述目标依赖关系对应的检测依赖特征;其中,所述词性映射表包括词性与词性特征的对应关系,所述依赖关系映射表包括依赖关系与依赖特征的对应关系。9.根据权利要求6所述的方法,其特征在于,所述基于所述语句检测数据,获取目标检测词语,包括:采用基于转移的语义依存分析方法,将所...

【专利技术属性】
技术研发人员:刘万青
申请(专利权)人:新华三大数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1