一种数据处理方法和装置制造方法及图纸

技术编号:19778317 阅读:30 留言:0更新日期:2018-12-15 11:19
本申请公开了一种数据处理方法和装置。该方法包括:获取文本信息中的所有名词,以将所有的所述名词作为实体;确定各所述名词对应的实体类型;对所述文本信息进行分析,确定具有语法关系的所述名词对应的实体类型之间的语法关系类型,以将所述语法关系类型作为实体之间的关系,在通过上述方法后,可以获取到文本信息中实体与实体之间的关系,从而便于利用得到的实体与实体之间的关系进行后续处理。

【技术实现步骤摘要】
一种数据处理方法和装置
本申请涉及计算机领域,具体而言,涉及一种数据处理方法和装置。
技术介绍
在人工智能领域,用户在输入一个文本信息后,需要获得文本信息中的实体和实体之间的关系,以便利用该关系进行后续处理,但是目前尚未提成有效的解决方案。
技术实现思路
本申请的主要目的在于提供一种数据处理方法和装置,以解决现有技术中,无法获得文本信息中实体与实体之间关系的问题。为了实现上述目的,根据本申请的一个方面,提供了一种数据处理方法,所述方法包括:获取文本信息中的所有名词,以将所有的所述名词作为实体;确定各所述名词对应的实体类型;对所述文本信息进行分析,确定具有语法关系的所述名词对应的实体类型之间的语法关系类型,以将所述语法关系类型作为实体之间的关系。可选地,所述获取文本信息中的所有名词,包括:对所述文本信息进行句子拆分,以得到所述文本信息中的各句子;对各所述句子进行分词处理,以得到该句子中的各词语;根据指定的词性标注规则,对该句子中的各词语进行词性标注,以得到该句子中的名词。可选地,在根据指定的词性标注规则,对该句子中的各词语进行词性标注之前,所述方法还包括:对各所述句子中的指定类型的词语进行过滤;其中,所述指定类型的词语包括以下至少一种:预设的停用词、限定词、副词、比较副词和助词。可选地,所述确定各所述名词对应的实体类型,包括:使用各所述名词在各预设的不同类型的词典中进行比对;将具有相同名词的词典确定为该名词的目标词典;获取为所述目标词典配置的类型标识,以将所述类型标识作为该名词对应的实体类型。可选地,所述方法还包括:对所述实体之间的关系按照指定方式进行处理;其中,所述指定方式包括以下至少一种方式:输出所述实体之间的关系、显示所述实体之间的关系和存储所述实体之间的关系。为了实现上述目的,根据本申请的一个方面,提供了一种数据处理装置,所述装置包括:获取单元,用于获取文本信息中的所有名词,以将所有的所述名词作为实体;类型确定单元,用于确定各所述名词对应的实体类型;关系确定单元,用于对所述文本信息进行分析,确定具有语法关系的所述名词对应的实体类型之间的语法关系类型,以将所述语法关系类型作为实体之间的关系。可选地,在所述获取单元用于获取文本信息中的所有名词时,具体用于:对所述文本信息进行句子拆分,以得到所述文本信息中的各句子;对各所述句子进行分词处理,以得到该句子中的各词语;根据指定的词性标注规则,对该句子中的各词语进行词性标注,以得到该句子中的名词。可选地,所述装置还包括:过滤单元,用于在所述获取单元根据指定的词性标注规则,对该句子中的各词语进行词性标注之前,对各所述句子中的指定类型的词语进行过滤;其中,所述指定类型的词语包括以下至少一种:预设的停用词、限定词、副词、比较副词和助词。可选地,在所述类型确定单元用于确定各所述名词对应的实体类型时,具体用于:使用各所述名词在各预设的不同类型的词典中进行比对;将具有相同名词的词典确定为该名词的目标词典;获取为所述目标词典配置的类型标识,以将所述类型标识作为该名词对应的实体类型。可选地,所述装置还包括:处理单元,用于对所述实体之间的关系按照指定方式进行处理;其中,所述指定方式包括以下至少一种方式:输出所述实体之间的关系、显示所述实体之间的关系和存储所述实体之间的关系。本申请的实施例提供的技术方案可以包括以下有益效果:在本申请实施例中,先获取文本信息中的所有名词,以将所有的所述名词作为实体;再确定各所述名词对应的实体类型;然后对所述文本信息进行分析,确定具有语法关系的所述名词对应的实体类型之间的语法关系类型,以将所述语法关系类型作为实体之间的关系,在通过上述方法后,可以获取到文本信息中实体与实体之间的关系,从而便于利用得到的实体与实体之间的关系进行后续处理。附图说明构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为本申请提供的一种数据处理方法的流程示意图;图2为本申请提供的另一种数据处理方法的流程示意图;图3为本申请提供的另一种数据处理方法的流程示意图;图4为本申请提供的一种数据处理装置的结构示意图;图5为本申请提供的另一种数据处理装置的结构示意图;图6为本申请提供的另一种数据处理装置的结构示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1为本申请提供的一种数据处理方法的流程示意图,如图1所示,该方法包括以下步骤:101、获取文本信息中的所有名词,以将所有的所述名词作为实体。具体的,为了确定出一个文本信息中实体与实体之间的关系,需要确定出文本信息中包括的所有实体,而文本信息中的实体为文本信息中的名词,因此需要确定出文本信息中所有的名词,以便于根据获得的名词确定实体与实体之间的关系。需要注意的是,文本信息中的名词的获取方式根据实际需要进行设定,在此不做具体限定。当文本信息中有名词缩写时,以ID(identification,身份标识号)为例,当文本信息中出现ID后,确定出文本信息中所有的ID的缩写,以及所有的identif本文档来自技高网
...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:获取文本信息中的所有名词,以将所有的所述名词作为实体;确定各所述名词对应的实体类型;对所述文本信息进行分析,确定具有语法关系的所述名词对应的实体类型之间的语法关系类型,以将所述语法关系类型作为实体之间的关系。

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取文本信息中的所有名词,以将所有的所述名词作为实体;确定各所述名词对应的实体类型;对所述文本信息进行分析,确定具有语法关系的所述名词对应的实体类型之间的语法关系类型,以将所述语法关系类型作为实体之间的关系。2.如权利要求1所述的方法,其特征在于,所述获取文本信息中的所有名词,包括:对所述文本信息进行句子拆分,以得到所述文本信息中的各句子;对各所述句子进行分词处理,以得到该句子中的各词语;根据指定的词性标注规则,对该句子中的各词语进行词性标注,以得到该句子中的名词。3.如权利要求2所述的方法,其特征在于,在根据指定的词性标注规则,对该句子中的各词语进行词性标注之前,所述方法还包括:对各所述句子中的指定类型的词语进行过滤;其中,所述指定类型的词语包括以下至少一种:预设的停用词、限定词、副词、比较副词和助词。4.如权利要求1所述的方法,其特征在于,所述确定各所述名词对应的实体类型,包括:使用各所述名词在各预设的不同类型的词典中进行比对;将具有相同名词的词典确定为该名词的目标词典;获取为所述目标词典配置的类型标识,以将所述类型标识作为该名词对应的实体类型。5.如权利要求1所述的方法,其特征在于,所述方法还包括:对所述实体之间的关系按照指定方式进行处理;其中,所述指定方式包括以下至少一种方式:输出所述实体之间的关系、显示所述实体之间的关系和存储所述实体之间的关系。6.一种数据处理装置,其特征在于,所述装置包括:获取单元,用于获取文...

【专利技术属性】
技术研发人员:桂洪冠纪达麒陈运文
申请(专利权)人:达而观信息科技上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1