一种关键词存储方法及装置制造方法及图纸

技术编号:18138481 阅读:33 留言:0更新日期:2018-06-06 11:51
本发明专利技术公开一种关键词存储方法及装置,该方法包括:对关键词数据库中的关键词进行切词处理,得到各个关键词的分词;将各个关键词的分词分别与预先建立的关系实体集合中的各个节点实体进行匹配,其中,所述关系实体集合中包括由具有特定关系的节点实体构成的图结构;利用匹配成功的分词构建图结构,其中,所述匹配成功的分词作为所述图结构的节点信息进行存储,各个分词之间具有的所述特定关系作为所述图结构的边进行存储;将所述图结构存储于图数据库中,以供用户进行查询。本发明专利技术利用图数据库对关键词进行存储,能够提高对关键词的查询效率。

【技术实现步骤摘要】
一种关键词存储方法及装置
本专利技术涉及数据处理领域,具体涉及一种关键词存储方法及装置。
技术介绍
目前,关键词数据库只能支持用户通过字符串的包含关系一个一个的筛选,例如存在分析“华为P8”与“华为P9”哪个表现好的业务需求时,系统需要从关键词数据库中一个一个的筛选匹配,从而查询到包含有“华为P8”或“华为P9”的关键词。可见,基于现有技术中关键词的存储方式,对关键词进行查询的方法效率较低。
技术实现思路
鉴于上述问题,本专利技术提供了一种关键词存储方法及装置,基于本专利技术提供的关键词存储方法对关键词进行查询,能够提高对关键词的查询效率。本专利技术提供了一种关键词存储方法,所述方法包括:对关键词数据库中的关键词进行切词处理,得到各个关键词的分词;将各个关键词的分词分别与预先建立的关系实体集合中的各个节点实体进行匹配,其中,所述关系实体集合中包括由具有特定关系的节点实体构成的图结构;利用匹配成功的分词构建图结构,其中,所述匹配成功的分词作为所述图结构的节点信息进行存储,各个分词之间具有的所述特定关系作为所述图结构的边进行存储;将所述图结构存储于图数据库中,以供用户进行查询。优选地,所述将各个关键词的分词分别与预先建立的关系实体集合中的各个节点实体进行匹配之前,还包括:利用网络爬虫爬取网页内容,并从所述网页内容中提取具有特定关系的数据信息,构成关系实体集合。优选地,所述方法还包括:以预设频率更新所述关系实体集合。优选地,所述方法还包括:接收用户的数据分析需求,并根据所述数据分析需求在所述图数据库中查询目标关键词,所述数据分析需求为关键词文本或关键词图结构。优选地,所述根据所述数据分析需求在所述图数据库中查询目标关键词,包括:当所述数据分析需求为关键词文本时,将所述数据分析需求进行切词处理,得到查询目标;根据所述查询目标,在所述图数据库中查询目标关键词;或者,当所述数据分析需求为关键词图结构时,从所述关键词图结构中提取查询目标;根据所述查询目标,在所述图数据库中查询目标关键词。优选地,所述方法还包括:根据所述目标关键词,在关键词指标数据库中查询所述目标关键词的指标数据,以供用户进行数据分析。本专利技术还提供了一种关键词存储装置,所述装置包括:切词模块,用于对关键词数据库中的关键词进行切词处理,得到各个关键词的分词;匹配模块,用于将各个关键词的分词分别与预先建立的关系实体集合中的各个节点实体进行匹配,其中,所述关系实体集合中包括由具有特定关系的节点实体构成的图结构;构建模块,用于利用匹配成功的分词构建图结构,其中,所述匹配成功的分词作为所述图结构的节点信息进行存储,各个分词之间具有的所述特定关系作为所述图结构的边进行存储;存储模块,用于将所述图结构存储于图数据库中,以供用户进行查询。优选地,所述装置还包括:提取模块,用于利用网络爬虫爬取网页内容,并从所述网页内容中提取具有特定关系的数据信息,构成关系实体集合。优选地,所述装置还包括:更新模块,用于以预设频率更新所述关系实体集合。优选地,所述装置还包括:查询模块,用于接收用户的数据分析需求,并根据所述数据分析需求在所述图数据库中查询目标关键词,所述数据分析需求为关键词文本或关键词图结构。优选地,所述查询模块,包括:第一查询子模块,用于当所述数据分析需求为关键词文本时,将所述数据分析需求进行切词处理,得到查询目标;根据所述查询目标,在所述图数据库中查询目标关键词;或者,第二查询子模块,用于当所述数据分析需求为关键词图结构时,从所述关键词图结构中提取查询目标;根据所述查询目标,在所述图数据库中查询目标关键词。优选地,所述装置还包括:分析模块,用于根据所述目标关键词,在关键词指标数据库中查询所述目标关键词的指标数据,以供用户进行数据分析。借由上述技术方案,本专利技术提供的关键词存储方法中,首先,对关键词数据库中的关键词进行切词处理,得到各个关键词的分词。其次,将各个关键词的分词分别与预先建立的关系实体集合中的各个节点实体进行匹配,其中,所述关系实体集合中包括由具有特定关系的节点实体构成的图结构。再次,利用匹配成功的分词构建图结构,其中,所述匹配成功的分词作为所述图结构的节点信息进行存储,各个分词之间具有的所述特定关系作为所述图结构的边进行存储。最后,将所述图结构存储于图数据库中,以供用户进行查询。本专利技术利用图数据库对关键词进行存储,能够提高对关键词的查询效率,进而提高SEM从业者对关键词的分析效率。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例提供的一种关键词存储方法流程图;图2示出了本专利技术实施例提供的一种关系实体集合中的图结构示意图;图3示出了本专利技术实施例提供的一种关键词存储装置结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。以下进行实施例具体内容的介绍。本专利技术实施例提供了一种关键词存储方法,参考图1,为本专利技术提供的一种关键词存储方法流程图。所述关键词存储方法具体包括:S101:对关键词数据库中的关键词进行切词处理,得到各个关键词的分词。本专利技术实施例中,关键词数据库用于存储关键词,但是,由于所述关键词数据库对关键词的存储方式,使得关键词数据库只支持系统通过字符串的包含关系一个一个筛选出数据分析需求的目标关键词。所以,本专利技术实施例需要对所述关键词数据库中的关键词进行处理,使得关键词的存储方式能够支持对数据分析需求的目标关键词查询效率更高。实际应用中,由于所述关键词数据库中的关键词是以文本的形式进行存储的,如关键词“苹果iphone6”,本专利技术实施例首先将所述关键词数据库中的各个关键词进行切词处理,得到各个关键词的分词。例如,可以将关键词“苹果iphone6”切分为“苹果”和“iphone6”。S102:将各个关键词的分词分别与预先建立的关系实体集合中的各个节点实体进行匹配,其中,所述关系实体集合中包括由具有特定关系的节点实体构成的图结构。本专利技术实施例中,预先建立关系实体集合,其中,所述关系实体集合为图结构的集合,各个图结构由具有特定关系的节点实体构成,所述节点实体可以为词根。如图2所示,为本专利技术实施例提供的一种关系实体集合中的图结构示意图。其中,图结构的各个节点实体之间具有特定关系,如节点实体“苹果”与“iphone6”之间是品牌与型号的特定关系。实际应用中,可以利用网络爬虫爬取网页内容,并从爬取到的网页内容中提取具有特定关系的数据信息,构成关系实体集合。例如,可以通过爬取电商网站的商品目录页面,获取到如图2所示的图结构,进而得到关系实体集合。由于关系实体集合中的数据本文档来自技高网...
一种关键词存储方法及装置

【技术保护点】
一种关键词存储方法,其特征在于,所述方法包括:对关键词数据库中的关键词进行切词处理,得到各个关键词的分词;将各个关键词的分词分别与预先建立的关系实体集合中的各个节点实体进行匹配,其中,所述关系实体集合中包括由具有特定关系的节点实体构成的图结构;利用匹配成功的分词构建图结构,其中,所述匹配成功的分词作为所述图结构的节点信息进行存储,各个分词之间具有的所述特定关系作为所述图结构的边进行存储;将所述图结构存储于图数据库中,以供用户进行查询。

【技术特征摘要】
1.一种关键词存储方法,其特征在于,所述方法包括:对关键词数据库中的关键词进行切词处理,得到各个关键词的分词;将各个关键词的分词分别与预先建立的关系实体集合中的各个节点实体进行匹配,其中,所述关系实体集合中包括由具有特定关系的节点实体构成的图结构;利用匹配成功的分词构建图结构,其中,所述匹配成功的分词作为所述图结构的节点信息进行存储,各个分词之间具有的所述特定关系作为所述图结构的边进行存储;将所述图结构存储于图数据库中,以供用户进行查询。2.根据权利要求1所述的关键词存储方法,其特征在于,所述将各个关键词的分词分别与预先建立的关系实体集合中的各个节点实体进行匹配之前,还包括:利用网络爬虫爬取网页内容,并从所述网页内容中提取具有特定关系的数据信息,构成关系实体集合。3.根据权利要求2所述的关键词的存储方法,其特征在于,所述方法还包括:以预设频率更新所述关系实体集合。4.根据权利要求1所述的关键词存储方法,其特征在于,所述方法还包括:接收用户的数据分析需求,并根据所述数据分析需求在所述图数据库中查询目标关键词,所述数据分析需求为关键词文本或关键词图结构。5.根据权利要求4所述的关键词存储方法,其特征在于,所述根据所述数据分析需求在所述图数据库中查询目标关键词,包括:当所述数据分析需求为关键词文本时,将所述数据分析需求进行切词处理,得到查询目标;根据所述查询目标,在所述图数据库中查询目标关键词;或者,当所述数据分析需求为关键词图结构时,从所述关键词图结构中提取查询目标;根据所述查询目标,在所述图数据库中查询目标关键词。6.根据权利要求4所述的关键词存储方法,其特征在于,所述方法还包括:根据所述目标关键词,在关键词指标数据库中查询所述目标关键词的指标数据,以供用户进行数据分析。7.一种关键词存储装置...

【专利技术属性】
技术研发人员:王天祎
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1