【技术实现步骤摘要】
知识图谱的生成方法及装置
本申请涉及数据处理领域,具体而言,涉及一种知识图谱的生成方法及装置。
技术介绍
搜索引擎采用关键词直接搜索、语义搜索、语境搜索等。一些搜索引擎也会根据关键词推荐与该关键词相关的多个搜索项,也会采用热门推荐的形式。显然,无论是以上哪种搜索形式,都需要建立在输入的关键词和搜索项的指向关系,最终获取知识图谱的基础上。但是,无论哪种搜索引擎在建立知识图谱时,并未考虑自然语言和计算机语言的结合,尤其是对于计算机语言的知识图谱建立,仍然处于空白,导致搜索引擎在面对计算机语言时,无法作出正确的指向性推荐,不利于精确搜索。针对相关技术中计算机语言的知识图谱建立仍然处于空白,导致搜索引擎在面对计算机语言时,无法作出正确的指向性推荐,不利于指向性搜索的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请的主要目的在于提供一种知识图谱的生成方法及装置,以解决计算机语言的知识图谱建立仍然处于空白,导致搜索引擎在面对计算机语言时,无法作出正确的指向性推荐,不利于精确搜索的问题。为了实现上述目的,根据本申请的一个方面,提供了一种知识图谱的生成方法。根据本申请的知识图 ...
【技术保护点】
1.一种知识图谱的生成方法,其特征在于,包括:获取文本数据;将所述文本数据中的计算机语言源码符合文法符号的识别为实体,得到实体集;分析所述计算机语言源码,并确定所述实体集中的实体间的指向关系;以及,根据所述实体集和所述指向关系生成知识图谱。
【技术特征摘要】
1.一种知识图谱的生成方法,其特征在于,包括:获取文本数据;将所述文本数据中的计算机语言源码符合文法符号的识别为实体,得到实体集;分析所述计算机语言源码,并确定所述实体集中的实体间的指向关系;以及,根据所述实体集和所述指向关系生成知识图谱。2.根据权利要求1所述的知识图谱的生成方法,其特征在于,获取文本数据之后还包括:采用依赖树和词性标注对所述文本数据的语料文本进行从上至下迭代分析,得到语法关系三元组;通过主题建模对语法关系三元组做实体检测;将检测到的实体加入所述实体集。3.根据权利要求1所述的知识图谱的生成方法,其特征在于,获取文本数据之后还包括:对所述文本数据的语料文本依次进行消除噪音、词汇规范化、对象标准化的处理;采用依赖树和词性标注对处理后的所述文本数据进行从上至下迭代分析,得到语法关系三元组;通过主题建模对语法关系三元组做实体检测;将检测到的实体加入所述实体集。4.根据权利要求1所述的知识图谱的生成方法,其特征在于,获取文本数据之后还包括:提取所述文本数据的语言文本的语法规范中的语言符号;将所述语言符号加入所述实体集。5.根据权利要求1所述的知识图谱的生成方法,其特征在于,将所述文本数据中的计算机语言源码符合文法符号的识别为实体,得到实体集包括:识别所述文本数据中的计算机语言源码中的标识符是否符合符号表中规定的文法符号;如果是,则将所述标识符识别为实体;将识别为实体的标识符加入实体集。6.根据权利要求2或3所...
【专利技术属性】
技术研发人员:李昀,
申请(专利权)人:长沙知了信息科技有限公司,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。