当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于知识图谱的食物成分和营养健康的关联性分析方法及系统技术方案

技术编号:26259393 阅读:24 留言:0更新日期:2020-11-06 17:53
本发明专利技术公开了一种基于知识图谱的食物成分和营养健康的关联性分析方法及系统,采取爬虫工具和知识图谱相结合的方法,通过精准采取的数据绘制所需知识图谱来直观简便的探索其关联性,根据研究对象的性质和研究的需求确定数据层和模式层,利用知识图谱工具进行数据处理后提取出关系和实体,得到的知识图谱,根据研究对象创建模式层数据层,得到的概念属性关系明确,可视化程度高,结果易读,知识图谱的网络结构简单清晰明了的揭示了研究对象间的关联性,对于对象的共性与差异也一目了然。

【技术实现步骤摘要】
一种基于知识图谱的食物成分和营养健康的关联性分析方法及系统
本专利技术涉及食品安全
,具体涉及一种基于知识图谱的食物成分和营养健康的关联性分析方法及系统。
技术介绍
在日常生活中,为了达到健康生活的目的,人们就不得不谈及到食品安全,食品安全的重要性不言而喻,好的食物能让人们保持良好的健康状态,而人们良好的营养和健康状态更是人类经济发展的前提,同样也是社会经济发展的前提。没有好的食物,人们健康不仅会受到损害,从宏观来看,社会也得不到发展。质量糟糕的食物往往会让人们有一番“痛苦的经历”,“病从口入”,差的食物不仅让人们饱受身体病痛的折磨,甚至也会引起心理的不舒畅。因此,在如今的社会中,想要让人类社会持续健康发展,食品安全的保障便是重中之重。在科学知识领域,我们也取得了各方各面的长足进步。在大数据时代,如何有效地管理并运用海量的数据,如何构建规模庞大,质量还高的知识库是众多科研人员津津乐道的话题。而知识图谱就完美的解决了这个问题。举个例子,我国的辞海是由上万名专家花了十数载编撰而成,然而辞海所拥有的词条不过仅仅十几万条,再看看现在随便一个互联网上的知识图谱例如Dbpedia,轻轻松松就拥有上千万的实体。另一方面,知识图谱作为实现机器认知智能的基础,可以帮助机器实现理解与解释两大过程。使用效率之高,涉及领域之广泛等等优良特点都使得知识图谱在现实如今的学术研究中的地位越来越重要。本申请专利技术人在实施本专利技术的过程中,发现现有技术的方法,至少存在如下技术问题:但在我国国内,虽然针对食品安全的研究数不胜数,结合知识图谱的研究较少,且知识图谱多用于食品安全问题研究趋势的文献研究法或问答系统的构建,少有利用知识图谱来分析食物和健康症状关联的研究。现有技术中的研究方法大多具有复杂定位不精确缺点,因此导致分析效果不佳。
技术实现思路
本专利技术提供了一种基于知识图谱的食物成分和营养健康的关联性分析方法及系统。用以解决现有技术中关联系性分析效果不佳的技术问题。为了解决上述技术问题,本专利技术第一方面提供了一种基于知识图谱的食物成分和营养健康的关联性分析方法,包括:S1:在模式层对实体-关系-实体的三元组成的知识数据库进行定义,其中三元组用以描述现实世界中的实体和关系;S2:获取待分析的食品数据,并对获取的待分析的食品数据进行后处理;S3:根据模式层对知识数据库的定义,从获取的待分析的食品数据中逐一提取出实体和对应关系;S4:利用共消指解的方法进行知识融合,将同名的实体概念进行融合,得到最终知识图谱,作为关联性分析结果。在一种实施方式中,S1中实体包括但不限于食物种类、食物名称、成分和症状。在一种实施方式中,S2具体包括:S2.1:利用爬虫工具,对目标网站进行所需数据的批量爬取,得到待分析的食品数据;S2.2:对待分析的食品数据进行格式转换,转换为知识图谱可处理的格式。在一种实施方式中,S3具体包括:S3.1:利用知识图谱工具创建一个项目;S3.2:将后处理后的数据进行上传,并构建概念体系;S3.3:根据概念体系,确定实体的属性值和实体之间关系的属性值;S3.4:对上传的数据按照模式层定义的三元组进行文档标注,并构建与上传的数据相应的三元组,三元组包括实体和对应关系,根据三元组创建知识图谱。在一种实施方式中,S4中食品的成分和食品的类别既属于食品的属性,又被作为一项单独实体与食品并列分析。在一种实施方式中,最终的分析结果中成分属性与健康症状直接关联。基于同样的专利技术构思,本专利技术第二方面提供了一种基于知识图谱的食物成分和营养健康的关联性分析系统,包括:数据结构定义模块,用于在模式层对实体-关系-实体的三元组成的知识数据库进行定义,其中三元组用以描述现实世界中的实体和关系;数据获取模块,用于获取待分析的食品数据,并对获取的待分析的食品数据进行后处理;提取模块,用于根据模式层对知识数据库的定义,从获取的待分析的食品数据中逐一提取出实体和对应关系;融合模块,用于利用共消指解的方法进行知识融合,将同名的实体概念进行融合,得到最终知识图谱,作为关联性分析结果。本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:本专利技术提供了一种基于知识图谱的食物成分和营养健康的关联性分析方法,首先在模式层进行知识数据库的定义,然后获取待分析的数据并进行后处理,接着,提取出实体和对应关系,再利用共消指解的方法进行知识融合,将同名的实体概念进行融合,得到最终知识图谱,作为关联性分析结果。利用爬虫对所研究对象的数据进行爬取后,再利用知识图谱进行处理,将二者工具相结合,可做到对研究对象的进准定位,对研究知识的精准度较高,不会有一些无用操作,也不会有过多的一些无用重复数据。进一步地,根据研究对象的性质和研究的需求确定数据层和模式层,利用知识图谱工具进行数据处理后提取出关系和实体,得到的知识图谱,得到的概念属性关系明确,可视化程度高,结果易读,知识图谱的网络结构简单清晰明了的揭示了研究对象间的关联性,对于对象的共性与差异也一目了然。进一步地,由于知识图谱的结构沿用了图论算法,数据的检索和查询沿用了图遍历算法,相比传统检索方式效率大大提高,对于大批量数据的存储和展示更具有优势。进一步地,由于知识图谱的可更新性,利用此方法研究的对象可以进行保存更新,当某些新数据被发现或者旧数据被纠正可以直接进行更新,可以保障此方法研究问题的生存周期,不会因为数据更新而从头开始研究,工作量大大减少。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的一种基于知识图谱探究营养健康与食物成分属性关联性的方法的技术框图;图2为本专利技术实施例中养生网站食物样例图;图3为本专利技术实施例中数据爬取定义规则图;图4为本专利技术实施例中数据爬取后的示意图;图5为本专利技术实施例中属性的创建以及编辑图;图6为本专利技术实施例中资源标注主界面示意图;图7为本专利技术实施例中三元组的建立示意图;图8为本专利技术实施例中知识融合界面示意图;图9为本专利技术实施例中知识图谱局部展示图;图10为本专利技术实施例中知识图谱全体与局部展示图。具体实施方式本专利技术主要是基于食品领域提出的一种基于知识图谱探究营养健康与食物成分属性关联性的方法,本专利技术考虑了传统方法准确度不够高、效率较低、可读性不强和过程较为复杂的缺点,提出更清晰明了的研究方法。通过本专利技术得出的结果更加直白,更加清晰明了。本专利技术基于知识图谱的基础上对安全领域进行研究,从广泛知识图谱构建例子总结而言,知识图谱的构建一般有两种本文档来自技高网
...

【技术保护点】
1.一种基于知识图谱的食物成分和营养健康的关联性分析方法,其特征在于,包括:/nS1:在模式层对实体-关系-实体的三元组成的知识数据库进行定义,其中三元组用以描述现实世界中的实体和关系;/nS2:获取待分析的食品数据,并对获取的待分析的食品数据进行后处理;/nS3:根据模式层对知识数据库的定义,从获取的待分析的食品数据中逐一提取出实体和对应关系;/nS4:利用共消指解的方法进行知识融合,将同名的实体概念进行融合,得到最终知识图谱,作为关联性分析结果。/n

【技术特征摘要】
1.一种基于知识图谱的食物成分和营养健康的关联性分析方法,其特征在于,包括:
S1:在模式层对实体-关系-实体的三元组成的知识数据库进行定义,其中三元组用以描述现实世界中的实体和关系;
S2:获取待分析的食品数据,并对获取的待分析的食品数据进行后处理;
S3:根据模式层对知识数据库的定义,从获取的待分析的食品数据中逐一提取出实体和对应关系;
S4:利用共消指解的方法进行知识融合,将同名的实体概念进行融合,得到最终知识图谱,作为关联性分析结果。


2.如权利要求1所述的关联性分析方法,其特征在于,S1中实体包括但不限于食物种类、食物名称、成分和症状。


3.如权利要求1所述的关联性分析方法,其特征在于,S2具体包括:
S2.1:利用爬虫工具,对目标网站进行所需数据的批量爬取,得到待分析的食品数据;
S2.2:对待分析的食品数据进行格式转换,转换为知识图谱可处理的格式。


4.如权利要求1所述的关联性分析方法,其特征在于,S3具体包括:
S3.1:利用知识图谱工具创建一个项目;
S3.2:将后处理后的数据进行上传,并构建概...

【专利技术属性】
技术研发人员:沈志东简维勇宋爽
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1