本发明专利技术涉及一种用于食品溯源和分析的图数据库构建系统,包括:数据获取模块,用于获取内外部数据;数据预处理模块,用于对所述内外部数据进行预处理;特征提取模块,接收所述数据预处理模块的输出数据,用于根据所述输出数据提取食品企业的标签和实体关系;图数据库生成模块,根据所述标签和实体关系构建数据模型,生成图数据库。与现有技术相比,本发明专利技术有效地存储和表征了食品企业的基本信息、食品安全情况以及企业之间的关系,具有查询效率高、伸缩性灵活性好等优点。
A graph database construction system for food traceability and analysis
【技术实现步骤摘要】
一种用于食品溯源和分析的图数据库构建系统
本专利技术涉及食品安全领域,尤其是涉及一种用于食品溯源和分析的图数据库构建系统。
技术介绍
食品安全问题越来越得到社会的重视,也涌现出了很多的解决方法,包括食品追溯体系的建立和成熟,以及各种各样的食品安全的评价体系和方法。食品的来源和生产过程是整个食品安全问题中的源头和保障,也是食品安全的根本,市场上售卖的各种食品是人们日常生活中最重要的组成部分,其安全性能直接关乎人们的身体健康,因此对其溯源信息的记录和查询是必不可少的。由于食品的流通涉及多个企业,构成一张张复杂网络,面对这样的数据特点,现有的结构化数据库,以及部分非结构化数据库,存在信息表征不完整,查询效率低下等问题。同时,大部分溯源信息用于食品安全事件的事后处理查询,无法基于现有溯源信息进行常态化食品安全评估以及食品安全事件发生时关联企业事前预警。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种用于食品溯源和分析的图数据库构建系统。本专利技术的目的可以通过以下技术方案来实现:一种用于食品溯源和分析的图数据库构建系统,包括:数据获取模块,用于获取内外部数据;数据预处理模块,用于对所述内外部数据进行预处理;特征提取模块,接收所述数据预处理模块的输出数据,用于根据所述输出数据提取食品企业的标签和实体关系;图数据库生成模块,根据所述标签和实体关系构建数据模型,生成图数据库。进一步地,所述数据获取模块包括:内部数据获取单元,用于对多数据源、不同数据库类型的数据库数据进行采集,生成内部数据;外部数据获取单元,用于利用高频爬虫方法获取外部网页数据,生成外部数据。进一步地,所述外部网页数据包括食品安全事件数据。进一步地,所述数据预处理模块包括:内部数据处理单元,用于对内部数据进行预处理,所述预处理包括数据清洗、数据格式变换和多数据源数据集成;外部数据分析单元,用于对获取的外部数据运用人工智能技术进行数据分析。进一步地,所述标签包括基础标签和计算标签,所述基础标签和实体关系根据内部数据生成,所述计算标签根据外部数据生成。进一步地,该系统还包括:食品安全评价模块,用于根据所述图数据库计算食品企业的食品安全指数,进行食品安全评价。进一步地,该系统还包括:查询模块,用于根据外部查询请求调用所述图数据库并实现可视化。与现有技术相比,本专利技术有效地存储和表征了食品企业的基本信息、食品安全情况以及企业之间的关系,在获取食品溯源数据时涉及到复杂的企业关系,本系统具有非常高效的查询性能,同时,本系统具有很大的伸缩性和灵活性,随着企业节点的增加时,不会影响原有企业数据的正常使用。本专利技术具有以如下有益效果:1.多数据源:打通已有的数据库系统,引入外部网页爬虫数据;2.引入人工智能技术,监测企业关联食品安全事件;3.本专利技术构建了食品企业的企业关系图数据库,与传统结构化数据库相比,信息表征完善,显著提高查询速度,有很大的伸缩性和灵活性;4.通过食品安全指数标签,量化企业食品安全情况。附图说明图1为本专利技术的结构示意图。具体实施方式下面结合附图和具体实施例对本专利技术进行详细说明。本实施例以本专利技术技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围不限于下述的实施例。如图1所示,本实施例提供一种用于食品溯源和分析的图数据库构建系统,包括数据获取模块、数据预处理模块、特征提取模块和图数据库生成模块,其中,数据获取模块用于获取内外部数据;数据预处理模块用于对所述内外部数据进行预处理;特征提取模块接收所述数据预处理模块的输出数据,用于根据所述输出数据提取食品企业的标签和实体关系;图数据库生成模块根据所述标签和实体关系构建数据模型,生成图数据库。具体地,数据获取模块包括内部数据获取单元和外部数据获取单元,内部数据获取单元用于对多数据源、不同数据库类型的数据库数据进行采集,生成内部数据;外部数据获取单元用于利用高频爬虫方法获取外部网页数据,生成外部数据,所述外部网页数据包括食品安全事件数据等。数据预处理模块包括内部数据处理单元和外部数据分析单元,内部数据处理单元用于对内部数据进行预处理,所述预处理包括数据清洗、数据格式变换和多数据源数据集成;外部数据分析单元用于对获取的外部数据运用人工智能技术进行数据分析。标签包括基础标签和计算标签,将从数据库中提取的企业间关系划分为实体关系;将从数据库中直接获取的标签划分为基本标签;将所述的基于人工智能技术分析后的食品安全事件信息划分为计算标签。具体地,根据实体关系生成方法,获取内部数据库中企业间关系关联的数据表字段及值;根据基础标签的分类与生成方法,获取内部数据库中企业实体的标签关联的数据表字段及值;根据计算标签的分类与生成方法,对网页数据进行自然语言数据处理,挖掘食品安全信息并关联到企业实体。在某些实施例中,该系统还包括食品安全评价模块,用于根据所述图数据库计算食品企业的食品安全指数,进行食品安全评价。具体地,基于所述的基本信息和食品安全信息计算标签,通过一种基于食品追溯的动态食品安全评价方法和评价装置(申请号:2018111080309)中所述方法计算,获取的食品安全指数划分为计算标签。在某些实施例中,该系统还包括查询模块,用于根据外部查询请求调用所述图数据库并实现可视化,方便快速查询。以上详细描述了本专利技术的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本专利技术的构思作出诸多修改和变化。因此,凡本
中技术人员依本专利技术的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。本文档来自技高网...
【技术保护点】
1.一种用于食品溯源和分析的图数据库构建系统,其特征在于,包括:/n数据获取模块,用于获取内外部数据;/n数据预处理模块,用于对所述内外部数据进行预处理;/n特征提取模块,接收所述数据预处理模块的输出数据,用于根据所述输出数据提取食品企业的标签和实体关系;/n图数据库生成模块,根据所述标签和实体关系构建数据模型,生成图数据库。/n
【技术特征摘要】
1.一种用于食品溯源和分析的图数据库构建系统,其特征在于,包括:
数据获取模块,用于获取内外部数据;
数据预处理模块,用于对所述内外部数据进行预处理;
特征提取模块,接收所述数据预处理模块的输出数据,用于根据所述输出数据提取食品企业的标签和实体关系;
图数据库生成模块,根据所述标签和实体关系构建数据模型,生成图数据库。
2.根据权利要求1所述的用于食品溯源和分析的图数据库构建系统,其特征在于,所述数据获取模块包括:
内部数据获取单元,用于对多数据源、不同数据库类型的数据库数据进行采集,生成内部数据;
外部数据获取单元,用于利用高频爬虫方法获取外部网页数据,生成外部数据。
3.根据权利要求2所述的用于食品溯源和分析的图数据库构建系统,其特征在于,所述外部网页数据包括食品安全事件数据。
4.根据权利要求2所述的用于食品溯源...
【专利技术属性】
技术研发人员:张会峰,
申请(专利权)人:上海仪电集团有限公司中央研究院,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。