一种基于知识图谱的智能渔业问答机器人的构建方法技术

技术编号:26418585 阅读:33 留言:0更新日期:2020-11-20 14:13
本发明专利技术公开了一种基于知识图谱的智能渔业问答机器人的构建方法,包括:参照当前现有的其他领域的语义划分,进行知识建模的结构的建立;通过研究渔业领域半结构化、非结构化的数据,还原渔业生产过程中的业务模式,并剥离出渔业知识的语义类型、语义关系以及提取出对象本体;通过爬取结构化的数据,从中提取出相应对象本体的本体属性及实例;将爬取的结构化数据和来自第三方知识库的数据进行知识融合,通过在Web页面中嵌入使用AIML技术的智能渔业问答机器人,最终得到一个完整的基于知识图谱的智能渔业问答机器人的构建方法。本发明专利技术提高了领域的知识概念体系的建设完整率,为养殖户获取其所需的信息提供了更加方便的途径,可提高生产效率。

【技术实现步骤摘要】
一种基于知识图谱的智能渔业问答机器人的构建方法
本专利技术适用于智慧渔业
,尤其涉及一种基于知识图谱的智能渔业问答机器人的构建方法。
技术介绍
传统的水产养殖行业对于环境因素的依赖十分高,其养殖过程中出现的问题,存在过多地依靠口口相传的经验,其效果难以保证。科学地解决水产养殖过程中出现的问题才是最终提高产量、减少不必要的损失的关键因素。传统的养殖技术获取的渠道一是通过高校科研团队下乡考察指导,或建立养殖合作试验地,二是通过农户自行在互联网上查找相关资料,如中国水产养殖网等。对于农户来说,高校科研团队下乡考察指导不具备时效性,有些时效性较高的问题,等不到调研团队到来的那一刻;自行上网搜索资料,难以辨别哪个说的真实可靠,对从海量的信息中筛选出其所需要的,并不是一件容易的事情。往往从事水产养殖行业的人数相对与其他的行业较为偏少,因此除了政府主导的传统信息网站之外,很少或者几乎没有其他类似的水产养殖相关的信息平台,更不要说专攻于水产养殖行业的智能信息交流平台。所以,对于我国水产养殖行业目前的现状来说,其行业相关的技术信息较为难以从互联网上获取。知识图谱是近年来人工智能发展的基础。目前,知识图谱的应用的研发也在各行各业开展得如火如荼,但唯独在水产养殖领域缺少相应的实际应用。与此同时,水产养殖行业知识图谱语义的建设,目前仍然处于空白的状态。随着经济的发展,我国人口数量越来越多,那么首先要解决的问题是吃饭问题。所以,为了解决全国14亿人口的温饱问题,要将先进的技术引入到传统渔业中,以提高水产养殖产量和生产效率。
技术实现思路
根据上述行业问题,本专利技术的目的是提供一种基于知识图谱的智能渔业问答机器人的构建方法,本专利技术通过参照当前现有的其他领域的语义划分、研究渔业领域非结构化数据、还原渔业生产过程中的业务模式,以及再通过爬取结构化、半结构化的数据,建立一套渔业养殖领域的知识图谱;再辅以智能渔业问答机器人,得到一个完整的基于知识图谱的智能渔业问答机器人的构建方法。本专利技术可以为渔业工作者快速地获取其所想要的信息,同时可以为其他农牧行业相关领域知识图谱的建设提供参考,也可为养殖户养殖方法的改进提供咨询。本专利技术是通过以下技术方案实现的:一种基于知识图谱的智能渔业问答机器人的构建方法,包含以下几步:S01:参照当前现有的其他领域的语义划分,进行知识建模的上层结构的建立;S02:通过研究渔业领域半结构化及非结构化数据,还原渔业生产过程中的业务模式,并剥离出渔业知识的语义类型、语义关系以及提取出对象本体;S03:通过爬取结构化的数据,从中提取出相应对象本体的本体属性及实例;S04:将S03阶段爬取的结构化数据和来自第三方知识库的数据进行知识融合,通过实体消歧、指代消解,减少实体种类,降低图谱稀疏性,并与对象本体进行知识合并,得到知识图谱;S05:通过在Web页面中嵌入使用AIML技术的智能渔业问答机器人,并设定特定的语句类型将其链接到知识图谱,最终得到一个完整的基于知识图谱的智能渔业问答机器人的构建方法。优选的技术方案中,所述步骤S01中,将以参照目前现有的语义资料,搭建顶层语义类型划分为主;在S02阶段,将在S01阶段的基础之上,通过研究水产养殖领域业务模式,使用归纳法将水产养殖的工作流抽象出来进行对象梳理(比如说将和人相关的抽象出来,作为人;和事件相关的抽象出来,作为事件,不考虑细节),最终得到建立本知识图谱过程中所需要用到的知识建模(包括但不限于语义类型、语义关系、对象本体及其属性和实例)。优选的技术方案中,所述步骤S02中,所述渔业领域知识实体的构建方法:根据半结构化和非结构化数据人工建立的工作流有助于提取出渔业领域的对象本体的概念,又称为类别(Type)或类(Class或Category)等,有助于步骤S04结构化数据的处理,以及步骤S03的对象本体实体及其属性的获取;与此同时,通过提取出类及其之间的关系之后,可以用于建立知识图谱的模式层,如“实体-关系-实体”、“实体-属性-属性值”,使用三元组的方式存储,用于对数据层的约束。优选的技术方案中,所述步骤S02中,构建渔业领域对象本体的过程中,将渔业领域知识实体对象本体信息划分为八个基本类,所述基本类包括:养殖场所、水体环境、养殖品种、技术特点、潜在疾病、污染水平、投资成本、资料来源;于此同时,将每一个基本类划分为若干个子类概念,将养殖技术分为:技术普及度、技术覆盖率、技术可靠性;将养殖品种划分为鱼类、虾类、贝类、蟹类;将污染水平划分为污染物排放类型、污染物排放量;将养殖场所划分为塘基养殖、浮排养殖、人造养殖池养殖;人造养殖池养殖又划分为静水养殖、活水养殖;将投资成本划分为投资估算、运行费用、投资回收期;将资料来源划分为网页、国家标准、行业标准、论文文献、国家政策、百科类资料。优选的技术方案中,类之间的关系,按照以下依据建立类之间的关系,包括建立渔业领域概念在语义上的上下位关系Part-of,渔业领域概念的层级关系Kind-of,渔业领域对象与类的关系Instance-of,渔业领域某一概念是另一概念的属性Attribute-of。优选的技术方案中,所述步骤S03中,建立的模式层,该模式层并非一成不变,而是会在后期随着实例化的进行,与数据层一并螺旋迭代。优选的技术方案中,所述步骤S03中,通过爬取结构化数据,按照字段直接抽取对应字段的名称,及其对应字段中包含的知识单元,获取对象本体知识,获取对象本体实例及其属性,建立知识图谱,存储在图数据库中。优选的技术方案中,所述步骤S03中,爬取结构化数据抽取字段建立知识图谱的方法,其实体链接过程需根据实体、关系、实体模式进行语义相似度计算,筛选出语义最为相近的实体、关系、实体组合,并在所述步骤S04进行知识融合,所述步骤S04包括以下步骤:S41:包括实体消歧和指代消解过程;S42:将筛选出来的概念集合添加到现有的知识图谱中,实现知识合并。优选的技术方案中,所述步骤S04中,进行的知识融合,所述步骤S42中,将通过步骤S03和步骤S04中的步骤S42对概念集合的语义划分和筛选得出的概念集合作为新的链接,更新到已有的知识图谱网络中;优选的技术方案中,所述步骤S05中,在Web中嵌入基于AIML技术的智能对话机器人:AIML语料库被分为普通对话使用和细分领域对话使用;涉及到细分领域的对话,回答的内容将源自于S04阶段产生的知识图谱;在对话的过程中,系统将记录提问者提到的相应字段,并通过图数据库的存储的知识图谱,挖掘出提问者可能关心的其他问题,并向其询问是否需要了解该内容。优选的技术方案中,挖掘出提问者可能关心的其他问题,包括以下几个步骤:S51、根据记录下的被提到的结点,在该实例对应的类中,搜寻最相似的实例,推荐给用户;S52、根据回答所涉及到的实例,在该实例对应的类中,搜寻和该实例有关系(Relationship)且二者所属的类为同一类或其父本文档来自技高网
...

【技术保护点】
1.一种基于知识图谱的智能渔业问答机器人的构建方法,其特征在于,包含以下几步:/nS01:参照当前现有的其他领域的语义划分,进行知识建模的上层结构的建立;/nS02:通过研究渔业领域半结构化及非结构化数据,还原渔业生产过程中的业务模式,并剥离出渔业知识的语义类型、语义关系以及提取出对象本体;/nS03:通过爬取结构化的数据,从中提取出相应对象本体的本体属性及实例;/nS04:将S03阶段爬取的结构化数据和来自第三方知识库的数据进行知识融合,通过实体消歧、指代消解,减少实体种类,降低图谱稀疏性,并与对象本体进行知识合并,得到知识图谱;/nS05:通过在Web页面中嵌入使用AIML技术的智能渔业问答机器人,并设定特定的语句类型将其链接到知识图谱,最终得到一个完整的基于知识图谱的智能渔业问答机器人的构建方法。/n

【技术特征摘要】
1.一种基于知识图谱的智能渔业问答机器人的构建方法,其特征在于,包含以下几步:
S01:参照当前现有的其他领域的语义划分,进行知识建模的上层结构的建立;
S02:通过研究渔业领域半结构化及非结构化数据,还原渔业生产过程中的业务模式,并剥离出渔业知识的语义类型、语义关系以及提取出对象本体;
S03:通过爬取结构化的数据,从中提取出相应对象本体的本体属性及实例;
S04:将S03阶段爬取的结构化数据和来自第三方知识库的数据进行知识融合,通过实体消歧、指代消解,减少实体种类,降低图谱稀疏性,并与对象本体进行知识合并,得到知识图谱;
S05:通过在Web页面中嵌入使用AIML技术的智能渔业问答机器人,并设定特定的语句类型将其链接到知识图谱,最终得到一个完整的基于知识图谱的智能渔业问答机器人的构建方法。


2.根据权利要求1所述的一种基于知识图谱的智能渔业问答机器人的构建方法,其特征在于,所述步骤S01中,将以参照目前现有的语义资料,搭建顶层语义类型划分为主;在S02阶段,将在S01阶段的基础之上,通过研究水产养殖领域业务模式,使用归纳法将水产养殖的工作流抽象出来进行对象梳理,最终得到建立本知识图谱过程中所需要用到的知识建模。


3.根据权利要求1所述的一种基于知识图谱的智能渔业问答机器人的构建方法,其特征在于,所述步骤S02中,所述渔业领域知识实体的构建方法:
根据半结构化和非结构化数据人工建立的工作流有助于提取出渔业领域的对象本体的概念,又称为类别或类,有助于步骤S04结构化数据的处理,以及步骤S03的对象本体实体及其属性的获取;与此同时,通过提取出类及其之间的关系之后,可以用于建立知识图谱的模式层,使用三元组的方式存储,用于对数据层的约束。


4.根据权利要求1所述的一种基于知识图谱的智能渔业问答机器人的构建方法,其特征在于,所述步骤S02中,构建渔业领域对象本体的过程中,将渔业领域知识实体对象本体信息划分为八个基本类,所述基本类包括:养殖场所、水体环境、养殖品种、技术特点、潜在疾病、污染水平、投资成本、资料来源;
于此同时,将每一个基本类划分为若干个子类概念,将养殖技术分为:技术普及度、技术覆盖率、技术可靠性;将养殖品种划分为鱼类、虾类、贝类、蟹类;将污染水平划分为污染物排放类型、污染物排放量;将养殖场所划分为塘基养殖、浮排养殖、人造养殖池养殖;人造养殖池养殖又划分为静水养殖、活水养殖;将投资成本划分为投资估算、运行费用、投资回收期;将资料来源划分为网页、国家标准、行业标准、论文文献、国家政策、百科类资料。


5.根据权利要求4所述的一种基于知识图谱的智能渔业问答机器人的构建方法,其特征在于...

【专利技术属性】
技术研发人员:王溯袁红春
申请(专利权)人:上海海洋大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1