一种基于知识图谱的税务知识库系统技术方案

技术编号:27977463 阅读:35 留言:0更新日期:2021-04-06 14:12
本发明专利技术涉及税务知识库技术领域,且公开了一种基于知识图谱的税务知识库系统,数据模块、知识模块以及测试评估模块,所述知识模块包括:知识获取模块、知识融合模块、知识计算模块、知识表示模块、知识构建模块、知识存储模块以及知识运维模块。本发明专利技术中,通过设置知识获取模块、知识融合模块、知识计算模块、知识表示模块、知识构建模块、知识存储模块以及知识运维模块,达到解决税务领域知识结构复杂又难以构建,知识关系不容易梳理构建,税务领域知识具有时效性,传统方法构建可能存在刚刚构建好就失效的情况,税务领域业务知识量巨大,税务领域业务知识和其他行业知识有交叉,税务领域业务知识构建需要具有专业背景的人才等问题。

【技术实现步骤摘要】
一种基于知识图谱的税务知识库系统
本专利技术涉及税务知识库
,具体为一种基于知识图谱的税务知识库系统。
技术介绍
税务系统是具有共同税收目标又相互关联的各税务机构所组成的有机整体。从组织结构的角度分析,一个税务机关可以看成一个税收系统。它所属的各职能部门如基层征收机构,以及人事、票证、会计、统计和计划等就是组成税务机关系统的部分,它们共同的目标就是完成税收任务。现有的税务知识库系统在使用过程中,存在以下问题:1、税务领域知识结构复杂又难以构建,知识关系不容易梳理构建。2、税务领域知识具有时效性,传统方法构建可能存在刚刚构建好就失效的情况。3、税务领域业务知识量巨大。4、税务领域业务知识和其他行业知识有交叉。5、税务领域业务知识构建需要具有专业背景的人才。为此,我们提出一种基于知识图谱的税务知识库系统。
技术实现思路
(一)解决的技术问题针对现有技术的不足,本专利技术提供了一种基于知识图谱的税务知识库系统。(二)技术方案为实现上述目的,本专利技术提供本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的税务知识库系统,数据模块、知识模块以及测试评估模块,其特征在于:所述知识模块包括:知识获取模块、知识融合模块、知识计算模块、知识表示模块、知识构建模块、知识存储模块以及知识运维模块;/n所述数据模块具体为:/na)作为知识获取来源,分为结构化数据,半结构化数据,非结构化数据,数据最终的结构为:实体-属性-值;/nb)结构化数据,关系型数据库中相关数据;/ni.业务:完税证明打印;/nii.属性:包含上游未完成业务;/niii.值:实名认证;/nc)半结构化数据,为日志相关,第三方接口数据等其他数据源;/ni.半结构化数据中可能只包含实体-属性,实体-值,属性-值;/nii...

【技术特征摘要】
1.一种基于知识图谱的税务知识库系统,数据模块、知识模块以及测试评估模块,其特征在于:所述知识模块包括:知识获取模块、知识融合模块、知识计算模块、知识表示模块、知识构建模块、知识存储模块以及知识运维模块;
所述数据模块具体为:
a)作为知识获取来源,分为结构化数据,半结构化数据,非结构化数据,数据最终的结构为:实体-属性-值;
b)结构化数据,关系型数据库中相关数据;
i.业务:完税证明打印;
ii.属性:包含上游未完成业务;
iii.值:实名认证;
c)半结构化数据,为日志相关,第三方接口数据等其他数据源;
i.半结构化数据中可能只包含实体-属性,实体-值,属性-值;
ii.需要通过数据整合,第三方接口,算法预测等方式进行数据补全;
iii.非结构化数据,需要实体抽取,属性抽取,值预测,值关联等方式进行补全;
iv.实体抽取,属性抽取会在知识获取中介绍。


2.根据权利要求1所述的一种基于知识图谱的税务知识库系统,其特征在于:所述知识获取模块具体为:
a)知识获取作为整个引擎中关键组件,主要完成信息抽,实体识别,关系抽取,属性抽取等功能;
b)税务概念抽取,知识图谱知识库构建的第一步,关键是如何从异构数据中自动抽取信息到候选的知识单元中;
c)实体抽取,采用Bi.LSTM.CRE,模型进行抽取;
i.数据输入:税务语料,爬取的政策,税务报告,资料,书籍;
ii.输出结果:税务业务,税务政策,税务规则;
d)关系抽取,经过实体抽取,会得到一些税务业务实体,但是这些实
体都是离散的,为了得到语义信息,还需要将这些抽取到这些实体之间的关系才能将这些实体联系到一起;
i.关系抽取采用模型四种方式进行Ensemble;
ii.有监督学习方法:对于已知的关系,模型为:Bi-LSTM;
1).输入为:实体语料;
2).输出为:关系;
iii.半监督学习方法:采用BootStrapping进行关系抽取,设定若干种子语料,找到对应的关系;
1).业务:完税证明打印;
2).属性:-包含上游未完成业务;
3).值:-实名认证;
4).找—些和他类似的关系数据,这个种子相当于模板;
iv.无监督方法:采用句法分析,依存分析得到句子的结构性分析结果,在通过关系短语进行抽取;
v.规则抽取方法:
1).设定规则词〔关系词),比如还需要,需要完成,实名认证;
2).检测到规则词,做实体抽取,抽取到相应的业务得到的关系。


3.根据权利要求1所述的一种基于知...

【专利技术属性】
技术研发人员:胡乃庄邓志勇黄金
申请(专利权)人:上海永骁智能技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1