【技术实现步骤摘要】
一种面向军事领域的知识图谱构建方法
[0001]本专利技术属于知识图谱领域,具体涉及一种面向军事领域的知识图谱构建方法。
技术介绍
[0002]知识图谱在2012年由Google提出并应用于搜索业务中,其通过将海量、多元异构、零散碎片的知识,进行清洗、消歧和去冗余等操作后整理为结构化的三元组形式并加以存储和应用生成大规模的知识图谱,较为简洁的呈现了客观世界实体间的逻辑关系和层次结构。在划分上,知识图谱根据内容覆盖范围可以划分为通用的知识图谱和面向特定领域的知识图谱,也称为垂直领域的知识图谱。
[0003]现阶段,特定领域的知识图谱仍旧在研究和探索中。知识图谱具有强大的语义分析和互联能力,在知识应用可视化、搜索引擎、智能问答和决策支持等方面取得很多成果,在智慧医疗、电子商务、现代农业等诸多领域都获得应用,在军事领域应用较少。
[0004]军事领域的智能化和自动化进程对军事知识采集、存储、表示、查询等技术提出更高的要求,因此知识图谱在军事上将发会越来越重要的作用。将知识图谱应用于军事领域可以实现实体数据的集中存储 ...
【技术保护点】
【技术特征摘要】
1.一种面向军事领域的知识图谱构建方法,其特征在于,该方法包括如下步骤:S11、融合整理已有的结构化数据和半结构化军事数据;S12、通过爬虫从互联网获取到军事相关新闻报道和百科知识,对已有的数据进行补充;S13、对已经获取到的数据进行文本清洗,删除重复信息、纠正无效值和缺失值,包括不需要用的标点符号、停用词、标签和无关内容,并提供数据审查、校验和一致性检测,进而执行分词、词性标注和向量化工作;S14、通过总结和前期经验设置部分实体类型和实体关系类型;S15、利用规则匹配和实体向量算法融合的方式进行军事实体、属性和实体间关系的抽取;S16、对获得的军事实体、属性和实体间关系进行融合校验,得到正确数据集合;S17、进行知识图谱的可视化和推理。2.如权利要求1所述的面向军事领域的知识图谱构建方法,其特征在于,结构化数据包括物资装备字典、地点字典和同名词典。3.如权利要求1所述的面向军事领域的知识图谱构建方法,其特征在于,半结构化军事数据包括装备属性数据和作战文书。4.如权利要求1所述的面向军事领域的知识图谱构建方法,其特征在于,所述步骤S14中,实体类型包括军事装备、人员、机构和物资;实体关系类型包括应用、就职、部署、搭载、指挥和打击关系。5.如权利要求1
‑
4任一项所述的面向军事领域的知识图谱构建方法,其特征在于,所述步骤S15具体包括:首先与已有的武器装备实体字典、同义词库进行匹配识别实体内容,进一步通过语义、语法规则识别模板进行实体识别,采用基于词向量的Bi
‑
LSTM
‑
CRF算法,并在其中添加注意力机制,增强军事实体关键特征的权重,抽取出军事实体、属性和实体间关系类型;其中,借助实体字典和关联同义词库,通过迭代式同步更新实体字典和同义词库,从而在下次识别同义实体时,一定范围快速解决;其中,针对新词,利用语义和语法规则匹配方式进行简单发现,进行归类和整理,而后进一步通过Bert
‑
BiLSTM
‑
CRF算法,并在其中添...
【专利技术属性】
技术研发人员:谢德鹏,胡欣欣,葛志,袁晓光,
申请(专利权)人:北京计算机技术及应用研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。