一种基于考古文献资料的知识图谱构建方法、系统及介质技术方案

技术编号：43285432 阅读：32 留言：0更新日期：2024-11-12 16:07

本发明专利技术涉及自然语言处理技术领域，公开了一种基于考古文献资料的知识图谱构建方法、系统及介质，包括：采集考古发掘文献资料，并进行数据清洗和预处理，得到考古文本；根据考古的信息特征，设定分词工具，基于分词工具对考古文本进行分句和分词，得到词向量文本；基于BILSTM对词向量文本进行特征提取，得到单词特征序列；基于CRF对单词特征序列进行标注，并识别单词特征序列中的目标实体；基于实体关系抽取模型抽取目标实体之间的关系，得到实体关系三元组；对实体关系三元组进行消歧，构建面向考古领域的知识图谱。本发明专利技术实现了考古资料中的独特文本特征和关系的有效处理，提高了考古学中的关键实体识别的准确性和辨别力。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及自然语言处理，特别是涉及一种基于考古文献资料的知识图谱构建方法、系统及介质。

技术介绍

1、考古遗址作为古代人类活动的直接见证，反映了古人类社会的生活方式与文明进程。这些遗址所含的数据形态多样，包含了深厚的考古学价值和知识，而记录这些信息的考古文献资料详尽地保留了遗址的名称、地理位置和历史时期等重要数据，成为了考古学研究的宝贵资源。随着网络技术的发展，在线的考古文档数量日益增加，信息的过载和分散性也日渐显著，急需通过整合和挖掘来有效利用这些数据。传统依赖人工的信息识别方法不仅耗时而且效率低下，尤其是在处理大规模网络文本数据时更显得力不从心。

2、在这种背景下，借助计算机和网络技术的发展，人工智能尤其是知识图谱技术的兴起，为考古资料的处理带来了革命性的变化。结合深度学习和自然语言处理的信息抽取技术能够从大量非结构化文本中高效地提取关键数据，显著提高了信息处理的效率。这些技术不仅优化了考古文本中时空信息的提取流程，还为构建考古知识图谱及知识的综合与融合提供了新的工具和方法。考古领域的文本资料蕴含了丰富的历史和文化信...

【技术保护点】

1.一种基于考古文献资料的知识图谱构建方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于考古文献资料的知识图谱构建方法，其特征在于，对所述考古发掘文献资料进行数据清洗和预处理，包括：去除所述考古发掘文献资料中的特殊符号和重复字段，并保留句号和逗号；

3.根据权利要求1所述的基于考古文献资料的知识图谱构建方法，其特征在于，基于所述分词工具对所述考古文本进行分句和分词，包括：

4.根据权利要求1所述的基于考古文献资料的知识图谱构建方法，其特征在于，基于双向长短时记忆循环神经网络模型对所述词向量文本进行特征提取之前，还包括：</p>

5.根据...

【技术特征摘要】

1.一种基于考古文献资料的知识图谱构建方法，其特征在于，所述方法包括：

3.根据权利要求1所述的基于考古文献资料的知识图谱构建方法，其特征在于，基于所述分词工具对所述考古文本进行分句和分词，包括：

4.根据权利要求1所述的基于考古文献资料的知识图谱构建方法，其特征在于，基于双向长短时记忆循环神经网络模型对所述词向量文本进行特征提取之前，还包括：

5.根据权利要求4所述的基于考古文献资料的知识图谱构建方法，其特征在于，基于双向长短时记忆循环神经网络模型对所述词向量文本进行特征提取，包括：

6.根据权利要求5所述的基于考古文献资料的知识图谱...

【专利技术属性】
技术研发人员：张雯琪，陈默，杨玉辉，龙思颖，王勇超，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人