【技术实现步骤摘要】
本专利技术涉及自然语言处理,特别是涉及一种基于考古文献资料的知识图谱构建方法、系统及介质。
技术介绍
1、考古遗址作为古代人类活动的直接见证,反映了古人类社会的生活方式与文明进程。这些遗址所含的数据形态多样,包含了深厚的考古学价值和知识,而记录这些信息的考古文献资料详尽地保留了遗址的名称、地理位置和历史时期等重要数据,成为了考古学研究的宝贵资源。随着网络技术的发展,在线的考古文档数量日益增加,信息的过载和分散性也日渐显著,急需通过整合和挖掘来有效利用这些数据。传统依赖人工的信息识别方法不仅耗时而且效率低下,尤其是在处理大规模网络文本数据时更显得力不从心。
2、在这种背景下,借助计算机和网络技术的发展,人工智能尤其是知识图谱技术的兴起,为考古资料的处理带来了革命性的变化。结合深度学习和自然语言处理的信息抽取技术能够从大量非结构化文本中高效地提取关键数据,显著提高了信息处理的效率。这些技术不仅优化了考古文本中时空信息的提取流程,还为构建考古知识图谱及知识的综合与融合提供了新的工具和方法。考古领域的文本资料蕴含了丰富的历史和文化信
...【技术保护点】
1.一种基于考古文献资料的知识图谱构建方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于考古文献资料的知识图谱构建方法,其特征在于,对所述考古发掘文献资料进行数据清洗和预处理,包括:去除所述考古发掘文献资料中的特殊符号和重复字段,并保留句号和逗号;
3.根据权利要求1所述的基于考古文献资料的知识图谱构建方法,其特征在于,基于所述分词工具对所述考古文本进行分句和分词,包括:
4.根据权利要求1所述的基于考古文献资料的知识图谱构建方法,其特征在于,基于双向长短时记忆循环神经网络模型对所述词向量文本进行特征提取之前,还包括:<
...【技术特征摘要】
1.一种基于考古文献资料的知识图谱构建方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于考古文献资料的知识图谱构建方法,其特征在于,对所述考古发掘文献资料进行数据清洗和预处理,包括:去除所述考古发掘文献资料中的特殊符号和重复字段,并保留句号和逗号;
3.根据权利要求1所述的基于考古文献资料的知识图谱构建方法,其特征在于,基于所述分词工具对所述考古文本进行分句和分词,包括:
4.根据权利要求1所述的基于考古文献资料的知识图谱构建方法,其特征在于,基于双向长短时记忆循环神经网络模型对所述词向量文本进行特征提取之前,还包括:
5.根据权利要求4所述的基于考古文献资料的知识图谱构建方法,其特征在于,基于双向长短时记忆循环神经网络模型对所述词向量文本进行特征提取,包括:
6.根据权利要求5所述的基于考古文献资料的知识图谱...
【专利技术属性】
技术研发人员:张雯琪,陈默,杨玉辉,龙思颖,王勇超,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。