多特征嵌入的唐代服饰命名实体识别方法技术

技术编号:46574572 阅读:0 留言:0更新日期:2025-10-10 21:18
本发明专利技术公开了多特征嵌入的唐代服饰命名实体识别方法:步骤1、对唐代服饰文本数据进行收集与预处理;步骤2、构建唐代服饰本体并划分实体类型;步骤3、进行数据标注,构建唐代服饰命名实体识别数据集;步骤4、通过Flat‑Lattice和Radical feature模块获取输入语句的词格特征和字符词根特征,并将词格特征和字符词根特征进行拼接;步骤5、将拼接后的特征输入BiLSTM‑CRF网络进行嵌入特征向量化,经过BiLSTM‑CRF网络计算后,输出每个位置对应的标签。本发明专利技术提供的多特征嵌入的唐代服饰命名实体识别方法,实现对唐代服饰文本中命名实体的高精度识别。

【技术实现步骤摘要】

本专利技术属于知识图谱,具体涉及多特征嵌入的唐代服饰命名实体识别方法


技术介绍

1、随着数字化技术的快速发展,文化遗产的数字化保护与研究成为学术界和产业界的重要课题。唐代服饰作为中国传统文化的重要组成部分,具有丰富的历史价值和艺术内涵。然而,唐代服饰的相关文献和资料通常以非结构化或半结构化的形式存在,如古籍、考古报告、学术论文等,这给知识的系统化整理和高效检索带来了挑战。命名实体识别(namedentity recognition, ner)作为自然语言处理(natural language processing, nlp)中的关键技术,能够从文本中自动识别出具有特定意义的实体,如人名、地名、时间、服饰类别等,为唐代服饰知识的自动化提取和结构化表示提供了重要支持。

2、传统的命名实体识别方法主要基于规则或统计模型,但这些方法在处理唐代服饰文本时存在一定的局限性。首先,唐代服饰的命名实体具有多样性和复杂性,如服饰类别(如“襦裙”、“袍”)、材质(如“丝绸”、“麻布”)、图案(如“云纹”、“龙凤纹”)等,传统方法难以充分捕捉这些实体的语义特征。其本文档来自技高网...

【技术保护点】

1.多特征嵌入的唐代服饰命名实体识别方法,其特征在于,具体按照以下步骤实施:

2.根据权利要求1所述多特征嵌入的唐代服饰命名实体识别方法,其特征在于,所述步骤1中对唐代服饰文本数据进行预处理,具体包括:图片文字提取、PDF文字提取,将转化过程中的多余字符、标点符号进行修正。

3.根据权利要求2所述多特征嵌入的唐代服饰命名实体识别方法,其特征在于,所述图片文字提取的具体方法为:对出版专著中唐代服饰相关数据进行拍照记录,并通过识别工具将图片中的数据转换为文字,存储在TXT中;

4.根据权利要求3所述多特征嵌入的唐代服饰命名实体识别方法,其特征在于,所述步骤...

【技术特征摘要】

1.多特征嵌入的唐代服饰命名实体识别方法,其特征在于,具体按照以下步骤实施:

2.根据权利要求1所述多特征嵌入的唐代服饰命名实体识别方法,其特征在于,所述步骤1中对唐代服饰文本数据进行预处理,具体包括:图片文字提取、pdf文字提取,将转化过程中的多余字符、标点符号进行修正。

3.根据权利要求2所述多特征嵌入的唐代服饰命名实体识别方法,其特征在于,所述图片文字提取的具体方法为:对出版专著中唐代服饰相关数据进行拍照记录,并通过识别工具将图片中的数据转换为文字,存储在txt中;

4.根据权利要求3所述多特征嵌入的唐代服饰命名实体识别方法,其特征在于,所述步骤2的具体方法为:自顶向下梳理出14种唐代服饰本体,并将其对应为14种实体类型,14种实体类型具体为:材质、穿着场合、颜色、冠服、身份阶层、款式、领口、配饰、图案纹样、袖口、上衣、下衣、鞋子、帽子。

5.根据权利要求4所述多特征嵌入的唐代服饰命名实体识别方法,其特征在于,所...

【专利技术属性】
技术研发人员:赵雪青靳可轩侯福卿
申请(专利权)人:西安工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1