【技术实现步骤摘要】
本专利技术属于知识图谱,具体涉及多特征嵌入的唐代服饰命名实体识别方法。
技术介绍
1、随着数字化技术的快速发展,文化遗产的数字化保护与研究成为学术界和产业界的重要课题。唐代服饰作为中国传统文化的重要组成部分,具有丰富的历史价值和艺术内涵。然而,唐代服饰的相关文献和资料通常以非结构化或半结构化的形式存在,如古籍、考古报告、学术论文等,这给知识的系统化整理和高效检索带来了挑战。命名实体识别(namedentity recognition, ner)作为自然语言处理(natural language processing, nlp)中的关键技术,能够从文本中自动识别出具有特定意义的实体,如人名、地名、时间、服饰类别等,为唐代服饰知识的自动化提取和结构化表示提供了重要支持。
2、传统的命名实体识别方法主要基于规则或统计模型,但这些方法在处理唐代服饰文本时存在一定的局限性。首先,唐代服饰的命名实体具有多样性和复杂性,如服饰类别(如“襦裙”、“袍”)、材质(如“丝绸”、“麻布”)、图案(如“云纹”、“龙凤纹”)等,传统方法难以充分捕捉这
...【技术保护点】
1.多特征嵌入的唐代服饰命名实体识别方法,其特征在于,具体按照以下步骤实施:
2.根据权利要求1所述多特征嵌入的唐代服饰命名实体识别方法,其特征在于,所述步骤1中对唐代服饰文本数据进行预处理,具体包括:图片文字提取、PDF文字提取,将转化过程中的多余字符、标点符号进行修正。
3.根据权利要求2所述多特征嵌入的唐代服饰命名实体识别方法,其特征在于,所述图片文字提取的具体方法为:对出版专著中唐代服饰相关数据进行拍照记录,并通过识别工具将图片中的数据转换为文字,存储在TXT中;
4.根据权利要求3所述多特征嵌入的唐代服饰命名实体识别方法,
...【技术特征摘要】
1.多特征嵌入的唐代服饰命名实体识别方法,其特征在于,具体按照以下步骤实施:
2.根据权利要求1所述多特征嵌入的唐代服饰命名实体识别方法,其特征在于,所述步骤1中对唐代服饰文本数据进行预处理,具体包括:图片文字提取、pdf文字提取,将转化过程中的多余字符、标点符号进行修正。
3.根据权利要求2所述多特征嵌入的唐代服饰命名实体识别方法,其特征在于,所述图片文字提取的具体方法为:对出版专著中唐代服饰相关数据进行拍照记录,并通过识别工具将图片中的数据转换为文字,存储在txt中;
4.根据权利要求3所述多特征嵌入的唐代服饰命名实体识别方法,其特征在于,所述步骤2的具体方法为:自顶向下梳理出14种唐代服饰本体,并将其对应为14种实体类型,14种实体类型具体为:材质、穿着场合、颜色、冠服、身份阶层、款式、领口、配饰、图案纹样、袖口、上衣、下衣、鞋子、帽子。
5.根据权利要求4所述多特征嵌入的唐代服饰命名实体识别方法,其特征在于,所...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。