基于分类模型的甲骨文辅助破译分类方法及系统技术方案

技术编号:39932351 阅读:22 留言:0更新日期:2024-01-08 21:55
本发明专利技术公开了一种基于分类模型的甲骨文辅助破译分类方法,该方法包括:获取数据源,并基于所述数据源进行数据集的划分;训练分类模型,其中包括:将训练集输入训练模型中训练,在训练过程中,对训练集每一组图像中不同时期汉字图像进行特征系数加权;每轮训练结束后,输出由验证集得到的模型性能评估参数,根据这些参数的优劣筛选得到的分类模型;所有训练结束后,将测试集中的图片去除标签作为未破译甲骨文置于所述分类模型中进行预测,输出预测正确率高于预设数值的结果;基于分类模型,进行未破译甲骨文的分类和辅助破译。本方法方便地实现了甲骨文辅助破译的分类范式。本发明专利技术还提供了相应的基于分类模型的甲骨文辅助破译分类系统。

【技术实现步骤摘要】

本专利技术属于人工智能,计算机视觉和古文字学,更具体地,涉及一种基于分类模型的甲骨文辅助破译分类方法及系统


技术介绍

1、文字是文明的象征,也是一个民族的重要标识。甲骨文,作为中国最早的系统化文字,是无比珍贵的考古资源。深化对甲骨文的研究,深入挖掘其历史底蕴和文化内涵,不仅可以增强中华民族的文化自信和历史认同,也是推动文化自强,塑造社会主义文化新辉煌,以及建设社会主义文化强国的必经之路。

2、自2016年起,中国文字博物馆在《光明日报》上两次发布“奖励公告”,奖励对甲骨文考释有重大贡献的专家学者。虽然国家大力推动甲骨文的研究工作,且越来越多的专家学者投入到甲骨文研究中,社会关注度也在逐渐提高,但由于甲骨文破译的比例仍然很小,后续研究工作难以开展,甲骨文的释译工作依旧是甲骨文研究工作的核心。

3、然而,目前甲骨文考释工作仍旧依赖古文字专家大量查阅古籍,运用推理和古籍证明等人工方法破译甲骨文。由于甲骨文的释义复杂,需要多维度的深度研究和大量的证据才能得到文字学家们的认可,传统方法的甲骨文考释工作费时又费力。


...

【技术保护点】

1.一种基于分类模型的甲骨文辅助破译分类方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于分类模型的甲骨文辅助破译分类方法,其特征在于,所述文字演变数据集中的字体图像均基于以下至少一种数据源构建:与甲骨文相关联的书籍,与金文、春秋文字、战国文字、隶书相关联的书籍和互联网数据,其中金文图片和所述甲骨文图像相似。

3.根据权利要求1或2所述的基于分类模型的甲骨文辅助破译分类方法,其特征在于,所述文字演变数据集中部分图片存在噪点和成片的黑色像素块,使用降噪网络进行数据集清洗;对于无法用降噪网络去除的噪点,则选择人工去除,从而得到干净的文字演变数据集。

...

【技术特征摘要】

1.一种基于分类模型的甲骨文辅助破译分类方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于分类模型的甲骨文辅助破译分类方法,其特征在于,所述文字演变数据集中的字体图像均基于以下至少一种数据源构建:与甲骨文相关联的书籍,与金文、春秋文字、战国文字、隶书相关联的书籍和互联网数据,其中金文图片和所述甲骨文图像相似。

3.根据权利要求1或2所述的基于分类模型的甲骨文辅助破译分类方法,其特征在于,所述文字演变数据集中部分图片存在噪点和成片的黑色像素块,使用降噪网络进行数据集清洗;对于无法用降噪网络去除的噪点,则选择人工去除,从而得到干净的文字演变数据集。

4.根据权利要求2所述的基于分类模型的甲骨文辅助破译分类方法,其中,文字演变数据集中至少包含9000组汉字对应的演变字体图片,其中9000组图片中包括5000个常用汉字的演变图片,除此之外,还包括一定量生僻汉字;使用该9000组汉字图片训练甲骨文辅助破译分类网络。

5.根据权利要求1或2所述的基于...

【专利技术属性】
技术研发人员:万金鹏管海粟匡嚞玢张凯乐王鹏杰陈文炳刘禹良金连文白翔
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1