System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及古文字识别,更具体的说是涉及一种基于大数据分析的文字识别释义系统。
技术介绍
1、目前随着考古工作的发展对于很多出图的竹简、书画、印章、对联以及牌匾的文物,由于随着时间还所存地址的影响,造成文物上的文字会出现缺失或碳化,导致在发掘出文物后需要通过保存并运送至实验室中,经专家进行文字的提取和释义,以获取文物中记载的内容。随着科技的发展和对文物更好的保护,也有一些扫描设备对文物中的内容进行扫描并上传终端,使得专家能够通过终端快速的对文物中的文字进行识别释义。
2、现有公开号为cn113837186a的专利技术专利公开了一种基于卷积神经网络的东巴象形文字识别方法及装置。基于卷积神经网络的东巴象形文字识别方法包括:获取待识别图像,待识别图像中包括东巴象形文字;基于深度残差网络模型对待识别图像进行特征识别,得到东巴象形文字对应的文字释义,深度残差网络模型包括至少一个残差跳跃连接结构,残差跳跃连接结构包括多个相邻堆叠的卷积层。
3、上述现有技术中虽然公开了通过卷积神经网络对古文进行识别并释义的方法,这种方法虽然能够对古文进行释义,但是在对文字出现残缺或字段出现残缺时并不能很好的对古文字进行文字匹配和字段释义,对此一种通过大数据的分析对文字进行识别并释义的系统和终端设备亟待解决。
技术实现思路
1、针对现有技术存在的不足,本专利技术的目的在于提供一种基于大数据分析的文字识别释义系统,具有对文字进行识别并对缺失部分进行填补,以及对文字进行线上识别释义的效果。<
...【技术保护点】
1.一种基于大数据分析的文字识别释义系统,其特征在于,包括:
2.根据权利要求1所述的一种基于大数据分析的文字识别释义系统,其特征在于:所述编排编排策略包括识别逻辑,识别逻辑具体包括:
3.根据权利要求2所述的一种基于大数据分析的文字识别释义系统,其特征在于:所述识别逻辑还包括:
4.根据权利要求3所述的一种基于大数据分析的文字识别释义系统,其特征在于:所述编排策略还包括编号逻辑,所述编号逻辑具体包括:
5.根据权利要求4所述的一种基于大数据分析的文字识别释义系统,其特征在于:所述编号逻辑还包括:
6.根据权利要求5所述的一种基于大数据分析的文字识别释义系统,其特征在于:所述组合模块内配置有组合策略,所述组合策略包括调取归类数据并提取归类数据中的文物图像,对文物图像进行编号形成带有标号的编排图像;
7.根据权利要求6所述的一种基于大数据分析的文字识别释义系统,其特征在于:所述连串释义策略包括组合逻辑和匹配逻辑,所述组合逻辑包括提取编排图像的首段内容和末端内容,根据提取到的字段结合古文字体和释义内容形成释义语段
8.根据权利要求7所述的一种基于大数据分析的文字识别释义系统,其特征在于:所述语义匹配算法具体为,将释义的字段向量组成一个语义矩阵,该矩阵是一个多维向量,采用余弦相似度方式计算释义字段语义矩阵A=[a1,a2,…,an],古文数据的释义矩阵B=[b1,b2,…,bm]的相似度,计算公式如下:
9.根据权利要求8所述的一种基于大数据分析的文字识别释义系统,其特征在于:所述对释义字段和释义要素的相似度进行加权求和:
10.根据权利要求1至9中任意一项所述的一种基于大数据分析的文字识别释义系统,其特征在于:所述释义模块内还配置有字义模型,所述损失释义策略具体包括:
...【技术特征摘要】
1.一种基于大数据分析的文字识别释义系统,其特征在于,包括:
2.根据权利要求1所述的一种基于大数据分析的文字识别释义系统,其特征在于:所述编排编排策略包括识别逻辑,识别逻辑具体包括:
3.根据权利要求2所述的一种基于大数据分析的文字识别释义系统,其特征在于:所述识别逻辑还包括:
4.根据权利要求3所述的一种基于大数据分析的文字识别释义系统,其特征在于:所述编排策略还包括编号逻辑,所述编号逻辑具体包括:
5.根据权利要求4所述的一种基于大数据分析的文字识别释义系统,其特征在于:所述编号逻辑还包括:
6.根据权利要求5所述的一种基于大数据分析的文字识别释义系统,其特征在于:所述组合模块内配置有组合策略,所述组合策略包括调取归类数据并提取归类数据中的文物图像,对文物图像进行编号形成带有标号的编排图像;
7.根据权利要求6所述的一种基于大数据分析的文字识...
【专利技术属性】
技术研发人员:王益飞,沈春波,程建东,
申请(专利权)人:宁波栎行科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。