字体分类预测方法及系统技术方案

技术编号：27879885 阅读：26 留言：0更新日期：2021-03-31 01:12

本发明专利技术公开了一种字体分类预测方法及系统，所述方法包括以下步骤：S1，数据集准备，即收集并转化多种字体的样本，通过字符分割网络得到单个字符图片，确定每个字符的最小外接矩形，作为单个标准的样本；S2，数据采样，先选定N类样本中的1类作为基准样本集，通过模板匹配计算剩余N‑1类样本集和基准样本集的相似度，选择前M个样本作为一个批大小，循环采样训练；S3，确定网络结构、网络参数和损失函数，样本输入网络进行训练；S4，网络模型验证及测试，得到预测分类结果。根据本发明专利技术的方法，具有应用前景广泛、网络泛化能力更强的优势。

全部详细技术资料下载

【技术实现步骤摘要】
字体分类预测方法及系统
本专利技术涉及字体分类
，尤其是涉及一种字体分类预测方法及系统。
技术介绍
目前，由于中文字体的分类标准没有体系，且应用场景不多，现阶段的字体分类技术主要用深度学习算法解决古字体分类问题，但在现有技术中，存在对应字体的样本不够广泛、难以获取且无实际应用背景的问题，因此，上述技术存在改进空间。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题之一。为此，本专利技术的一个目的在于提出一种字体分类预测方法，所述字体分类预测方法，具有应用前景广泛、网络泛化能力更强的优势。本专利技术还提出了一种具有上述字体分类预测方法的系统。根据本专利技术实施例的字体分类预测方法，包括以下步骤：S1，数据集准备，即收集并转化多种字体的样本，通过字符分割网络得到单个字符图片，确定每个字符的最小外接矩形，作为单个标准的样本；S2，对N类样本进行数据采样，即选定N类样本中的1类作为基准样本，通过模板匹配计算剩余N-1类样本集和基准样本集的相似度，选择前M个样本作为一个批大小，循环采样训练；S3，确定网络结构、网络参数和损失函数，输入样本进行网络训练；S4，网络验证及测试，得到预测分类结果。根据本专利技术的字体分类预测方法，具有应用前景广泛、网络泛化能力更强的优势。根据本专利技术一个实施例的字体分类预测方法，在步骤S1中，多种字体包括：宋体、仿宋、楷体和黑体。根据本专利技术一个实施例的字体分类预测方法，在步骤S2中，对...

【技术保护点】
1.一种字体分类预测方法，其特征在于，包括以下步骤：/nS1，数据集准备，即收集并转化多种字体的样本，通过字符分割网络得到单个字符图片，确定每个字符的最小外接矩形，作为单个标准的样本；/nS2，对N类样本进行数据采样，选定N类样本中的1类作为基准样本，通过模板匹配计算剩余N-1类样本集和基准样本集的相似度，选择前M个样本作为一个批大小，循环采样训练；/nS3，确定网络结构、网络参数和损失函数，输入样本进行网络训练；/nS4，网络验证及测试，得到预测分类结果。/n

【技术特征摘要】
1.一种字体分类预测方法，其特征在于，包括以下步骤：
S1，数据集准备，即收集并转化多种字体的样本，通过字符分割网络得到单个字符图片，确定每个字符的最小外接矩形，作为单个标准的样本；
S2，对N类样本进行数据采样，选定N类样本中的1类作为基准样本，通过模板匹配计算剩余N-1类样本集和基准样本集的相似度，选择前M个样本作为一个批大小，循环采样训练；
S3，确定网络结构、网络参数和损失函数，输入样本进行网络训练；
S4，网络验证及测试，得到预测分类结果。

2.根据权利要求1所述的字体分类预测方法，其特征在于，在步骤S1中，多种字体包括：宋体、仿宋、楷体和黑体。

3.根据权利要求1所述的字体分类预测方法，其特征在于，在步骤S2中，对N类样本进行数据采样的方式为在线采样方式。

4.根据权利要求1所述的字体分类预测方法，其特征在于，在步骤S3中，网络结构采用卷积神经网络，卷积神经网络由卷积层、池化层以及全连接层组成。

5.根据权利要求4所述的字体分类预测方法，其特征在于，采用深度学习算法对卷积神经网络进行训练。

...

【专利技术属性】
技术研发人员：田辉，刘其开，
申请(专利权)人：合肥高维数据技术有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人