一种字库样本自动生成方法、计算机装置及可读存储介质制造方法及图纸

技术编号:20845909 阅读:25 留言:0更新日期:2019-04-13 09:05
本发明专利技术适用于计算机领域,提供了一种字库样本自动生成方法、计算机装置及可读存储介质,该方法包括:采集待训练的字符或者句子;根据选定或者新设计的字体,对待训练的字符或者句子进行处理,生成对应的字体位图;根据需要对字体位图进行相应的变换处理,得到第一字体位图;将第一字体位图与选取的场景图片进行叠加处理,并进行仿真处理,最终生成相应的字库样本。本发明专利技术方法,根据选定或新设计的字体,对待训练的内容进行处理,并经过变换、背景叠加和后期仿真处理,最终生成字库样本,即借助计算机自动生成大量的字库样本,缩短了字库样本的制作周期,节省了人力资源和成本,满足了训练样本量的需求,训练出来的字库样本与真实样本差距较小。

【技术实现步骤摘要】
一种字库样本自动生成方法、计算机装置及可读存储介质
本专利技术属于计算机领域,尤其涉及一种字库样本自动生成方法、计算机装置及可读存储介质。
技术介绍
随着智能终端以及移动互联网的飞速发展,人们的日常生活中会接触到各种各样的字库。而这些字库,大多是由专业的字库设计团队,人工设计,逐字制作而成,耗费大量的人力物力,成本高昂。由于现有的字库制作方法大多依赖于人工经验和设计,自动化程度很低,因此,生成的字库样本量十分少。这使得在使用深度学习神经网络模型对字库样本进行训练时,常常因训练的样本量太少而使得训练出来的样本与真实的样本之间存在较大差距的问题。由此可见,现有字库生成方法仍需要借助人工设计制作,制作周期长、成本高,且无法满足深度学习神经网络模型的训练样本量需求,使得训练出来的字库样本与真实样本差距较大。
技术实现思路
本专利技术实施例提供一种字库样本自动生成方法,旨在解决现有字库生成方法仍需要借助人工设计制作,制作周期长、成本高,且无法满足深度学习神经网络模型的训练样本量需求,使得训练出来的字库样本与真实样本差距较大的问题。本专利技术实施例是这样实现的,一种字库样本自动生成方法,包括如下步骤:采集待训练的字符或者句子;根据选定或者新设计的字体,对待训练的所述字符或者句子进行处理,生成对应的字体位图;根据需要对所述字体位图进行相应的变换处理,得到第一字体位图;将所述第一字体位图与选取的场景图片进行叠加处理,并进行仿真处理,最终生成相应的字库样本。本专利技术实施例还提供一种计算机装置,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述字库样本自动生成方法的各步骤。本专利技术实施例还提供计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述字库样本自动生成方法的各步骤。本专利技术实施例提供的字库样本自动生成方法,通过计算机采集待训练的字符或者句子,并根据选定或者新设计的字体,对待训练的字符或者句子进行处理,生成对应的字体位图,同时可根据需要对字体位图进行相应的变换处理,得到第一字体位图;并对第一字体位图与选取的场景图片进行叠加、后期仿真处理,得到相应的字库样本。其借助计算机自动生成大量的字库样本,缩短了字库样本的制作周期,节省了人力资源和成本,满足了训练样本量的需求,训练出来的字库样本与真实样本差距较小。附图说明图1是本专利技术实施例一提供的字库样本自动生成方法的实现流程图;图2是本专利技术实施例二提供的字库样本自动生成方法的实现流程图;图3是本专利技术实施例三提供的字库样本自动生成方法的实现流程图;图4是本专利技术实施例四提供的字库样本自动生成方法的实现流程图;图5是本专利技术实施例五提供的字库样本自动生成方法的实现流程图;图6是本专利技术实施例六提供的字库样本自动生成方法的实现流程图;图7是本专利技术实施例七提供的字库样本自动生成装置的结构示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。在本专利技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本专利技术。在本专利技术实施例和所附权利要求书中所使用的单数形式的“一种”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一字体位图称为第二字体位图,且类似地,可将第二字体位图称为第一字体位图。为了进一步阐述本专利技术为实现预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术的具体实施方式、结构、特征及其功效,详细说明如下。本专利技术实施例提供的字库样本自动生成方法,根据选定或新设计的字体,对待训练的内容进行处理,并经过变换、背景叠加和后期仿真处理,最终生成字库样本,即借助计算机自动生成大量的字库样本,缩短了字库样本的制作周期,节省了人力资源和成本,满足了训练样本量的需求,训练出来的字库样本与真实样本差距较小。图1示出了本专利技术实施例一提供的字库样本自动生成方法的实现流程,详述如下:在步骤S101中,采集待训练的字符或者句子。在本专利技术实施例中,字符,是指计算机中使用的字母、数字、字和符号,包括:1、2、3、A、B、C、~!•#¥%……—*()—+等等。采集待训练的字符可以是字母、数字、字和符号中的其中一种或者其任意组合,字符的数量可以是单个,也可以是多个。句子,是语言运用的基本单位,它由词、词组(短语)构成,能表达一个完整的意思,如告诉别人一件事,提出一个问题,表示要求或者制止,表示某种感慨,表示对一段话的延续或省略。句子和句子中间有较大停顿。它的结尾应该用上句号、问号、省略号、或感叹号。为了把意思表达清楚,一般常用的句子包括两部分:一部分是句子里说的“谁”或“什么”(主语部分);另一部分是句子里说的“是什么”“怎么样”或“做什么”(谓语部分)。例如,待训练的句子可为‘我要去超市买苹果。’等。在步骤S102中,根据选定或者新设计的字体,对待训练的字符或者句子进行处理,生成对应的字体位图。在本专利技术实施例中,所谓“字体”(typeface)与“字型”(font),都是排印学与书法领域的专有名词。font是指某套具有同样样式、尺寸的字形;typeface则是一或多个font在一或多个尺寸的集合。中国国家标准(GB/T16964.1-1997,为国际标准的官方翻译)将typeface译为“字体名称”,font译为“字型”。专业人士也将typeface译为“字体”。一般可将typeface译为“字体”,font译为“字型”。篆书、隶书、燕体、楷书、草书、宋体、仿宋体、黑体等分别是某类相似风格(也称“书体”)的许多个字体的集合,而不是一种字体。两位书法家写出来的楷书就可称为两种字体;宋体在电脑上就有中易宋体和新细明体等字体。在本专利技术的一个实施例中,假设待训练的内容为用户手写输入的‘新疆的哈密瓜又甜又爽口’,而选定的字体为宋体,那么根据选定的宋体,对手写输入的‘新疆的哈密瓜又甜又爽口’这串字符进行处理,生成对应的字体位图。其中,字体位图,即字体图片,位图有像素,像素越大照片越清晰,像素越小图像越模糊,并且放大会有马赛克的方块,精度小的图像马赛克很大。在步骤S103中,根据需要对字体位图进行相应的变换处理,得到第一字体位图。在本专利技术实施例中,在实际应用中,不同的应用场合,对于字符的排布规则、大小等都有不同的要求。例如,对于用在身份证上的文字是有特定的要求的—身份证正面的‘姓名’、‘性别’、‘民族’、‘出生年月日’、‘住址’、‘公民身份证号码’这几个项目的标题字体都为6号黑体字。根据不同的应用场合,对上述训练得到的字体位图按要求进行排布和改变字体大小等处理,得到第一字体位图。在步骤S104中,将第一字体位图与选取的场景图片进行叠加处理,并进行仿真处理,最终生成相应的字库样本。在本专利技术实施例中,结合上述实施例本文档来自技高网...

【技术保护点】
1.一种字库样本自动生成方法,其特征在于,包括如下步骤:采集待训练的字符或者句子;根据选定或者新设计的字体,对待训练的所述字符或者句子进行处理,生成对应的字体位图;根据需要对所述字体位图进行相应的变换处理,得到第一字体位图;将所述第一字体位图与选取的场景图片进行叠加处理,并进行仿真处理,最终生成相应的字库样本。

【技术特征摘要】
1.一种字库样本自动生成方法,其特征在于,包括如下步骤:采集待训练的字符或者句子;根据选定或者新设计的字体,对待训练的所述字符或者句子进行处理,生成对应的字体位图;根据需要对所述字体位图进行相应的变换处理,得到第一字体位图;将所述第一字体位图与选取的场景图片进行叠加处理,并进行仿真处理,最终生成相应的字库样本。2.如权利要求1所述的字库样本自动生成方法,其特征在于,所述根据选定或者新设计的字体,对待训练的所述字符或者句子进行处理,生成对应的字体位图,包括:根据特定的应用场景选定对应的字体,对待训练的所述字符或者句子进行处理,生成对应的字体位图。3.如权利要求1所述的字库样本自动生成方法,其特征在于,所述根据新设计的字体,对待训练的所述字符或者句子进行处理,生成对应的字体位图,包括:根据特定的应用场景采用字体编辑软件设计新的字体,基于新设计的字体对待训练的所述字符或者句子进行处理,生成对应的字体位图。4.如权利要求1所述的字库样本自动生成方法,其特征在于,所述根据需要对所述字体位图进行相应的变换处理,得到第一字体位...

【专利技术属性】
技术研发人员:刘佳鹏
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1