当前位置: 首页 > 专利查询>浙江大学专利>正文

一种计算机模仿汉字手写笔迹的方法技术

技术编号:2952434 阅读:3241 留言:1更新日期:2012-04-11 18:40
本发明专利技术公开了一种计算机模仿汉字手写笔迹的方法。采用计算机图像处理和人工智能的方法,可以实现由计算机来学习并模仿个人手写笔迹。该方法预先对已有的个人手写体汉字样本进行了笔划分解与分类,对每个用户写过的每个笔划、部首、整字以及字体内部空间结构都进行了统一的参数化,并连同几种常用字体,由此建立了个人手写字体数据库;在模仿个人手写字迹的时候,首先将待模仿汉字分解成部首或笔划,并逐一在个人手写字体数据库中找到每个部首或笔划,并按照该个人的字体内部空间结构特征将各部首或笔划重组起来,作为模仿字迹输出。本发明专利技术直接从汉字的笔划偏旁构成规则上进行分析,从而更加本质的抓住了个人笔迹的特征,更好的模仿个人笔迹。

【技术实现步骤摘要】

本专利技术涉及计算机艺术与美学以及人工智能领域,尤其涉及一种计算机模仿 汉字手写笔迹的方法。
技术介绍
已经有大量的工作来模拟人类的艺术思维,并进一步建立计算机智能系统以解决真实世界里的问题。在中文字方面,1995年的Proceedings of the International Conference on Computer Processing of Oriental Languages (ICCPOL)会议论文集 (文章标题"Chinese glyph generation using character composition and beauty evaluation metrics")公布了 一个使用启发式的方法来尝试定量评估中文字体美感 的问题他们定义了在汉字写作里的四条规则,并实现到了他们基于规则的美 学评分模块中;这一模块简单地对四条规则逐一计算相应的分数,并得到他们 的加权和。2005年的IEEE Intelligent Systems杂志(文章标题"Automatic generation of artistic Chinese calligraphy",以下简称文献IS2005)刊登了一个中 国艺术书法的自动生成系统。但是,他们的工作主要关注在使用基于约束的推 理来生成格式化的中文字体,而几乎没有关注到这些生成结果如何具有美感。为了获得更好的计算机中文字体生成结果,也为了尝试对美学做定量计算, 我们通过学习基本数值关系背后的训练集从而实现了汉字美观度评分。许多在 工作中使用过专家系统的人知道,高级的专家规则并不总能正常工作;而有时 这并不一定是由于专家系统本身的知识盲点,或者问题根本无法总结。因此我 们觉得,我们基于学习技术的数据驱动方法可以提供一种比人类专家的大脑评 测更好的机器评价能力。在绘画方面,计算机图形学领域中同样有一些研究自动绘画创作的工作, 但这大都是在给定一幅照片的基础上完成的。其他也有人探索了结合人工智能 和人机交互技术来创作绘画风格的动画,如2006年ACM学报ACM Trans. Graph 干'J登的文章"Animating Chinese paintings through stroke-based decomposition,,用笔 划分解的方法来实现动态的绘画。在视觉艺术领域之外,计算机音乐是另一个 应用人工智能技术来进行或协助创作的成功方向。在2007年的国际人工智能联 合大会(IJCAI2007)上,有一个独立的专题叫音乐人工智能(MUSIC-AI2007) 来专门研讨这一话题。值得注意的是,对于计算机音乐的研究包括自动音乐创 作与音乐评价,这与我们在中文字体上的思路比较相似。此外还有其他大量的研究工作如故事创作,可信执法官,互动式故事,等等,都旨在捕捉美学的可计算性。
技术实现思路
本专利技术的目的是克服现有技术的不足,提供一种计算机模仿汉字手写笔迹 的方法。计算机模仿汉字手写笔迹的方法包括以下步骤1) 预先对已有个人手写体汉字样本进行笔划分解与分类,对每个用户写过 的每个笔划、部首、整字以及字体内部空间结构都进行了统一的参数化,并连 同几种常用字体,建立个人手写字体数据库;2) 对待模仿汉字,在其对应的楷体字上做笔划分解以及参数化;3) 逐一根据个人手写字体数据库构造待模仿汉字的各个部首或笔划;4) 根据个人手写字体数据库模仿待模仿汉字的内部空间结构,将模仿得到 的各个部首或笔划拼接成完整的汉字,作为模仿字迹结果;若有多个备选方案, 则择一作为模仿字迹结果。所述的预先对已有个人手写体汉字样本进行笔划分解与分类,对每个用户 写过的每个笔划、部首、整字以及字体内部空间结构都进行了统一的参数化, 并连同几种常用字体,建立个人手写字体数据库步骤(1) 对每个已有的个人手写体汉字图像,对其做细化,笔划分解,提取出其 轨迹与书写宽度特征,以参数向量的形式表示每个汉字;(2) 根据步骤(l)所得的参数向量,将每个汉字按整字、部首、笔划组织成层 次式的树形结构表示;树形结构中的每一个节点都表示了个人书写笔迹中的一 个单字或部首或笔划,每个单字或部首的各个子部分都是其对应节点的子节点;(3) 在步骤(2)所得树形结构中,对每一节点的单字或部首,计算出其内部空 间结构的参数化矩阵。所述的对每个已有的个人手写体汉字图像,对其做细化,笔划分解,提取 出其轨迹与书写宽度特征,以参数向量的形式表示每个汉字步骤a) 对汉字图像做细化处理,以获得该字的骨架图像;b) 将该字与其标准楷书字体做笔划匹配,用启发式搜索的方法找出骨架各 部分与标准笔划的一一对应关系,完成骨架上的笔划分解;c) 对每笔划上的各骨架点,以其为圆心画椭圆,使该椭圆尽量大而又不包 含任何原字体图像上的空白部分,该笔划的所有椭圆区域总和即为笔划分解所 得的图像轮廓;d) 将所有椭圆的长短轴、圆心坐标列为一个矩阵,即为该字体的参数向量。 所述的在步骤(2)所得树形结构中,对每一节点的单字或部首,计算出其内部空间结构的参数化矩阵步骤-e) 对每个单字或部首的各个子部分部首或笔划作出其范围矩形,即在二 维平面上包含该字部分且边框平行于x轴与y轴的面积最小矩形;f) 计算每两个子部分的范围矩形之间的相互空间位置,即对每两个范围矩 瓜;;哲。/门^t:ik亚nx古"tm "t^i古茲加ZV ^G^旦^"66HH水县ZVSi1^41 dl d"-设该单字或部首共有n个子部分,则得到一个nxn的矩阵,其中每个矩阵元素为 一个二元组(Bh,Bv),即该单字或部首的内部空间结构的参数化矩阵。所述的对待模仿汉字,在其对应的楷体字上做笔划分解以及参数化步骤(4) 对该待模仿汉字,如权利要求3所述,对其做细化,笔划分解,提取出 其轨迹与书写宽度特征,以参数向量的形式表示每个汉字;(5) 对该待模仿汉字,如权利要求4所述,计算出其内部空间结构的参数化 矩阵。所述的逐一根据个人手写字体数据库构造待模仿汉字的各个部首或笔划步(6) 枚举该汉字所有可能的部首级与笔划级的子部分划分方案;C7)对步骤(6)中的每一种子部分划分方案,对方案中的各个子部分,在个人 手写字体数据库中查找该子部分是否在该个人已有笔迹中出现;若有,则选出 所有该子部分的笔迹作为候选,若已有笔迹不足5 10个,则随机以常用字体 的该子部分补足;(8) 为步骤(7)中的每个子部分的每个候选,计算其子部分仿写可靠度;若该 候选笔迹来源于该个人,则该候选的子部分仿写可靠度为1,否则为0;(9) 为步骤(6)中的每一种子部分划分方案,计算其仿写可靠度;设按该方案, 待仿写汉字由n个子部分构成,则该方案的仿写可靠度 乂=^1八1+"^+...+乂11^,其中^^2,...^分别为该方案下各个子部分的子部分 仿写可靠度,Al,A2,…,An为在待仿写汉字的标准楷体字中,各个子部分范围矩 形所占面积在整字范围矩形所占面积的比例;(10) 为每一种子部分划分方案选出仿写可靠度最高的一组仿写结果。 所述的根据个人手写字体数据库模仿待模仿汉字的内部空间结构,据此将模仿得到的各个部首或笔划拼接成完整的汉字,作为模仿字迹结果;若有多个 备选方案,则择一作为模仿字迹结果步骤(11) 本文档来自技高网
...

【技术保护点】
一种计算机模仿汉字手写笔迹的方法,其特征在于包括以下步骤: 1)预先对已有个人手写体汉字样本进行笔划分解与分类,对每个用户写过的每个笔划、部首、整字以及字体内部空间结构都进行了统一的参数化,并连同几种常用字体,建立个人手写字体数据库; 2)对待模仿汉字,在其对应的楷体字上做笔划分解以及参数化; 3)逐一根据个人手写字体数据库构造待模仿汉字的各个部首或笔划; 4)根据个人手写字体数据库模仿待模仿汉字的内部空间结构,将模仿得到的各个部首或笔划拼接成完整的汉字,作为模仿字迹结果;若有多个备选方案,则择一作为模仿字迹结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:徐颂华江浩金涛刘智满潘云鹤
申请(专利权)人:浙江大学
类型:发明
国别省市:86[中国|杭州]

网友询问留言 已有1条评论
  • 来自[未知地区] 2012年06月17日 13:36
    我希望购买这个专利产品或加盟,我的电话是:18793666688
    0
1