一种产生个性化字库的方法技术

技术编号:45634999 阅读:26 留言:0更新日期:2025-06-27 18:43
本申请提供一种产生个性化字库的方法。该方法包括:收集已有字库中使用频率较高的已有汉字图片作为基础参考结构、并以图片中汉字的Unicode编码命名,每张已有汉字图片仅有一个汉字;采集若干目标个性化汉字图片、分别以其中汉字的Unicode命名,每张目标个性化汉字图片仅有一个汉字;联合Unicode命名相同的目标个性化汉字图片和所述现有字库中的汉字图片、对应的Unicode命名以及相应的txt标注文件以构建训练样本以对扩散模型进行加噪训练,以获取个性化汉字产生模型。基于所述个性化汉字产生模型产生相应的个性化汉字图片,以构建个性化字库。通过本发明专利技术提供的产生个性化字库的方法能够高效、低成本地产生个性化字库,满足不同游戏场景对字体的个性化要求。

【技术实现步骤摘要】

本申请涉及生成式ai的应用领域或者字库产生领域,具体涉及一种产生个性化字库的方法


技术介绍

1、目前,在计算机文本处理领域,通常提供若干经典的字库供用户选择,以便输入相关的文本信息。这些经典的字库包括“宋体”、“楷体”等,每一种字库中的汉字风格都统一。然而,随着游戏、大型社交app的发展,越来越多的用户希望在特定场景中采用个性化字库进行文本数据(例如,在大型游戏组队时进行信息传递),由此产生了大量对个性化字库的需求。

2、传统的字库产生方法需要利用软件对字库中的每个汉字进行逐一调整笔画、间距等,需要耗费相当的时间成本和人力成本,难以用于满足互联网特定场景下需要快速且多样化地产生个性化字库的需求。因此,提供一种快速、低成本的个性化字库产生方法具有现实意义和重要的商业价值。


技术实现思路

1、有鉴于此,本申请基于ai技术提供一种产生个性化字库的技术方案。期望通过所述技术方案能够快速、低成本地产生个性化字库以满足各种网络场景、各种用户使用个性化字库的需求。

2、本专利技术提供的技术方案实现本文档来自技高网...

【技术保护点】

1.一种产生个性化字库的方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述扩散模型为Unet中的去噪扩散模型DDPM。

3.如权利要求2所述的方法,其特征在于,所述对每张已有汉字图片中的汉字进行笔画标注,实现为:将汉字用到的32种笔画按1到32进行编号,每种笔画对应设置有相应的标注位,用于标注相关笔画在已有汉字图片的唯一汉字中用到的次数。

4.如权利要求3所述的方法,其特征在于,所述基于所有的所述训练样本对扩散模型进行训练,以获得个性化汉字产生模型,包括:

5.如权利要求4所述的方法,其特征在于,所述将每条训练样...

【技术特征摘要】

1.一种产生个性化字库的方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述扩散模型为unet中的去噪扩散模型ddpm。

3.如权利要求2所述的方法,其特征在于,所述对每张已有汉字图片中的汉字进行笔画标注,实现为:将汉字用到的32种笔画按1到32进行编号,每种笔画对应设置有相应的标注位,用于标注相关笔画在已有汉字图片的唯一汉字中用到的次数。

4.如权利要求3所述的方法,其特征在于,所述基于所有的所述训练样本对扩散模型进行训练,以获得个性化汉字产生模型,包括:

5.如权利要求4所述的方法,其特征在于,所述将每条训练样本输入unet中进行前向加噪训练,包括:设置前向加噪的步数,对训练样本中的已有汉字图片中添加高斯噪声。

...

【专利技术属性】
技术研发人员:李杰
申请(专利权)人:盛趣信息技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1