System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机,尤其涉及一种文字图片的处理方法、装置以及存储介质。
技术介绍
1、随着互联网技术的迅速发展,人们对媒体内容的多样化要求越来越高。设计图即为一种即包含文字内容又包含图像内容的媒体内容,如何进行高效的大规模的文字图片的生成过程成为难题。
2、一般,可以通过人工来对设计图中的文案进行修改,从而批量化的生成文字图片。
3、但是,在海量图文数据需要扩展的场景中,通过人工修改进行文字图片扩展的过程无法符合场景需求,影响文字图片的扩展效率。
技术实现思路
1、有鉴于此,本申请提供一种文字图片的处理方法,可以有效提高文字图片的扩展效率。
2、本申请第一方面提供一种文字图片的处理方法,可以应用于终端设备中包含文字图片的处理功能的系统或程序中,具体包括:
3、获取第一文字图片,所述第一文字图片包括图像图层和文字图层;
4、对所述文字图层中的内容进行提取,以得到第一文字信息;
5、基于预设维度对所述第一文字信息进行相似度匹配,以从文案数据库中提取与所述第一文字信息相似的第二文字信息,所述文案数据库中的数据基于所述预设维度标注所得;
6、基于所述第二文字信息对所述文字图层中的内容进行替换;
7、对替换后的文字图层和所述图像图层进行结合,以得到第二文字图片。
8、可选的,在本申请一些可能的实现方式中,所述对所述文字图层中的内容进行提取,以得到第一文字信息,包括:
9、确定
10、对所述源文件中的图层分布进行解析,以确定所述文字图层;
11、对所述文字图层中的文字元素进行提取,以得到所述第一文字信息。
12、可选的,在本申请一些可能的实现方式中,所述基于预设维度对所述第一文字信息进行相似度匹配,以从文案数据库中提取与所述第一文字信息相似的第二文字信息,包括:
13、基于所述预设维度确定所述第一文字信息中的文本内容以及所述第一文字信息对应的主题内容;
14、确定所述文本内容中的字数信息和标点信息;
15、基于所述主题内容中的文本内容进行文本识别,以得到所述主题内容对应的标签信息,以及所述主题内容对应的情感信息;
16、根据所述字数信息、所述标点信息、所述标签信息和所述情感信息在所述文案数据库中进行文案相似度匹配,以得到与所述第一文字信息相似的第二文字信息。
17、可选的,在本申请一些可能的实现方式中,所述根据所述字数信息、所述标点信息、所述标签信息和所述情感信息在所述文案数据库中进行文案相似度匹配,以得到与所述第一文字信息相似的第二文字信息,包括:
18、获取针对于第一文字图片的展示侧重所配置的扩展需求信息;
19、根据所述扩展需求信息对所述字数信息、所述标点信息、所述标签信息和所述情感信息进行权重配置,以得到权重信息;
20、根据所述字数信息、所述标点信息、所述标签信息和所述情感信息在所述文案数据库中进行文案相似度匹配,以得到第一匹配信息;
21、基于所述权重信息对所述第一匹配信息进行加权计算,以得到第二匹配信息;
22、根据所述第二匹配信息对应的匹配度数值确定与所述第一文字信息相似的第二文字信息。
23、可选的,在本申请一些可能的实现方式中,所述基于预设维度对所述第一文字信息进行相似度匹配,以从文案数据库中提取与所述第一文字信息相似的第二文字信息之前,所述方法还包括:
24、基于所述预设维度对候选文字信息进行标注,以得到标注了样本标签的训练样本;
25、根据所述标注了样本标签的训练样本对所述文案数据库中配置的深度神经网络进行训练;
26、响应于未标注数据输入所述文案数据库,调用训练后的所述深度神经网络基于所述预设维度对所述未标注数据进行标注。
27、可选的,在本申请一些可能的实现方式中,所述方法还包括:
28、确定所述训练样本对应的训练标签;
29、基于所述训练标签在资源池进行资源爬取,以得到扩展数据;
30、调用训练后的所述深度神经网络对所述扩展数据基于所述预设维度进行标注,以得到扩展文字信息;
31、将所述扩展文字信息写入所述文案数据库。
32、可选的,在本申请一些可能的实现方式中,所述基于所述第二文字信息对所述文字图层中的内容进行替换,包括:
33、获取所述第二文字信息对应的历史信息;
34、基于所述历史信息中的信息使用记录对所述第二文字信息的使用次数进行统计,以确定所述第二文字信息对应的使用频次信息;
35、若所述频次信息满足替换条件,则基于所述第二文字信息对所述文字图层中的内容进行替换。
36、本申请第二方面提供一种文字图片的处理装置,包括:
37、获取单元,用于获取第一文字图片,所述第一文字图片包括图像图层和文字图层;
38、提取单元,用于对所述文字图层中的内容进行提取,以得到第一文字信息;
39、处理单元,用于基于预设维度对所述第一文字信息进行相似度匹配,以从文案数据库中提取与所述第一文字信息相似的第二文字信息,所述文案数据库中的数据基于所述预设维度标注所得;
40、所述处理单元,还用于基于所述第二文字信息对所述文字图层中的内容进行替换;
41、所述处理单元,还用于对替换后的文字图层和所述图像图层进行结合,以得到第二文字图片。
42、可选的,在本申请一些可能的实现方式中,所述提取单元,具体用于确定所述第一文字图片对应的源文件;
43、所述提取单元,具体用于对所述源文件中的图层分布进行解析,以确定所述文字图层;
44、所述提取单元,具体用于对所述文字图层中的文字元素进行提取,以得到所述第一文字信息。
45、可选的,在本申请一些可能的实现方式中,所述处理单元,具体用于基于所述预设维度确定所述第一文字信息中的文本内容以及所述第一文字信息对应的主题内容;
46、所述处理单元,具体用于确定所述文本内容中的字数信息和标点信息;
47、所述处理单元,具体用于基于所述主题内容中的文本内容进行文本识别,以得到所述主题内容对应的标签信息,以及所述主题内容对应的情感信息;
48、所述处理单元,具体用于根据所述字数信息、所述标点信息、所述标签信息和所述情感信息在所述文案数据库中进行文案相似度匹配,以得到与所述第一文字信息相似的第二文字信息。
49、可选的,在本申请一些可能的实现方式中,所述处理单元,具体用于获取针对于第一文字图片的展示侧重所配置的扩展需求信息;
50、所述处理单元,具体用于根据所述扩展需求信息对所述字数信息、所述标点信息、所述标签信息和所述情感信息进行权重配置,以得到权重信息;本文档来自技高网...
【技术保护点】
1.一种文字图片的处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述文字图层中的内容进行提取,以得到第一文字信息,包括:
3.根据权利要求1所述的方法,其特征在于,所述基于预设维度对所述第一文字信息进行相似度匹配,以从文案数据库中提取与所述第一文字信息相似的第二文字信息,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据所述字数信息、所述标点信息、所述标签信息和所述情感信息在所述文案数据库中进行文案相似度匹配,以得到与所述第一文字信息相似的第二文字信息,包括:
5.根据权利要求1所述的方法,其特征在于,所述基于预设维度对所述第一文字信息进行相似度匹配,以从文案数据库中提取与所述第一文字信息相似的第二文字信息之前,所述方法还包括:
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
7.根据权利要求1所述的方法,其特征在于,所述基于所述第二文字信息对所述文字图层中的内容进行替换,包括:
8.一种文字图片的处理装置,其特征在于,包括:
9.一
10.一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令存储于计算机可读存储介质,其特征在于,所述计算机可读存储介质中的所述计算机程序/指令被处理器执行时实现上述权利要求1至7任一项所述的文字图片的处理方法的步骤。
...【技术特征摘要】
1.一种文字图片的处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述文字图层中的内容进行提取,以得到第一文字信息,包括:
3.根据权利要求1所述的方法,其特征在于,所述基于预设维度对所述第一文字信息进行相似度匹配,以从文案数据库中提取与所述第一文字信息相似的第二文字信息,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据所述字数信息、所述标点信息、所述标签信息和所述情感信息在所述文案数据库中进行文案相似度匹配,以得到与所述第一文字信息相似的第二文字信息,包括:
5.根据权利要求1所述的方法,其特征在于,所述基于预设维度对所述第一文字信息进行相似度匹配,以...
【专利技术属性】
技术研发人员:赵奕涵,
申请(专利权)人:腾讯科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。