一种场景图像文本生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34446045 阅读:15 留言:0更新日期:2022-08-06 16:41
本发明专利技术提供了一种场景图像文本生成方法、装置、电子设备及存储介质,通过图像文本数据集的语料信息、背景图像库与字体库,快速生成大量的场景图像文本。不仅可以减少数据获取和标注难度,而且可以快速获取具有背景多样性和字体多样性图像,方便研发人员,进行模型训练和测试,不用受制于训练数据少,标注周期长等客观原因,从而提高OCR文本识别的泛化能力。从而提高OCR文本识别的泛化能力。从而提高OCR文本识别的泛化能力。

【技术实现步骤摘要】
一种场景图像文本生成方法、装置、电子设备及存储介质


[0001]本专利技术涉及计算机
,具体而言,涉及一种场景图像文本生成方法、装置、电子设备及存储介质。

技术介绍

[0002]随着社交、电商、短视频、直播等媒体快速发展,每天都有海量数据内容产生,尤其当前视频直播卖货和短视频购物如火如荼,相对于文本信息,基于图片和视频的视觉营销,更具有传播力度。如何从海量图片或者视频数据中,快速和准确提取文本信息,分析品牌属性,成为当前的重要任务之一。目前常见的方式主要使用通用文字识别技术,对互联网场景中网络图片,进行对艺术字体或背景复杂的文字内容识别,方便用户提取其中文本信息,进而使用NLP技术对这些文本信息进行分析处理,获取品牌相关内容信息。采用上述的方式,往往需要获取大量的场景图像文本数据样本进行训练和测试,才能取得理想的效果,而互联网场景中网络图片,具有背景复杂、遮挡与艺术字体等特点,要想获取足够数量的样本,研发人员往往需要花费大量人力和物力,进行数据获取和标注,浪费了大量的时间和精力。因此,如何更加高效的获取进行训练和测试需要的场景图像文本数据样本,是目前亟待解决的问题。

技术实现思路

[0003]为了改善上述问题,本专利技术提供了一种场景图像文本生成方法、装置、电子设备及存储介质。
[0004]本专利技术实施例的第一方面,提供了一种场景图像文本生成方法,所述方法包括:
[0005]收集美妆场景的文本信息,将各个美妆品牌名称作为关键字对收集到本文信息进行过滤,得到语料信息集;所述语料信息集包括第一语料信息和第二语料信息,将包含有美妆品牌名称的文本信息,作为第一语料信息,将不含有美妆品牌名称的文本信息,作为第二语料信息;
[0006]使用OpenCV生成不同颜色的RGB背景图像,得到背景图像库;
[0007]收集互联网场景中开源、免费或者公开的字体,得到字体库,对每种字体支持字符进行统计,得到支持字符列表和数目;
[0008]结合所述语料信息集、所述背景图像库和所述字体库,生成图像文本数据集;所述图像文本数据集包括多个场景图像文本,每个场景图像文本生成的方式为:
[0009]从所述第一语料信息中,随机选择一条文本信息作为生成图像本文的内容信息;
[0010]从所述背景图像库随机选择一张图像作为生成图像文本的背景图像;
[0011]从所述字体库中,随机选择一种字体;
[0012]综合所选择的内容信息、背景图像和字体,得到场景图像文本。
[0013]可选地,在所述从所述字体库中,随机选择一种字体的步骤之后,所述方法还包括:
[0014]按照所选择的内容信息的字符,依次计算每个字符字体颜色与所选择的背景图像的颜色的像素差值,并进行累加得到差值的和值;
[0015]判断和值是否大于预设的阈值,如果是,则选择当前字体作为候选字体,如果否,则重新进行字体的选择;
[0016]当所选择的内容信息中,包含有选择的字体不支持的字符时,采用预先设定的替代字符代替该不支持的字符。
[0017]可选地,所述方法还包括:
[0018]接收外部输入的生成控制指令,所述生成控制指令包括场景图像文本数、字符生成数、特定字符内容以及特定字符数。
[0019]可选地,所述方法包括:
[0020]在选择所述内容信息时,如果对应所述特定字符内容的特定字符在第一语料信息中的数量小于所述特定字符数,从第二语料信息中进行所述内容信息的选择;
[0021]当生成的特定字符总数量达到所述特定字符数时,该特定字符不再继续生成;
[0022]当生成的字符总数量达到所述字符生成数时,不再继续生成;
[0023]当生成的场景图像文本数量达到所述场景图像文本数时,不再继续生成。
[0024]本专利技术实施例的第二方面,提供了一种场景图像文本生成装置,所述装置包括:
[0025]语料信息生成单元,用于收集美妆场景的文本信息,将各个美妆品牌名称作为关键字对收集到本文信息进行过滤,得到语料信息集;所述语料信息集包括第一语料信息和第二语料信息,将包含有美妆品牌名称的文本信息,作为第一语料信息,将不含有美妆品牌名称的文本信息,作为第二语料信息;
[0026]图像库生成单元,用于使用OpenCV生成不同颜色的RGB背景图像,得到背景图像库;
[0027]字体库生成单元,用于收集互联网场景中开源、免费或者公开的字体,得到字体库,对每种字体支持字符进行统计,得到支持字符列表和数目;
[0028]场景图像文本生成单元,用于结合所述语料信息集、所述背景图像库和所述字体库,生成图像文本数据集;
[0029]所述图像文本数据集包括多个场景图像文本,所述场景图像文本生成单元包括:
[0030]文本信息选择子单元,用于从所述第一语料信息中,随机选择一条文本信息作为生成图像本文的内容信息;
[0031]背景图像选择子单元,用于从所述背景图像库随机选择一张图像作为生成图像文本的背景图像;
[0032]字体选择子单元,用于从所述字体库中,随机选择一种字体;
[0033]综合生成子单元,用于综合所选择的内容信息、背景图像和字体,得到场景图像文本。
[0034]可选地,所述字体选择子单元,还用于:
[0035]按照所选择的内容信息的字符,依次计算每个字符字体颜色与所选择的背景图像的颜色的像素差值,并进行累加得到差值的和值;
[0036]判断和值是否大于预设的阈值,如果是,则选择当前字体作为候选字体,如果否,则重新进行字体的选择;
[0037]所述综合生成子单元,还用于:
[0038]当所选择的内容信息中,包含有选择的字体不支持的字符时,采用预先设定的替代字符代替该不支持的字符。
[0039]可选地,所述装置还包括:
[0040]控制指令接收单元,用于接收外部输入的生成控制指令,所述生成控制指令包括场景图像文本数、字符生成数、特定字符内容以及特定字符数。
[0041]可选地,所述文本信息选择子单元,还用于:
[0042]在选择所述内容信息时,如果对应所述特定字符内容的特定字符在第一语料信息中的数量小于所述特定字符数,从第二语料信息中进行所述内容信息的选择;
[0043]所述综合生成子单元,还用于:
[0044]当生成的特定字符总数量达到所述特定字符数时,该特定字符不再继续生成;
[0045]当生成的字符总数量达到所述字符生成数时,不再继续生成;
[0046]当生成的场景图像文本数量达到所述场景图像文本数时,不再继续生成。
[0047]本专利技术实施例的第三方面,提供了一种电子设备,其特征在于,包括:
[0048]一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行如第一方面所述的方法。
...

【技术保护点】

【技术特征摘要】
1.一种场景图像文本生成方法,其特征在于,所述方法包括:收集美妆场景的文本信息,将各个美妆品牌名称作为关键字对收集到本文信息进行过滤,得到语料信息集;所述语料信息集包括第一语料信息和第二语料信息,将包含有美妆品牌名称的文本信息,作为第一语料信息,将不含有美妆品牌名称的文本信息,作为第二语料信息;使用OpenCV生成不同颜色的RGB背景图像,得到背景图像库;收集互联网场景中开源、免费或者公开的字体,得到字体库,对每种字体支持字符进行统计,得到支持字符列表和数目;结合所述语料信息集、所述背景图像库和所述字体库,生成图像文本数据集;所述图像文本数据集包括多个场景图像文本,每个场景图像文本生成的方式为:从所述第一语料信息中,随机选择一条文本信息作为生成图像本文的内容信息;从所述背景图像库随机选择一张图像作为生成图像文本的背景图像;从所述字体库中,随机选择一种字体;综合所选择的内容信息、背景图像和字体,得到场景图像文本。2.根据权利要求1所述的场景图像文本生成方法,其特征在于,在所述从所述字体库中,随机选择一种字体的步骤之后,所述方法还包括:按照所选择的内容信息的字符,依次计算每个字符字体颜色与所选择的背景图像的颜色的像素差值,并进行累加得到差值的和值;判断和值是否大于预设的阈值,如果是,则选择当前字体作为候选字体,如果否,则重新进行字体的选择;当所选择的内容信息中,包含有选择的字体不支持的字符时,采用预先设定的替代字符代替该不支持的字符。3.根据权利要求1所述的场景图像文本生成方法,其特征在于,所述方法还包括:接收外部输入的生成控制指令,所述生成控制指令包括场景图像文本数、字符生成数、特定字符内容以及特定字符数。4.根据权利要求3所述的场景图像文本生成方法,其特征在于,所述方法包括:在选择所述内容信息时,如果对应所述特定字符内容的特定字符在第一语料信息中的数量小于所述特定字符数,从第二语料信息中进行所述内容信息的选择;当生成的特定字符总数量达到所述特定字符数时,该特定字符不再继续生成;当生成的字符总数量达到所述字符生成数时,不再继续生成;当生成的场景图像文本数量达到所述场景图像文本数时,不再继续生成。5.一种场景图像文本生成装置,其特征在于,所述装置包括:语料信息生成单元,用于收集美妆场景的文本信息,将各个美妆品牌名称作为关键字对收集到本文信息进行过滤,得到语料信息集;所述语料信息集包括第一语料信息和第二语料信息,将包含有美妆品牌名称的文本信息,作为第一语料信息,将不含有美妆品牌名称的文本信息,作为第二语料信息;图像库生成单元,用于使用Ope...

【专利技术属性】
技术研发人员:秦涛曹特磊赵伟
申请(专利权)人:时趣互动北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1