场景文字图像的生成方法、装置、介质和电子设备制造方法及图纸

技术编号：40604537 阅读：4 留言：0更新日期：2024-03-12 22:10

本申请涉及深度学习领域，具体而言，涉及一种场景文字图像的生成方法、装置、介质和电子设备，所述方法包括：生成虚拟三维场景，获取针对所述虚拟三维场景的场景文字参数，所述场景文字参数用于表征待生成的场景文字图像中的文字特征；基于视角搜索算法，确定所述虚拟三维场景中的至少一个虚拟拍摄位置；根据所述场景文字参数和所述虚拟三维场景，按照各个虚拟拍摄位置，生成至少一张场景文字图像。本申请提供的技术方案能够自动生成高质量场景文字图像。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及深度学习领域，具体而言，涉及一种场景文字图像的生成方法、装置、介质和电子设备。

技术介绍

1、以往在深度学习中，对于场景文字图像的生成往往采用手动收集或通过贴图技术生成。这些方式不是成本昂贵，就是效果不尽人意。难以获得高质量、多样性且带有真实感观效果的场景文字图像，这在一定程度上限制了深度学习模型的训练效果。

2、基于此，本领域技术人员需要一种方法，能够解决上述技术问题。

技术实现思路

1、本申请的实施例提供了一种场景文字图像的生成方法、控制装置、介质和电子设备，能够自动生成高质量场景文字图像。

2、本申请的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本申请的实践而习得。

3、根据本申请实施例的一个方面，提供了一种场景文字图像的生成方法，所述方法包括：生成虚拟三维场景，获取针对所述虚拟三维场景的场景文字参数，所述场景文字参数用于表征待生成的场景文字图像中的文字特征；基于视角搜索算法，确定所述虚拟三维场景中的至少一个虚拟拍摄位置；根据所述场景文字参数和所述虚拟三维场景，按照各个虚拟拍摄位置，生成至少一张场景文字图像。

4、在本申请的一些实施例中，所述生成虚拟三维场景，包括：基于taichi编程语言生成虚拟三维场景。

5、在本申请的一些实施例中，所述场景文字参数包括：场景文字内容、场景文字字体、场景文字颜色和场景文字大小。

6、在本申请的一些实施例中，所述基于视角搜索算法，确定所述虚拟三维场景

7、在本申请的一些实施例中，所述根据所述场景文字参数和所述虚拟三维场景，按照各个虚拟拍摄位置，生成至少一张场景文字图像，包括：所述根据所述场景文字参数和所述虚拟三维场景，按照各个虚拟拍摄位置，生成至少一张初始场景文字图像；针对各张初始场景文字图像进行压缩操作，生成至少一张目标场景文字图像。

8、在本申请的一些实施例中，基于前述方案，所述针对各张初始场景文字图像进行压缩操作，包括：识别各张初始场景文字图像中的显著区域，所述显著区域为各张初始场景文字图像中场景文字所在的区域，仅提取并储存所述显著区域对应的图像。

9、在本申请的一些实施例中，基于前述方案，所述针对各张初始场景文字图像进行压缩操作，包括：调整各张初始场景文字图像的数据位数。

10、根据本申请实施例的一个方面，提供了一种场景文字图像生成装置，所述装置包括：第一生成单元，被用于生成虚拟三维场景，获取针对所述虚拟三维场景的场景文字参数，所述场景文字参数用于表征待生成的场景文字图像中的文字特征；确定单元，被用于基于视角搜索算法，确定所述虚拟三维场景中的至少一个虚拟拍摄位置；第二生成单元，被用于根据所述场景文字参数和所述虚拟三维场景，按照各个虚拟拍摄位置，生成至少一张场景文字图像。

11、根据本申请实施例的一个方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行以实现如上所述的方法。

12、根据本申请实施例的一个方面，提供了一种电子设备，所述电子设备包括一个或多个处理器和一个或多个存储器，所述一个或多个存储器中存储有至少一条程序代码，所述至少一条程序代码由所述一个或多个处理器加载并执行以实现如上所述的方法。

13、基于上述方案，本申请提供的技术方案至少有以下优点和进步之处：

14、在本申请中，可以先生成虚拟三维场景，并获取针对所述虚拟三维场景的场景文字参数，再基于视角搜索算法，确定所述虚拟三维场景中的至少一个虚拟拍摄位置，最后根据所述场景文字参数和所述虚拟三维场景，按照各个虚拟拍摄位置，生成至少一张场景文字图像，因此可以在多变的虚拟三维场景下自动搜索并确定拍摄位置，生成具有多样性和逼真感的场景文字图像。

15、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

本文档来自技高网...

【技术保护点】

1.一种场景文字图像的生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述生成虚拟三维场景，包括：

3.根据权利要求1所述的方法，其特征在于，所述场景文字参数包括：场景文字内容、场景文字字体、场景文字颜色和场景文字大小。

4.根据权利要求1所述的方法，其特征在于，所述基于视角搜索算法，确定所述虚拟三维场景中的至少一个虚拟拍摄位置，包括：

5.根据权利要求1所述的方法，其特征在于，所述根据所述场景文字参数和所述虚拟三维场景，按照各个虚拟拍摄位置，生成至少一张场景文字图像，包括：

6.根据权利要求5所述的方法，其特征在于，所述针对各张初始场景文字图像进行压缩操作，包括：

7.根据权利要求5所述的方法，其特征在于，所述针对各张初始场景文字图像进行压缩操作，包括：

8.一种场景文字图像生成装置，其特征在于，所述装置包括：

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行以实现如权利要求1至7任一项所述的方法。

10.一种电子设备，其特征在于，所述电子设备包括一个或多个处理器和一个或多个存储器，所述一个或多个存储器中存储有至少一条程序代码，所述至少一条程序代码由所述一个或多个处理器加载并执行以实现如权利要求1至7任一项所述的方法。

...

【技术特征摘要】

1.一种场景文字图像的生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述生成虚拟三维场景，包括：

3.根据权利要求1所述的方法，其特征在于，所述场景文字参数包括：场景文字内容、场景文字字体、场景文字颜色和场景文字大小。

4.根据权利要求1所述的方法，其特征在于，所述基于视角搜索算法，确定所述虚拟三维场景中的至少一个虚拟拍摄位置，包括：

6.根据权利要求5所述的方法，其特征在于，所述针对各张...

【专利技术属性】
技术研发人员：宋扬，陈星，苏睿聪，
申请(专利权)人：北京首钢自动化信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人