翻译图片中的文字的方法、装置、电子设备、及存储介质制造方法及图纸

技术编号：24757419 阅读：25 留言：0更新日期：2020-07-04 09:26

本公开实施例公开了一种翻译图片中的文字的方法、装置、电子设备、及存储介质，方法包括：识别嵌入在目标图片中的文字，得到至少一个文本行，其中一个文本行对应一行文字；对所述至少一个文本行进行段落合并，得到至少一个文本段；将所述至少一个文本段翻译成指定语种的目标文本段，用所述目标文本段来替换所述目标图片中的文字。本公开实施例的技术方案能够根据不同语种的用户调整嵌入图片或视频中的文字，能够提升图片或视频中信息的传播范围。

Method, device, electronic device and storage medium for translating words in pictures

全部详细技术资料下载

【技术实现步骤摘要】
翻译图片中的文字的方法、装置、电子设备、及存储介质
本公开实施例涉及计算机应用
，具体涉及一种翻译图片中的文字的方法、装置、电子设备、及存储介质。
技术介绍
随着国际化越来越深入，不同国家的用户之间信息交互越来越频繁，用户之间存在不时需要分享诸如文件扫描件、带文字图片、PPT文件、带字幕视频等资源的需求。由于这些资源中包含特定语种的文字，若分享给不同语种的用户时，需要将资源中的文本内容翻译成对方语种对应的内容。
技术实现思路
有鉴于此，本公开实施例提供一种翻译图片中的文字的方法、装置、电子设备、及存储介质，以根据不同语种的用户调整嵌入图片或视频中的文字，能够提升图片或视频中信息的传播范围。本公开实施例的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开实施例的实践而习得。第一方面，本公开实施例提供了一种翻译图片中的文字的方法，包括：识别嵌入在目标图片中的文字，得到至少一个文本行，其中一个文本行对应一行文字；对所述至少一个文本行进行段落合并，得到至少一个文本段；将所...

【技术保护点】
1.一种翻译图片中的文字的方法，其特征在于，包括：/n识别嵌入在目标图片中的文字，得到至少一个文本行，其中一个文本行对应一行文字；/n对所述至少一个文本行进行段落合并，得到至少一个文本段；/n将所述至少一个文本段翻译成指定语种的目标文本段；/n用所述目标文本段来替换所述目标图片中的文字。/n

【技术特征摘要】
1.一种翻译图片中的文字的方法，其特征在于，包括：
识别嵌入在目标图片中的文字，得到至少一个文本行，其中一个文本行对应一行文字；
对所述至少一个文本行进行段落合并，得到至少一个文本段；
将所述至少一个文本段翻译成指定语种的目标文本段；
用所述目标文本段来替换所述目标图片中的文字。

2.根据权利要求1所述的方法，其特征在于，在得到至少一个文本行之后所述方法还包括：
获取各文本行对应文字的图片特征，其中所述图片特征包括页边距、字体大小、字体颜色、以及与相邻行的行间距中的至少一项；
对所述至少一个文本行进行段落合并包括：
根据各文本行对应文字的图片特征，对所述至少一个文本行进行段落合并。

3.根据权利要求2所述的方法，其特征在于，所述识别嵌入在目标图片中的文字,得到至少一个文本行,获取各文本行对应文字的图片特征包括：
通过用于识别图片文字的机器学习模型识别嵌入在所述目标图片中的所述文字，得到至少一个文本行、以及各文本行对应文字的图片特征。

4.根据权利要求2所述的方法，其特征在于，根据各文本行对应文字的图片特征，对所述至少一个文本行进行段落合并包括：
通过用于将文本行合并为段落的机器学习模型根据各文本行对应文字的图片特征，对所述至少一个文本行进行段落合并。

5.根据权利要求1所述的方法，其特征在于：
在得到至少一个文本行之后所述方法还包括：获取各文本行对...

【专利技术属性】
技术研发人员：李磊，曹军，王明轩，钱舟，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人