一种自动生成其他语言名片的方法及装置制造方法及图纸

技术编号:38909524 阅读:12 留言:0更新日期:2023-09-25 09:27
本发明专利技术公开了一种自动生成其他语言名片的方法。在原始名片图像中区分需要翻译的文字条目和无需翻译的组件。对原始名片图像中的每一个需要翻译的文字条目,记录该文字条目的文字内容、文字形态信息、位置信息。将需要翻译的文字条目的文字内容从源语言翻译为目标语言,确定翻译后的文字条目的目标字体。在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像。将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。本发明专利技术能够快速、准确地生成另一种语言的名片图像,并且名片的版式、风格保持不变。风格保持不变。风格保持不变。

【技术实现步骤摘要】
一种自动生成其他语言名片的方法及装置


[0001]本专利技术涉及一种文字属性判断、OCR(Optical Character Recognition,光学字符识别)、文字翻译、图像处理和融合技术。

技术介绍

[0002]在商务活动中,名片是商务人士交换信息的重要媒介。随着涉外商务活动的增加,将一种语言的名片方便地转换为其他语言的名片成为不少企业和个人的需求。

技术实现思路

[0003]本专利技术所要解决的技术问题是:如何根据某种语言的名片图像快速生成保持名片版式风格不变的另一种语言的名片图像。
[0004]为解决上述技术问题,本专利技术提出了一种自动生成其他语言名片的方法,包括如下步骤。步骤S1:在原始名片图像中区分需要翻译的文字条目和无需翻译的组件;所述无需翻译的组件包括企业LOGO、照片、头像、图标、条形码、二维码的任意一种或多种;对于需要翻译的文字条目,采用OCR技术获取文字内容。步骤S2:对原始名片图像中的每一个需要翻译的文字条目,记录该文字条目的文字内容、包含字体、文字颜色、文字大小在内的文字形态信息、位置信息。步骤S3:将需要翻译的文字条目的文字内容从源语言翻译为目标语言,得到翻译后的文字条目的文字内容;确定翻译后的文字条目的目标字体。步骤S4:根据需要翻译的文字条目在名片上的位置信息,在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像。所述步骤S3、步骤S4的顺序没有严格限制,或者任意在前,或者同时进行。步骤S5:将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。
[0005]优选地,所述步骤S1中,预先建立一个名片组件数据库,通过比较原始名片图像和名片组件数据库,在原始名片图像中确定无需翻译的组件。
[0006]优选地,所述步骤S3中,根据需要翻译的文字条目的文字内容确定条目类型,再根据目标语言、名片中条目类型、以及名片翻译习惯知识库,对需要翻译的文字条目的文字内容进行翻译。
[0007]优选地,所述步骤S3中,如果需要翻译的文字条目的文字内容有多个候选翻译,选择与源语言的长度最接近的那一种候选翻译。
[0008]进一步地,所述步骤S3中,确定翻译后的文字条目的目标字体采用如下三种方案的任一种:(1)预先建立不同语言的不同字体之间的对应表,根据需要翻译的文字条目的源语言、需要翻译的文字条目的原始字体、需要翻译的文字条目的目标语言查表确定翻译后的文字条目的目标字体;(2)以图像学方式比较源语言的原始字体中的特定字符与目标语言的每一种字体的相应字符,选择目标语言的字符形态最接近的一种字体作为目标字体;(3)采用神经网络,以源语言的原始字体、目标语言的每一种字体作为输入,输出为两种字
体的风格相似程度,选择目标语言的风格相似程度最接近的一种字体作为目标字体。
[0009]优选地,所述步骤S5中,翻译后的文字条目的文字颜色、文字大小也保持不变。
[0010]优选地,所述步骤S5中,采用图像融合技术消除贴合处的不自然痕迹,得到无粘贴痕迹的目标语言的名片图像。
[0011]本专利技术还提出了一种自动生成其他语言名片的装置,包括分类单元、记录单元、翻译单元、图像擦除单元、图像回帖单元。所述分类单元用来在原始名片图像中区分需要翻译的文字条目和无需翻译的组件;所述无需翻译的组件包括企业LOGO、照片、头像、图标、条形码、二维码的任意一种或多种;对于需要翻译的文字条目,采用OCR技术获取文字内容。所述记录单元用来记录原始名片图像中的每一个需要翻译的文字条目的文字内容、包含字体、文字颜色、文字大小在内的文字形态信息、位置信息。所述翻译单元用来将需要翻译的文字条目的文字内容从源语言翻译为目标语言,确定翻译后的文字条目的目标字体。所述图像擦除单元用来根据需要翻译的文字条目在名片上的位置信息,在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像。所述图像回帖单元用来将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。
[0012]本专利技术取得的技术效果是:能够快速、准确地生成另一种语言的名片图像,并且名片的版式、风格保持不变。
附图说明
[0013]图1是本专利技术提出的自动生成其他语言名片的方法的流程示意图。
[0014]图2是原始名片图像的一个示例的示意图。
[0015]图3是对图2所示的原始名片图像执行步骤S4后得到的名片背景图像的示意图。
[0016]图4是对图2所示的原始名片图像执行步骤S5后得到的无粘贴痕迹的英文名片图像的示意图。
[0017]图5是本专利技术提出的自动生成其他语言名片的装置的结构示意图。
[0018]图中附图标记说明:1为分类单元、2为记录单元、3为翻译单元、4为图像擦除单元、5为图像回帖单元。
实施方式
[0019]请参阅图1,本专利技术提出的自动生成其他语言名片的方法包括如下步骤。
[0020]步骤S1:在原始名片图像中区分需要翻译的文字条目和无需翻译的组件。所述无需翻译的组件包括企业LOGO(其中可能包含企业名称或简称)、照片、头像(其中可能包含个人姓名、职位等)、图标(例如电话图像中包含TEL,传真图标中包含FAX)、条形码、二维码等。这一步可以预先建立一个名片组件数据库,保存企业LOGO等可能包含文字的组件,通过比较原始名片图像和名片组件数据库,在原始名片图像中确定无需翻译的组件。对于需要翻译的文字条目,采用OCR技术获取文字内容。
[0021]步骤S2:对原始名片图像中的每一个需要翻译的文字条目,记录该文字条目的文字内容、包含字体、文字颜色、文字大小等在内的文字形态信息、该文字条目在名片上的位置信息。
[0022]步骤S3:将需要翻译的文字条目的文字内容从源语言翻译为目标语言,得到翻译后的文字条目的文字内容;确定翻译后的文字条目的目标字体。
[0023]优选地,翻译时,可以根据需要翻译的文字条目的文字内容确定条目类型(例如,姓名、职位、单位等),再根据目标语言、名片中条目类型、以及名片翻译习惯知识库,对需要翻译的文字条目的文字内容进行翻译。如果需要翻译的文字条目的文字内容有多个候选翻译,选择与源语言的长度最接近的那一种候选翻译。
[0024]优选地,确定翻译后的文字条目的目标字体可采用如下三种方案的任一种:(1)预先建立不同语言的不同字体之间的对应表,根据需要翻译的文字条目的源语言、需要翻译的文字条目的原始字体、需要翻译的文字条目的目标语言查表确定翻译后的文字条目的目标字体。(2)以图像学方式比较源语言的原始字体中的特定字符(例如数字)与目标语言的每一种字体的相应字符,选择目标语言的字符形态最接近的一种字体作为目标字体。(3)采用神经网络,以源语言的原始字体、目标语言的每一种字体作为输入,输出为两种字体的风格相似程度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动生成其他语言名片的方法,其特征是,包括如下步骤;步骤S1:在原始名片图像中区分需要翻译的文字条目和无需翻译的组件;所述无需翻译的组件包括企业LOGO、照片、头像、图标、条形码、二维码的任意一种或多种;对于需要翻译的文字条目,采用OCR技术获取文字内容;步骤S2:对原始名片图像中的每一个需要翻译的文字条目,记录该文字条目的文字内容、包含字体、文字颜色、文字大小在内的文字形态信息、位置信息;步骤S3:将需要翻译的文字条目的文字内容从源语言翻译为目标语言,得到翻译后的文字条目的文字内容;确定翻译后的文字条目的目标字体;步骤S4:根据需要翻译的文字条目在名片上的位置信息,在原始名片图像中擦除该需要翻译的文字条目,得到名片背景图像;所述步骤S3、步骤S4的顺序没有严格限制,或者任意在前,或者同时进行;步骤S5:将翻译后的文字条目的文字内容根据目标字体做渲染,渲染后图像根据该文字条目在名片上的位置信息回帖到名片背景图像中,得到目标语言的名片图像并且名片版式风格保持不变。2.根据权利要求1所述的自动生成其他语言名片的方法,其特征是,所述步骤S1中,预先建立一个名片组件数据库,通过比较原始名片图像和名片组件数据库,在原始名片图像中确定无需翻译的组件。3.根据权利要求1所述的自动生成其他语言名片的方法,其特征是,所述步骤S3中,根据需要翻译的文字条目的文字内容确定条目类型,再根据目标语言、名片中条目类型、以及名片翻译习惯知识库,对需要翻译的文字条目的文字内容进行翻译。4.根据权利要求1所述的自动生成其他语言名片的方法,其特征是,所述步骤S3中,如果需要翻译的文字条目的文字内容有多个候选翻译,选择与源语言的长度最接近的那一种候选翻译。5.根据权利要求1所述的自动生成其他语言名片的方法,其特征是,所述步骤S3中,确定翻译后的文字条目的目标字体采用如下三种方案的任一种:(1)预先建立不同语...

【专利技术属性】
技术研发人员:郭丰俊龙腾丁凯刘鹏伟余鹏程张振
申请(专利权)人:上海临冠数据科技有限公司上海生腾数据科技有限公司上海盈五蓄数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1