文字处理方法、装置和电子翻译笔制造方法及图纸

技术编号:8453265 阅读:205 留言:0更新日期:2013-03-21 18:20
本发明专利技术实施例提供了一种文字处理方法、装置和电子翻译笔,涉及文字处理领域。当文字行中有被拆分显示的单词时,能够将被拆分的单词重新组合,恢复原来的单词,之后对恢复后的单词进行翻译,能够提高翻译的准确率。该方法包括:将拍摄印刷体文本得到的图像帧进行处理,形成全景图像后识别出待译文本,从待译文本中获取被拆分显示的待译字符串;将所述被拆分显示的待译字符串的拆分标记删除后,在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。主要用于文字翻译。

【技术实现步骤摘要】

本专利技术涉及文字处理技术,尤其涉及一种文字处理方法、装置和电子翻译笔
技术介绍
电子翻译笔(简称翻译笔)是OCR (Optical Character Recognition,光学字符识另|J)技术的重要应用之一。在进行翻译操作时,翻译笔的光学摄像头按照一定频率对被扫描资料进行连续拍照,获取被扫描资料的图像帧序列,然后将图像帧序列拼接成一幅全景图像,并对全景图像中的文字进行识别,调用翻译笔内部的词典,对识别得到的识别结果进行翻译,获得翻译结果O在西文文字中,为了适应显示行的长度,处在行尾的单词可能被拆分成两部分进行显示,拆分后的单词的前半部分在本行的行尾进行显示,并在本行的行尾处带有连字符,拆分后的单词的后半部分在下一个的行首显示。用户使用上述翻译笔对扫描得到的字符进行翻译时,对于被拆分成两部分的单词或者由于不能够查找到对应的释义,而翻译失败;或者找到与原文本意不同的释义,而使翻译错误,从而影响翻译笔的使用效果。
技术实现思路
本专利技术的实施例提供一种文字处理方法、装置和电子翻译笔,能够提高翻译的准确率。为达到上述目的,本专利技术的实施例采用如下技术方案一种文字处理方法,包括将拍摄印刷体文本得到的图像帧进行处理,形成全景图像后识别出待译文本;从所述待译文本中获取被拆分显示的待译字符串;将所述被拆分显示的待译字符串的拆分标记删除后,在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。一种文字处理装置,包括拍摄单元,用于将拍摄印刷体文本得到的图像帧进行处理,形成全景图像后识别出待译文本;获取单元,用于从所述待译文本中获取被拆分显示的待译字符串;查找单元,用于将所述被拆分显示的待译字符串的拆分标记删除后,在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。一种电子翻页笔,包括所述文字处理装置。本专利技术实施例提供的文字处理方法、装置和电子翻译笔,将拍摄印刷体文本得到的图像帧进行处理,形成全景图像后识别出待译文本,从待译文本中获取被拆分显示的待译字符串;将所述被拆分显示的待译字符串的拆分标记删除后,在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。当文字行中有被拆分显示的单词时,能够将被拆分的单词重新组合,恢复原来的单词,之后对恢复后的单词进行翻译,使翻译结果准确率提闻。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图I为本专利技术实施例提供的一种文字处理方法的流程图;图2为本专利技术实施例中电子翻译笔的结构示意图;图3为本专利技术实施例中电子翻译笔的各个组件的连接关系示意图;图4为本专利技术实施例提供的另一种文字处理方法的流程图;图5为本专利技术实施例提供的一种文字处理装置的结构图;图6为本专利技术实施例提供的另一种文字处理装置的结构图。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供了一种文字处理方法,如图I所示,包括101、将拍摄印刷体文本得到的图像帧进行处理,形成全景图像后识别出待译文本。102、从待译文本中获取被拆分显示的待译字符串。103、将被拆分显示的待译字符串的拆分标记删除后,在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。本实施例提供的文字处理方法,将拍摄印刷体文本得到的图像帧进行处理,形成全景图像后识别出待译文本,从待译文本中获取被拆分显示的待译字符串;将所述被拆分显示的待译字符串的拆分标记删除后,在预设的词库中查找所述待译字符串对应的匹配释义并进行显示。当文字行中有被拆分显示的单词时,能够将被拆分的单词重新组合,恢复原来的单词,之后对恢复后的单词进行翻译,使翻译结果准确率提高。作为本实施例的一种改进,本专利技术实施例提供另一种文字处理方法,本实施例以电子翻译笔为例,详述本实施例提供的文字处理方法。首先,对电子翻译笔的结构做介绍如图2所示,电子翻译笔包括用于封装并固定电子翻译笔各个组件的壳体I、用于处理具有连字符的文本的处理模块2、用于集成电子翻译笔各个组件的电路板3、用于为电子翻译笔各个组件供电的电池4、用于对被扫描字符进行连续拍摄以得到含有被扫描字符的图像帧序列的光学传感器5、用于触发操作的按键6、用于装载字符识别引擎的存储模块7、液晶屏8、用于驱动液晶屏8的显示单元10、用于输出语音的TTS模块11、用于摄取图像信息的镜头组12、用于照明待扫描字符的照明单元13。各部分的连接关系如图3所示,其中,光学传感器5、存储模块7、处理模块2、显示单元10、TTS模块11和USB模块9集成在电路板3上。液晶屏8、电池4、按键6和电路板3封装在壳体I内。按键6与电路板3上的光学传感器5连接,控制光学传感器5进行拍摄。处理模块2分别连接存储模块7、光学传感器5、显示单元10和TTS模块11。如图4所示,包括401、将拍摄印刷体文本得到的图像帧进行处理,形成全景图像后识别。具体的,可以采用光学识别技术从实物资料上获取文字信息,文字信息包含当前待处理字符串和前一个字符串。OCR (Optical Character Recognition,光学字符识别)技术,是指电子设备(如扫描仪、数码相机、电子翻译笔)检测纸上打印的字符,通过检测暗、亮的模式确定字符形状,然后采用字符识别方法将字符形状翻译成计算机文字的过程。即,对文本资料进行扫描,然后对扫描图像进行分析处理,获取文字及版面信息的过程。关于OCR技术,是本领域技术人员所熟知的,在此不再详述。采用电子翻译笔对待扫描字符进行扫描时,在扫描待扫描字符时,光学传感器5对文字行中的被扫描字符进行连续高速拍摄,以得到含有被扫描字符的图像帧序列,图像帧序列中相邻图像帧内容会有重叠部分,处理模块2对图像帧序列中的各图像帧进行剪切和重组,将拼接后得到的全景图像进行字符识别。进一步可选的,处理模块2调用存储模块7中的字符识别引擎对拼接得到的全景图像进行识别前,首先对拼接得到的全景图像进行倾斜校正。402、获取当前待处理字符串。在处理模块2的控制下,用户通过按键6触发,将控制信号发送到光学传感器5,启动光学传感器5进行图像信息采集,得到图像帧序列,处理模块2对输入的图像帧序列进行拼接,形成全景图像后识别出当前待处理字符串,在预设的词库中查找当前待处理字符串对应的匹配释义。403、判断所述当前待处理字符串是否位于所述当前待处理字符串所在文字行的行首处。若所述当前待处理字符串是位于所述当前待处理字符串所在文字行的行首处,则执行步骤404 ;若当前待处理字符串不是位于所述当前待处理字符串所在文字行的行首处,则执行步骤408。获取所述当前待处理字符串的前一个字符串之前,判断当前待处理字符串是否位于所述当前待处理字符串所在文字行的行首处,即判断所述当前待处理字符串对应的全景图像的左侧是否紧邻一个空白区域;当输入的图像帧序列对应为文字行的行首时,拼本文档来自技高网...

【技术保护点】
一种文字处理方法,其特征在于,包括:将拍摄印刷体文本得到的图像帧进行处理,形成全景图像后识别出待译文本;从所述待译文本中获取被拆分显示的待译字符串;将所述被拆分显示的待译字符串的拆分标记删除后,在预设的词库中查找对应的匹配释义并进行显示。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘昌平刘正珍仝慧媛
申请(专利权)人:汉王科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1