一种识别手写文本行语言类别的方法及装置制造方法及图纸

技术编号:6115219 阅读:446 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种识别手写文本行语言类别的方法及装置,属于输入法技术领域。该方法包括:将手写文本行分割成多个笔划几何块;分别提取每个笔划几何块的特征,根据提取的特征计算所述笔划几何块的预设语言可信度;根据获得的多个笔划几何块的预设语言可信度,识别所述手写文本行的语言类别。本发明专利技术通过先将手写文本行分割成多个笔划几何块,然后分别计算每个笔划几何块的预设语言可信度,最后根据该手写文本行中所有笔划几何块的预设语言可信度,识别该手写文本行的语言类别,使得用户在进行多语言的手写文本行输入时,不必要预先指定手写文本行的语言类别,方便了用户进行手写文本输入,同时有效地提高了手写输入的速度。

【技术实现步骤摘要】

本专利技术属于输入法
,涉及一种识别手写文本行语言类别的方法,特别是涉及一种识别手写文本行语言类别的方法及装置
技术介绍
随着移动终端和触控技术的发展,手写技术以其方便、快速的优势得到了更加广泛的应用。对手写文本的识别也逐步从单个字符的识别发展到文本行的识别,中文和英文两种语言类别的文本行识别是目前应用最多的。现有的大部分手写文本行识别技术中,通过在一个终端上加载不同的识别语言包来实现特定语言的手写文本行输入,该方法无法在同一个终端上识别多种语言的手写文本行,当需要识别其他语言的手写文本行时,需要首先卸载当前识别语言包,然后,再安装另一种识别语言包,使用起来非常不方便。一种改进的手写文本行识别技术的应用是同时加载多个识别语言包,进行手写文本行识别之前,首先指定手写文本行的语言类别,在用户完成文本行的输入后,只能按照指定的语言类别对输入的文本行进行识别。这种应用,要求使用者在每次输入不同语言类别的文本行之前,首先设置识别的文本行的语言类别,用户使用起来也非常不方便,也影响输入的速度。
技术实现思路
本专利技术的目的在于提供一种识别手写文本行语言类别的方法及装置,能够自动识别手写文本行语言类别,在进行手写文本行识别之前,不需要用户手动设置手写文本行的识别范围,方便用户进行多语言的文本行输入,也提高了输入的速度。本专利技术提供了如下方案一种识别手写文本行语言类别的方法,包括 获取手写文本行,将手写文本行分割成多个笔划几何块;分别提取每个笔划几何块的特征,根据提取的特征计算所述笔划几何块的预设语言可信度;根据获得的多个笔划几何块的预设语言可信度,识别所述手写文本行的语言类别。优选的,所述将手写文本行分割成多个笔划几何块,包括从手写文本行的笔迹数据中提取所有笔划,并将每个笔划初始化为相应的笔划块;通过合并水平投影重叠的笔划块,将多个笔划块合并成至少一个笔划几何块。所述笔迹数据包括构成笔划的笔迹点坐标和笔划结束标志,所述笔划几何块包括至少一个笔划。优选的,所述合并水平投影重叠的笔划块,将多个笔划块分割成至少一个笔划几何块,包括51、依序取两个相邻的笔划块;52、判断所述两个相邻的笔划块的水平投影是否重叠,如果重叠,将所述两个相邻的笔划块合并为合并笔划块;53、依序取与所述合并笔划块相邻的笔划块,并判断所述合并笔划块和该相邻的笔划块的水平投影是否重叠,如果重叠,将所述合并笔划块和该相邻的笔划块合并为另一合并笔划块,重复S3 ;否则,所述合并笔划块形成一个笔划几何块,转至Sl ;54、 重复步骤S3,直至所有笔划块合并完成;其中,所述合并笔划块包括至少两个笔划的笔划块。所述相邻笔划块指按笔划书写顺序相邻的笔划块。优选的,在所述合并笔划块和与其相邻的笔划块的笔划四周分别沿水平方向和垂直方向绘制线条形成一个四边形区域,该四边形区域包括上边框、下边框、左边框和右边框;其中,所述上边框通过笔划块中的笔划笔迹点中位于最顶侧的笔迹点沿水平方向绘制线条形成,所述下边框通过沿笔划块中的笔划笔迹点中位于最底侧的笔迹点沿水平方向绘制线条形成,所述左边框通过沿笔划块中的笔划笔迹点中位于最左侧的笔迹点沿垂直方向绘制线条形成,所述右边框通过沿笔划块中的笔划笔迹点中位于最右侧的笔迹点沿垂直方向绘制线条形成。其中,所述两个相邻的笔划块包括第一笔划块和第二笔划块;判断两个相邻的笔划块的水平投影是否重叠时,若第一笔划块的左边框在第二笔划块的右边框的左侧且第一笔划块的右边框在第二笔划块的左边框的右侧,则该两个笔划块的水平投影重叠。优选的,所述预设语言包括中文、日文和韩文,所述笔划几何块的特征包括预设语言字符识别可信度、高宽比、笔迹点密度和笔划数。优选的,所述第,个笔划几何块的预设语言可信度m)通过公式 -p(马)= 咚计算得到,其中,所述0表示第k个特征的权重,满足条件1 = £贱, 所述& (马)表示笔划几何块ι的第k个特征的特征值。优选的,所述根据获得的多个笔划几何块的预设语言可信度,识别所述手写文本行的语言类别,包括根据多个笔划几何块的预设语言可信度,获得该手写文本行的预设语言可信度;根据手写文本行的预设语言可信度识别所述手写文本行的语言类别。优选的,通过公式P该)=m严{汽4)}获得手写文本行的预设语言可信度尸侈), 为变量,代表笔划几何块的范围,!>D(马)}表示手写文本行经分割获得的所有笔划几何块。 手写文本行经分割获得的所有笔划几何块的预设语言可信度的最大值即为该手写文本行的预设语言可信度,所述P(爲)为第i个笔划几何块的预设语言可信度,为大于等于0,且小于等于1的数。一种识别手写文本行语言类别的装置,包括笔划几何块分割单元,用于获取手写文本行,将手写文本行分割成多个笔划几何块; 笔划几何块识别单元,用于分别提取每个笔划几何块的特征,根据提取的特征计算所述笔划几何块的预设语言可信度;文本行识别单元,用于根据获得的多个笔划几何块的预设语言可信度,识别所述手写文本行语言类别。 所述笔划几何块分割单元进一步包括笔划提取子单元,用于从手写文本行的笔迹数据中提取多个笔划块,并将每个笔划初始化为相应的笔划块,所述笔迹数据包括构成笔划的笔迹点坐标和笔划结束标志。笔划块合并子单元,用于通过合并水平投影重叠的笔划块,将多个笔划块合并成至少一个笔划几何块,包括51、依序取两个相邻的笔划块;52、判断所述两个相邻的笔划块的水平投影是否重叠,如果重叠,将所述两个相邻的笔划块合并为合并笔划块;53、依序取与所述合并笔划块相邻的笔划块,并判断所述合并笔划块和该相邻的笔划块的水平投影是否重叠,如果重叠,将所述合并笔划块和该相邻的笔划块合并为另一合并笔划块,重复S3 ;否则,所述合并笔划块形成一个笔划几何块,转至Sl ;54、重复步骤S3,直至所有笔划块合并完成;其中,所述合并笔划块包括至少两个笔划的笔划块。所述相邻笔划块指按笔划书写顺序相邻的笔划块。优选的,在所述合并笔划块和与其相邻的笔划块的笔划四周分别沿水平方向和垂直方向绘制线条形成一个四边形区域,该四边形区域包括上边框、下边框、左边框和右边框;其中,所述上边框通过笔划块中的笔划笔迹点中位于最顶侧的笔迹点沿水平方向绘制线条形成,所述下边框通过沿笔划块中的笔划笔迹点中位于最底侧的笔迹点沿水平方向绘制线条形成,所述左边框通过沿笔划块中的笔划笔迹点中位于最左侧的笔迹点沿垂直方向绘制线条形成,所述右边框通过沿笔划块中的笔划笔迹点中位于最右侧的笔迹点沿垂直方向绘制线条形成。其中,所述两个相邻的笔划块包括第一笔划块和第二笔划块;判断两个相邻的笔划块的水平投影是否重叠时,若第一笔划块的左边框在第二笔划块的右边框的左侧且第一笔划块的右边框在第二笔划块的左边框的右侧,则该两个笔划块的水平投影重叠。根据本专利技术提供的具体实施例,本专利技术具有以下技术效果本专利技术实施例通过先将手写文本行分割成多个笔划几何块;然后分别提取每个笔划几何块的特征,根据提取的特征计算所述笔划几何块的预设语言可信度;最后根据该手写文本行中所有笔划几何块的预设语言可信度,识别该手写文本行的语言类别,使得用户在进行多语言的手写文本行输入时,不必要预先指定手写文本行的语言类别,方便了用户进行手写文本输入,同时有效地提高了手写输入的速度。附图说明为了更清楚本文档来自技高网...

【技术保护点】
1.一种识别手写文本行语言类别的方法,其特征在于,包括:获取手写文本行,将手写文本行分割成多个笔划几何块;分别提取每个笔划几何块的特征,根据提取的特征计算所述笔划几何块的预设语言可信度;根据获得的多个笔划几何块的预设语言可信度,识别所述手写文本行的语言类别。

【技术特征摘要】

【专利技术属性】
技术研发人员:郭育生
申请(专利权)人:汉王科技股份有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1