The invention discloses a method and a device for determining the typesetting direction of a text area. Among them, the method includes: recognizing all the characters in the text area; taking each character in all the characters as input of the neural network language model, obtaining the characteristic parameters of each character, which include: the relative adjacent characters of each character and the probability of the occurrence of the relative adjacent characters. The neural network language model is trained by machine learning using multiple sets of data. In practice, each group of data in multi-group data includes: the characteristic parameters of the text and the text; the typesetting direction of each text in all words is determined according to the characteristic parameters; and the typesetting direction of the text area is determined based on the typesetting direction of each text. The invention solves the technical problem that the typesetting direction of the text area can not be obtained when image and character recognition is carried out in the related technology.
【技术实现步骤摘要】
文字区域排版方向的确定方法及装置
本专利技术涉及字符识别
,具体而言,涉及一种文字区域排版方向的确定方法及装置。
技术介绍
证件识别是指使用技术对证件信息自动提取,并对证件信息按要素格式输出信息,得到规则化的数据,以便于计算机系统管理。当前,主要是通过光学字符识别OCR文字识别,具体地,通过手机或者带有摄像头的终端设备对证件进行拍照,并对证件做OCR文字识别。上述证件可以为各种类型的身份证件,例如,驾驶证、行驶证、护照、车牌、银行卡号、名片、文档等,其优点是:方案成本低,采集识别设备易获得,使用环境方便,功能容易扩展。但是,上述方式直接应用于一些文字顺序为非单一、文字种类也为非单一的证件时(例如,毕业证、学位证等)存在着挑战。由于上述驾驶证、行驶证、护照、车牌、银行卡号、名片、文档等证件上文字种类单一,而且文字顺序单一。然而,毕业证、学位证等上的文字书写阅读顺序并非全是横行排列,从左往右书写阅读的。成熟的OCR技术可以将图片上的文字分成单个的文字,但是现有的证件识别技术并不能分辨出文字的排列顺序,没有正确的文字排列顺序,利用OCR技术得到的文字是没有用的信息 ...
【技术保护点】
1.一种文字区域排版方向的确定方法,其特征在于,包括:识别文字区域的所有文字;将所述所有文字中的每个文字作为神经网络语言模型的输入,得到所述每个文字的特征参数,其中,所述特征参数包括:所述每个文字的相对相邻文字以及该相对相邻文字的出现概率,所述神经网络语言模型为使用多组数据通过机器学习训练得到的,所述多组数据中的每组数据均包括:文字和该文字的特征参数;根据所述特征参数确定所述所有文字中每个文字的排版方向;基于所述每个文字的排版方向确定所述文字区域的排版方向。
【技术特征摘要】
1.一种文字区域排版方向的确定方法,其特征在于,包括:识别文字区域的所有文字;将所述所有文字中的每个文字作为神经网络语言模型的输入,得到所述每个文字的特征参数,其中,所述特征参数包括:所述每个文字的相对相邻文字以及该相对相邻文字的出现概率,所述神经网络语言模型为使用多组数据通过机器学习训练得到的,所述多组数据中的每组数据均包括:文字和该文字的特征参数;根据所述特征参数确定所述所有文字中每个文字的排版方向;基于所述每个文字的排版方向确定所述文字区域的排版方向。2.根据权利要求1所述的方法,其特征在于,在将所述所有文字中的每个文字作为神经网络语言模型的输入,得到所述每个文字的特征参数之前,还包括:采集在历史时间段的多个历史文字和该多个历史文字的特征参数,其中,所述多个历史文字的特征参数是根据所述多个历史文字确定的;对采集的包括所述多个历史文字和该多个历史文字的特征参数进行训练,得到所述神经网络语言模型。3.根据权利要求1所述的方法,其特征在于,在根据所述特征参数确定所述所有文字中每个文字的排版方向之前,还包括:确定所述所有文字中每个文字的实际相邻文字,其中,所述实际相邻文字为所述文字区域的文字。4.根据权利要求3所述的方法,其特征在于,根据所述特征参数确定所述所有文字中每个文字的排版方向包括:依次将每个文字的实际相邻文字与所述每个文字的特征参数进行匹配;在匹配结果为特征参数中存在与所述实际相邻文字相同的相对相邻文字的情况下,将所述相对相邻文字的出现概率作为所述实际相邻文字的出现概率;将所述所有文字中每个文字的实际相邻文字中出现概率最高的实际相邻文字所指向的方向作为所述所有文字中每个文字的排版方向。5.根据权利要求1至4中任一项所述的方法,其特征在于,基于所述每个文字的排版方向确定所述文字区域的排版方向包括:根据所述所有文字中每个文字...
【专利技术属性】
技术研发人员:聂镭,李睿,聂颖,郑权,张峰,
申请(专利权)人:龙马智芯珠海横琴科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。