一种文本角度分类的方法、装置、计算机存储介质及终端制造方法及图纸

技术编号:33990905 阅读:19 留言:0更新日期:2022-07-02 09:39
本文公开一种文本角度分类的方法、装置、计算机存储介质及终端,本发明专利技术实施例通过锚组合确定切分的子图的角度分类的概率值;基于预设的加权信息对确定的角度分类的概率值进行处理,确定文本的角度分类。角度分类基于保持原图分辨率的子图确定,提升了文本角度分类的准确度。准确度。准确度。

【技术实现步骤摘要】
一种文本角度分类的方法、装置、计算机存储介质及终端


[0001]本文涉及但不限于神经网络技术,尤指一种文本角度分类的方法、装置、计算机存储介质及终端。

技术介绍

[0002]当前,大部分分类模型只能通过压缩过的整张图像进行推理分类,这种推理分类方法在需求高清晰度和边缘特性的应用场景下有较大的局限性。
[0003]文本角度分类算法是一种对文本旋转角度进行分类的分类模型。对旋转过的文本图像,文本角度分类算法通过深度学习获得文本图像的旋转角度;对文本图像进行压缩,由于清晰度降低及文本存在边缘特性,相关技术中的文本角度分类算法无法对文本旋转角度进行准确分类;例如:无法准确将文本图像的旋转角度准确进行以下四种角度分类:0度、90度、180度和270度,异或更小度数的角度分类。
[0004]如何提升文本角度分类算法的准确度,成为一个有待解决的问题。

技术实现思路

[0005]以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
[0006]本专利技术实施例提供一种文本角度分类的方法、装置、计算机存储介质及终端,能够提升文本角度分类的准确度。
[0007]本专利技术实施例提供了一种文本角度分类的方法,包括:
[0008]对由原图切分获得的锚组合进行训练,获得各锚组合包含的每一个子图的角度分类的概率值;
[0009]对获得的各锚组合包含的每一个子图的角度分类的概率值,通过预设的加权信息进行处理,获得各锚组合用于角度分类的输出值;
[0010]通过获得的用于角度分类的输出值,确定文本的角度分类。
[0011]在一种示例性实例中,所述对由原图切分获得的锚组合进行训练,包括:
[0012]将所述锚组合根据预先设定的训练模型的输入尺寸进行打包;
[0013]将打包后的所述锚组合输入到所述训练模型中进行训练;
[0014]其中,在所述原图的分辨率小于所述输入尺寸的情况下,将所述锚组合根据预先设定的训练模型的输入尺寸进行打包是获取所述锚组合中尺寸大于所述原图尺寸的二分之一,且小于所述原图尺寸的子图;在所述原图的分辨率大于或等于所述输入尺寸的情况下,将所述锚组合根据预先设定的训练模型的输入尺寸进行打包是获取所述锚组合中尺寸大于所述输入尺寸,且小于两倍的所述输入尺寸的子图。
[0015]在一种示例性实例中,所述加权信息包括:与锚组合包含的文本的信息量成正相关的加权系数。
[0016]在一种示例性实例中,所述加权信息包括:
[0017]与所述子图包含的文本的信息量成正相关的,锚组合中包含的各子图的第一加权系数;和/或,
[0018]以锚组合的锚点与所述原图的中心的距离为锚点距离,与所述锚点距离成负相关的各锚组合的第二加权系数。
[0019]在一种示例性实例中,所述对获得的各锚组合包含的每一个子图的角度分类的概率值,通过预设的加权信息进行处理,包括:
[0020]在所述加权信息包含所述第一加权系数的情况下,根据获得的所述角度分类的概率值及所述第一加权系数,计算各子图的概率加权和;对计算出的各子图的概率加权和按照角度分类进行累加,获得各锚组合的所述用于角度分类的所述输出值;或,
[0021]在所述加权信息包含所述第二加权系数的情况下,对每一个锚组合包含的每一个子图的角度分类的概率值,分别计算每一个角度分类:锚组合包含的所有子图的当前角度分类的概率值的累加和,根据锚组合包含的所有子图的各角度分类的概率值的累加和,获得各锚组合的概率累加和;将计算出的各锚组合的所述概率累加和及所述第二加权系数,获得各锚组合的所述用于角度分类的所述输出值;或,
[0022]在所述加权信息包含所述第一加权系数和所述第二加权系数的情况下,针对每一个锚组合:根据获得的角度分类的概率值及所述第一加权系数,计算各子图的概率加权和;对计算出的各子图的概率加权和按照角度分类进行累加,获得锚组合的概率加权和;将计算出的各锚组合的所述概率加权和及所述第二加权系数,获得锚组合的所述用于角度分类的所述输出值。
[0023]另一方面,本专利技术实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机程序,所述计算机程序被处理器执行的情况下实现上述文本角度分类的方法。
[0024]再一方面,本专利技术实施例还提供一种终端,包括:存储器和处理器,所述存储器中保存有计算机程序;其中,
[0025]处理器被配置为执行存储器中的计算机程序;
[0026]所述计算机程序被所述处理器执行的情况下实现如上述文本角度分类的方法。
[0027]还一方面,本专利技术实施例还提供一种文本角度分类的装置,包括:训练单元、计算单元和确定单元;其中,
[0028]训练单元设置为:对由原图切分获得的锚组合进行训练,获得各锚组合包含的每一个子图的角度分类的概率值;
[0029]计算单元设置为:对获得的各锚组合包含的每一个子图的角度分类的概率值,通过预设的加权信息进行处理,获得各锚组合用于角度分类的输出值;
[0030]确定单元设置为:通过获得的用于角度分类的输出值,确定文本的角度分类。
[0031]在一种示例性实例中,所述训练单元是设置为:
[0032]将所述锚组合根据预先设定的训练模型的输入尺寸进行打包;
[0033]将打包后的所述锚组合输入到所述训练模型中进行训练;
[0034]其中,在所述原图的分辨率小于所述输入尺寸的情况下,将所述锚组合根据预先设定的训练模型的输入尺寸进行打包是获取所述锚组合中尺寸大于所述原图尺寸的二分之一,且小于所述原图尺寸的子图;在所述原图的分辨率大于或等于所述输入尺寸的情况下,将所述锚组合根据预先设定的训练模型的输入尺寸进行打包是获取所述锚组合中尺寸
大于所述输入尺寸,且小于两倍的所述输入尺寸的子图。
[0035]在一种示例性实例中,所述加权信息包括:与锚组合包含的文本的信息量成正相关的加权系数。
[0036]在一种示例性实例中,所述加权信息包括:
[0037]与所述子图包含的文本的信息量成正相关的,锚组合中包含的各子图的第一加权系数;和/或,
[0038]以锚组合的锚点与所述原图的中心的距离为锚点距离,与所述锚点距离成负相关的各锚组合的第二加权系数。
[0039]在一种示例性实例中,所述计算单元是设置为:
[0040]在所述加权信息包含所述第一加权系数的情况下,根据获得的所述角度分类的概率值及所述第一加权系数,计算各子图的概率加权和;对计算出的各子图的概率加权和按照角度分类进行累加,获得各锚组合的所述用于角度分类的所述输出值;或,
[0041]在所述加权信息包含所述第二加权系数的情况下,对每一个锚组合包含的每一个子图的角度分类的概率值,分别计算每一个角度分类:锚组合包含的所有子图的当前角度分类的概率值的累加和,根据锚组合包含的所有子图的各角度分类的概率值的累加和,获得各锚组合的概率累加和;将计算出的各锚本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本角度分类的方法,其特征在于,包括:对由原图切分获得的锚组合进行训练,获得各锚组合包含的每一个子图的角度分类的概率值;对获得的各锚组合包含的每一个子图的角度分类的概率值,通过预设的加权信息进行处理,获得各锚组合用于角度分类的输出值;通过获得的用于角度分类的输出值,确定文本的角度分类。2.根据权利要求1所述的方法,其特征在于,所述对由原图切分获得的锚组合进行训练,包括:将所述锚组合根据预先设定的训练模型的输入尺寸进行打包;将打包后的所述锚组合输入到所述训练模型中进行训练;其中,在所述原图的分辨率小于所述输入尺寸的情况下,将所述锚组合根据预先设定的训练模型的输入尺寸进行打包是获取所述锚组合中尺寸大于所述原图尺寸的二分之一,且小于所述原图尺寸的子图;在所述原图的分辨率大于或等于所述输入尺寸的情况下,将所述锚组合根据预先设定的训练模型的输入尺寸进行打包是获取所述锚组合中尺寸大于所述输入尺寸,且小于两倍的所述输入尺寸的子图。3.根据权利要求1或2所述的方法,其特征在于,所述加权信息包括:与锚组合包含的文本的信息量成正相关的加权系数。4.根据权利要求3所述的方法,其特征在于,所述加权信息包括:与所述子图包含的文本的信息量成正相关的,锚组合中包含的各子图的第一加权系数;和/或,以锚组合的锚点与所述原图的中心的距离为锚点距离,与所述锚点距离成负相关的各锚组合的第二加权系数。5.根据权利要求4所述的方法,其特征在于,所述对获得的各锚组合包含的每一个子图的角度分类的概率值,通过预设的加权信息进行处理,包括:在所述加权信息包含所述第一加权系数的情况下,根据获得的所述角度分类的概率值及所述第一加权系数,计算各子图的概率加权和;对计算出的各子图的概率加权和按照角度分类进行累加,获得各锚组合的所述用于角度分类的所述输出值;或,在所述加权信息包含所述第二加权系数的情况下,对每一个锚组合包含的每一个子图的角度分类的概率值,分别计算每一个角度分类:锚组合包含的所有子图的当前角度分类的概率值的累加和,根据锚组合包含的所有子图的各角度分类的概率值的累加和,获得各锚组合的概率累加和;将计算出的各锚组合的所述概率累加和及所述第二加权系数,获得各锚组合的所述用于角度分类的所述输出值;或,在所述加权信息包含所述第一加权系数和所述第二加权系数的情况下,针对每一个锚组合:根据获得的角度分类的概率值及所述第一加权系数,计算各子图的概率加权和;对计算出的各子图的概率加权和按照角度分类进行累加,获得锚组合的概率加权和;将计算出的各锚组合的所述概率加权和及所述第二加权系数,获得锚组合的所述用于角度分类的所述输出值。6.一种计算机存储介质,所述计算机存储介质中存储有计算机程序,所述计算机程序被处理器执行的情况下实现如权利要求1~5中任一项所述的文本角度分类的方法。
7.一种终端,包括:存储器和处理器...

【专利技术属性】
技术研发人员:黄达一熊龙飞
申请(专利权)人:北京金山办公软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1