当前位置: 首页 > 专利查询>浙江大学专利>正文

APP适老模式下文字段落间距合规性检测方法技术

技术编号:37123827 阅读:29 留言:0更新日期:2023-04-01 05:19
一种基于随机森林的移动应用适老模式下文字段落是否符合规定的检测方法,包括如下步骤:提出一种基于随机森林分类的文字段落检测方法,该方法确定一行文字是段落继续行数据,还是段落开始行数据;建立行间距、段间距合规检测模型,判断APP适老模式下文字大小及排版是否符合国标要求。本发明专利技术采用机器学习中较为稳定的随进森林算法,实现了非侵入式,即不用获取APP源码,普适性强,错误率低的一种移动应用适老模式下文字段落合规检测,可应用于复杂场景,且普适性强,可应用于移动应用的自动化测试等场景。测试等场景。测试等场景。

【技术实现步骤摘要】
APP适老模式下文字段落间距合规性检测方法


[0001]本专利技术涉及一种基于随机森林模型的APP适老模式下文字段落间距合规性检测方法,属于计算机技术软件领域。

技术介绍

[0002]针对已经完成适老化的改造的APP,需要检测其适老化改造是否符合要求。经过调研发现,老年人对主流App改造的最主要需求包括:大字体、大图标、大间距。因此APP在适老化过程中很重要的一点是检测文字段落间距是否能满足要求。
[0003]由于无法获取APP的源码,因此APP中出现的文字,只能通过在APP端截图,然后识别图像中文字的方式来获得。不同的文本情况,比如文本是一个段落继续行,还是段落开始行,有不同的间距判断方法,因此需要先把图片中的每一行进行分类,分类出是一个继续行,还是段落新开始的一行。
[0004]目前,常见的段落检测方法大多是基于规则的逻辑判断,通过是否缩进,上一行是否结束等来设计规则,判断是否是新的一段,该类方法主要存在以下缺陷:(1)段落格式繁多,基于规则的逻辑判断很难找到合适的规则;(2)方法切维护成本非常高,如果出现了新的段落格式,则需要重新考虑规则的逻辑;(3)无法应用于复杂场景,例如一段中出现了未考虑到的情况。(3)不具有普适性,例如新的排版格式下,当前的规则判断可能不会有很好的效果。

技术实现思路

[0005]针对以上问题和难点,本专利技术提出了一种基于随机森林模型的APP适老模式下文字段落检测方法。与基于逻辑判断方法相比,该段落检测方法可适配多种情况,普适性更高,易于维护,且随机森林可以可视化出每个特征的重要程度,直观的感受每个特征的重要性,可解释性强。
[0006]段落检测完毕后,计算本上文字与上一行文字间距,根据一行文字是段落继续行数据,还是新的段落开始行数据,通过不同标准,判断间距合规与否。
[0007]综合以上两个步骤,一种APP适老模式下文字段落间距合规性检测方法的具体步骤如下:
[0008]S1:将开启适老模式的APP截图输入进光学字符识别(OCR)模块,识别图片中的所有文本行信息;
[0009]S2:对S1中获得的文本行信息进行特征工程,提取对应特征,作为原始特征;
[0010]S3:对S2收集的原始特征进行扩充,构建新的特征,加入到原始的特征中,丰富数据;
[0011]S4:将提取的行信息,标注为新的继续行数据,还是新的段落开始数据;
[0012]S5:利用S1到S4收集的数据离线训练随机森林算法,建立随机森林分类模型;
[0013]S6:输入新的一张带有文字的APP页面截图,根据随机森林模型,判断其中的每行
文字为继续行数据,还是新的段落开始数据;
[0014]S7:根据行信息,计算出该行文字的字体大小;
[0015]S8:根据行信息,计算出该行与上一行的行间距;
[0016]S9:根据其是否是新的继续行数据,还是新的段落开始数据,通过行间距的大小,判断本行与上一行的间距是否满足国标对适老化APP的要求。
[0017]具体所述步骤S1中,其中所识别的文本行数据信息具体形式如下:每个文本行被一个矩形框定,矩形数据信息以列表形式存储,列表中的数据依次是左上角坐标值,右上角坐标值,右下角坐标值,左下角坐标值。其中,坐标系的原点在图片左上角,图片上边缘和左边缘分别为x轴、y轴,每个像素值为1单位,矩形四角坐标值在该坐标系下得出,坐标值中的第一个值为x轴值,第二个值为y轴值。
[0018]具体所述步骤S2中,其中构造特征方法如下:
[0019]S21:行高:本行左下角坐标的y值减去本行左上角坐标的y值;
[0020]S22:文本行左边缘到图片左边缘的距离:即本行左上角的x轴值;
[0021]S23:文本行右边缘到图片右边缘的距离:图片的宽度减去本行右上角x轴值;
[0022]S24:文本行中心坐标:(本行左上角的x坐标+本行右上角的x坐标)/2作为行中心的x坐标,(本行左上角的y坐标+本行左下角的y坐标)/2作为行中心的y坐标;
[0023]S25:文本行左边缘的缩进值:本行左边缘x坐标值减去最左边文本行的x坐标值;
[0024]S26:文本行右边缘的缩进值:最右边文本行的x坐标值减去本行右边缘坐标值;
[0025]S27:本行上边缘到上一行的上边缘的距离:本行的左上角y坐标减去上一行左上角y坐标;
[0026]S28:上一行宽度和最大行宽的比值:上一行右上角x坐标值减去上一行左上角x坐标值,获得上一行的宽度,上一行宽度除以最大行宽得到比值;
[0027]S29:行号:本行位于截图中所有文本行的第几行。
[0028]具体所述步骤S3中,其中构造的新特征包括:对S2中的每个特征计算其平均值、最大值、最小值、中值,作为新的特征加入到原始特征中。
[0029]具体所属步骤S4中,其中段落继续行数据和段落开始行数据分别具有如下特征:S41:段落开始行:通常段落开始行与上一行有强制性换行,语义上与上一行有较大差异;S42:段落继续行:通常段落继续行与上一行没有强制性的换行,语义上承接上一行。
[0030]具体所述步骤S5中,构造随机森林的具体方法为:S51:从原始训练集中使用Bootstraping方法随机有放回采样取出m个样本,共进行n次采样,生成n个训练集;S52:对于n个训练集,分别训练n个决策树模型;S53:对于单个决策树模型,每次分裂时根据基尼指数,选择特征进行分裂;S54:将生成的多颗决策树组成随机森林,按照多棵树分类器投票决定最终分类结果。
[0031]具体所述步骤S5中,随机森林判定的特征重要性依次为:上一行行宽度和最大行宽的比值、本行上边缘到上一行的上边缘的距离、文本行中心坐标的y坐标。
[0032]具体所述步骤S5中,随机森林的判断逻辑为:根据特征重要程度,随机森林的判断逻辑为:上一行行宽度和最大行宽的比值越大,本行上边缘到上一行的上边缘的距离越大,文本行中心坐标的y坐标越大,更容易判断为新开始段落行;反之,会容易被判断为继续段落行。
[0033]具体所述步骤S6中,其中判断其中的每行文字为继续行数据,还是新的段落开始数据的过程为:执行S1,S2,S3步骤,获取到新图片的特征值,将特征值输入进随进森林分类模型中,对每一行输出其为继续行数据,还是新的段落开始数据。
[0034]具体所述步骤S7中,利用到的行信息为:本行的左上角坐标,本行的左下角坐标。
[0035]具体所述步骤S7中,字体大小的计算方法为:本行左下角的坐标的y值

本行左上角的坐标的y值。
[0036]具体所述步骤S8中,利用到的行信息为:本行的左上角坐标,上一行的左上角坐标。
[0037]具体所述步骤S8中,行间距检测方案为:本行左上角坐标的y值,减去上一上左上角坐标的y值。
[0038]具体所述步骤S8中,其中行间距合规判断具体方案是:S81:如果本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种APP适老模式下文字段落间距合规性检测方法,其特征在于,包括以下步骤:S1:将开启适老模式的APP截图输入进光学字符识别(OCR)模块,识别图片中的所有文本行信息;S2:对S1中获得的文本行信息进行特征工程,提取对应特征,作为原始特征;S3:对S2收集的原始特征进行扩充,构建新的特征,加入到原始的特征中,丰富数据;S4:将截图中的文本行,标注为段落继续行数据,还是段落开始数据;S5:利用S1到S4收集的数据离线训练随机森林算法,建立随机森林分类模型;S6:输入新的一张带有文字的APP页面截图,根据随机森林模型,判断其中的每行文字为段落继续行数据,还是段落开始行数据。S7:根据行信息,计算出该行文字的字体大小;S8:根据行信息,计算出该行与上一行的行间距;S9:根据其是否是段落继续行数据,还是段落开始行数据,通过行间距的大小,判断本行与上一行的间距是否满足国标对适老化APP的要求。2.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法,其特征在于:所述步骤S1,其中所识别的文本行数据信息具体形式如下:每个文本行被一个矩形框定,矩形数据信息以列表形式存储,列表中的数据依次是左上角坐标值,右上角坐标值,右下角坐标值,左下角坐标值。其中,坐标系的原点在图片左上角,图片上边缘和左边缘分别为x轴、y轴,每个像素值为1单位,矩形四角坐标值在该坐标系下得出,坐标值中的第一个值为x轴值,第二个值为y轴值。3.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法,其特征在于:所述步骤S2中,其中构造特征方法如下:S21:行高:本行左下角坐标的y值减去本行左上角坐标的y值;S22:文本行左边缘到图片左边缘的距离:即本行左上角的x轴值;S23:文本行右边缘到图片右边缘的距离:图片的宽度减去本行右上角x轴值;S24:文本行中心坐标:(本行左上角的x坐标+本行右上角的x坐标)/2作为行中心的x坐标,(本行左上角的y坐标+本行左下角的y坐标)/2作为行中心的y坐标;S25:文本行左边缘的缩进值:本行左边缘x坐标值减去最左边文本行的x坐标值;S26:文本行右边缘的缩进值:最右边文本行的x坐标值减去本行右边缘坐标值;S27:本行上边缘到上一行的上边缘的距离:本行的左上角y坐标减去上一行左上角y坐标;S28:上一行宽度和最大行宽的比值:上一行右上角x坐标值减去上一行左上角x坐标值,获得上一行的宽度,上一行宽度除以最大行宽得到比值;S29:行号:本行位于截图中所有文本行的第几行。4.根据权利1所述的一种APP适老模式下文字段落间距合规性检测方法,其特征在于:所述步骤S3中,其中构造的新特征包括:对S2中的每个特征计算其平均值、最大值、最小...

【专利技术属性】
技术研发人员:周晟高荣秀卜佳俊
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1