当前位置: 首页 > 专利查询>曾传德专利>正文

用于文档自动排版的方法技术

技术编号:17007363 阅读:22 留言:0更新日期:2018-01-11 03:46
本发明专利技术公开了用于文档自动排版的方法,包括以下步骤:S1:将每一个文本块进行赋值,赋值采用文本块所对应的左上角坐标值;S2:任意选择一个不是核心对象的文本块作为核心对象;选择文本块密度P和边界半径R;所述边界半径R采用几何距离;S3:当核心对象的半径R范围之内的文本块数量超过文本块密度P,则将该范围内所有的文本块视为核心对象,并划入一类然后执行S3;S4:当核心对象的半径R范围之内的文本块数量未超过文本块密度P,将该文本块取消核心对象,并重新执行S2。本发明专利技术用于文档自动排版的方法,通过上述步骤,实现了对文本文档中文本块的快速分类,从而节省了产品的成本。

【技术实现步骤摘要】
用于文档自动排版的方法
本专利技术涉及计算机
,具体涉及用于文档自动排版的方法。
技术介绍
软件文档或者源代码文档是指与软件系统及其软件工程过程有关联的文本实体。文档的类型包括软件需求文档,设计文档,测试文档,用户手册等。其中的需求文档,设计文档和测试文档一般是在软件开发过程中由开发者写就的,而用户手册等非过程类文档是由专门的非技术类写作人员写就的。文档能提高软件开发的效率,保证软件的质量,而且在软件的使用过程中有指导、帮助、解惑的作用,尤其在维护工作中,文档是不可或缺的资料。然而现有的文档,尤其是开发类的用户手册由于篇幅巨大且需要不同的部门分开编写,所以在排版时花费的时间过长,大幅提高了产品的时间成本。
技术实现思路
本专利技术所要解决的技术问题是现有的开发类用户手册由于篇幅巨大且需要不同的部门分开编写,所以在排版时花费的时间过长,大幅提高了产品的时间成本,目的在于提供用于文档自动排版的方法,解决上述问题。本专利技术通过下述技术方案实现:用于文档自动排版的方法,包括以下步骤:S1:将每一个文本块进行赋值,赋值采用文本块所对应的左上角坐标值;S2:任意选择一个不是核心对象的文本块作为核心对象;选择文本块密度P和边界半径R;所述边界半径R采用几何距离;S3:当核心对象的半径R范围之内的文本块数量超过文本块密度P,则将该范围内所有的文本块视为核心对象,并划入一类然后执行S3;S4:当核心对象的半径R范围之内的文本块数量未超过文本块密度P,将该文本块取消核心对象,并重新执行S2。现有技术中,文档,尤其是开发类的用户手册由于篇幅巨大,普遍篇幅在两千页以上,而且不同的内容需要不同的部门分开编写,将这些内容进行排版时,会花费大量的人力和时间,大幅提高了产品的成本。本专利技术应用时,先将每一个文本块进行赋值,赋值采用文本块所对应的左上角坐标值,再任意选择一个不是核心对象的文本块作为核心对象;选择文本块密度P和边界半径R;所述边界半径R采用几何距离,这里所说的几何距离,是指一个平面上的两个点的直线距离,再然后当核心对象的半径R范围之内的文本块数量超过文本块密度P,则将该范围内所有的文本块视为核心对象,并划入一类,这样子就可以自动的将相似的文档分类到一起,如此循环,而当当核心对象的半径R范围之内的文本块数量未超过文本块密度P,将该文本块取消核心对象,而重新选择核心对象,从而保证了一个类中的相似度非常高,排除了不同的文本块分到同一类的情况。本专利技术通过上述步骤,实现了对文本文档中文本块的快速分类,从而节省了产品的成本。进一步的,本专利技术还包括以下步骤:S5:当所有的文本块都执行过S2时,将不是核心对象的所有文本块视为噪音文本块。进一步的,本专利技术还包括以下步骤:S6:将划分好的类按照规则重新进行排版。进一步的,所述文本块密度P正比于边界半径R的平方。本专利技术应用时,由于文本块密度P正比于边界半径R的平方,所以保障了在分类的过程中,误差值产生很低。进一步的,步骤S4中所述取消核心对象仅限于任意选择得到的核心对象。本专利技术与现有技术相比,具有如下的优点和有益效果:本专利技术用于文档自动排版的方法,通过上述步骤,实现了对文本文档中文本块的快速分类,从而节省了产品的成本。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下面结合实施例,对本专利技术作进一步的详细说明,本专利技术的示意性实施方式及其说明仅用于解释本专利技术,并不作为对本专利技术的限定。实施例本专利技术用于文档自动排版的方法,包括以下步骤:S1:将每一个文本块进行赋值,赋值采用文本块所对应的左上角坐标值;S2:任意选择一个不是核心对象的文本块作为核心对象;选择文本块密度P和边界半径R;所述边界半径R采用几何距离;S3:当核心对象的半径R范围之内的文本块数量超过文本块密度P,则将该范围内所有的文本块视为核心对象,并划入一类然后执行S3;S4:当核心对象的半径R范围之内的文本块数量未超过文本块密度P,将该文本块取消核心对象,并重新执行S2。本专利技术还包括以下步骤:S5:当所有的文本块都执行过S2时,将不是核心对象的所有文本块视为噪音文本块。本专利技术还包括以下步骤:S6:将划分好的类按照规则重新进行排版。所述文本块密度P正比于边界半径R的平方。步骤S4中所述取消核心对象仅限于任意选择得到的核心对象。本实施例实施时,先将每一个文本块进行赋值,赋值采用文本块所对应的左上角坐标值,再任意选择一个不是核心对象的文本块作为核心对象;选择文本块密度P和边界半径R;所述边界半径R采用几何距离,这里所说的几何距离,是指一个平面上的两个点的直线距离,再然后当核心对象的半径R范围之内的文本块数量超过文本块密度P,则将该范围内所有的文本块视为核心对象,并划入一类,这样子就可以自动的将相似的文档分类到一起,如此循环,而当当核心对象的半径R范围之内的文本块数量未超过文本块密度P,将该文本块取消核心对象,而重新选择核心对象,从而保证了一个类中的相似度非常高,排除了不同的文本块分到同一类的情况。本专利技术通过上述步骤,实现了对文本文档中文本块的快速分类,从而节省了产品的成本。由于文本块密度P正比于边界半径R的平方,所以保障了在分类的过程中,误差值产生很低。以上所述的具体实施方式,对本专利技术的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本专利技术的具体实施方式而已,并不用于限定本专利技术的保护范围,凡在本专利技术的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网...

【技术保护点】
用于文档自动排版的方法,其特征在于,包括以下步骤:S1:将每一个文本块进行赋值,赋值采用文本块所对应的左上角坐标值;S2:任意选择一个不是核心对象的文本块作为核心对象;选择文本块密度P和边界半径R;所述边界半径R采用几何距离;S3:当核心对象的半径R范围之内的文本块数量超过文本块密度P,则将该范围内所有的文本块视为核心对象,并划入一类然后执行S3;S4:当核心对象的半径R范围之内的文本块数量未超过文本块密度P,将该文本块取消核心对象,并重新执行S2。

【技术特征摘要】
1.用于文档自动排版的方法,其特征在于,包括以下步骤:S1:将每一个文本块进行赋值,赋值采用文本块所对应的左上角坐标值;S2:任意选择一个不是核心对象的文本块作为核心对象;选择文本块密度P和边界半径R;所述边界半径R采用几何距离;S3:当核心对象的半径R范围之内的文本块数量超过文本块密度P,则将该范围内所有的文本块视为核心对象,并划入一类然后执行S3;S4:当核心对象的半径R范围之内的文本块数量未超过文本块密度P,将该文本块取消核心对象,并重新执行S2。2.根据权利要...

【专利技术属性】
技术研发人员:曾传德
申请(专利权)人:曾传德
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1