一种基于空间位置的CAD电子数据中文本信息重构方法技术

技术编号:13963571 阅读:91 留言:0更新日期:2016-11-07 14:40
本发明专利技术公开了一种基于空间位置的CAD电子数据中文本信息重构方法,该方法通过将离散文字对象读入内存中,以文字对象基点Y坐标由大到小的顺序排序,然后选择同一行文字对象,根据文字对象基点的X坐标由小到大的顺序排序,得到由左到右的有序文本序列,最后将每行的文本内容依次连接和重组,得到具有逻辑关系的多行文本信息。本发明专利技术基于文字对象的基点坐标,通过两次排序将离散的文字对象重构为具有逻辑关系的文本信息,相比现有技术的方法,简单便捷、易于操作,可靠性强。

【技术实现步骤摘要】

本专利技术涉及一种重构方法,尤其涉及一种基于空间位置的CAD电子数据中文本信息重构方法
技术介绍
计算机辅助设计(CAD-ComputerAidedDesign)是指利用计算机及其图形设备帮助设计人员进行设计工作。文本是CAD电子数据中的重要数据类型。通过文字可以表达图形、符号未能表达清楚的设计意图,是对设计对象属性信息的重要补充。现有技术中,一般通过人工读图的方式理解CAD电子数据中的文本。在CAD数据共享和文本自动提取领域,主要实现CAD文本对象向其他格式转换或者提取独立的文本段内容,再通过人工进行理解和重组,方法比较繁琐,效率不高。
技术实现思路
为了解决上述技术所存在的不足之处,本专利技术提供了一种基于空间位置的CAD电子数据中文本信息重构方法,将CAD电子数据中由独立的文字对象自动重构为具有完整逻辑的文本信息。为了解决以上技术问题,本专利技术采用的技术方案是:一种基于空间位置的CAD电子数据中文本信息重构方法,该方法的具体步骤如下:步骤1:将存储在CAD电子数据中待重构的离散文字对象读入内存中,包括文字对象的文本内容、文本高度和基点坐标;步骤2:按照物理存储顺序将文字对象依次读入内存中,然后根据文字对象基点的Y坐标,将离散文字对象进行排序分行,以文字对象的文本高度作为容差,当两个文字对象基点Y坐标的差值在容差范围内时,将它们作为同一行的文字对象,然后将各行文字对象按照基点Y坐标由大到小的顺序排序,就可将离散的文字对象分为若干行;步骤3:然后根据步骤2中得到的若干行文字对象,选择同一行文字对象,根据同一行内文字对象基点的X坐标,将单行离散文字对象进行重排序;对于步骤2中分行后的每行文字对象,按照它们的基点X坐标由小到大的顺序排序,得到由左到右的有序文本序列。步骤4:根据步骤2和步骤3分别得到的行内顺序和行序列,得到由左到右,由上到下的多行有序文本;然后将每行的文本内容依次连接和重组,得到具有逻辑关系的多行文本信息。本专利技术基于文字对象的基点坐标,通过对离散文字对象的基点Y坐标和基点X坐标进行两次排序,将离散的文字对象重构为具有逻辑关系的文本信息,相比现有技术的方法,简单便捷、易于操作,可靠性强。附图说明图1是本专利技术的整体流程图。图2是本专利技术文字对象的物理存储顺序示意框图。图3是本专利技术文字对象排序前的逻辑顺序示意框图。图4是本专利技术文字对象进行Y坐标排序后的逻辑顺序示意框图。图5是本专利技术文字对象进行X坐标排序后的逻辑顺序示意框图。具体实施方式下面结合附图和具体实施方式对本专利技术作进一步详细的说明。如图1所示,本专利技术根据独立文字对象的基点坐标,首先分析哪些文字对象属于同一行,再对于同一行的文本对象进行分析确定其先后顺序,然后根据文本对象的先后顺序进行重组,得到具有逻辑关系的重组文本信息;具体步骤如下:步骤1:读入待重构的离散文字对象;将存储在CAD电子数据中的文字对象读入内存中,具体包括文字对象的文本内容、文本高度和基点坐标。其中,文字对象在计算机内存中的数据组织方式是通过用计算机编程语言实现的内存数据结构,内存数据结构组织和管理文字对象的文本内容、文本高度和基点坐标。如图2所示包含了4个文本对象TextA-TextD,它们在图2中按照虚线框排列显示。步骤2:如图3所示,按照物理存储顺序将TextA到TextD内的文字对象依次读入内存中,然后根据文字对象基点的Y坐标,将离散文字对象进行排序分行。具体方法是:以文字对象的文本高度作为容差,当两个文字对象基点Y坐标的差值在容差范围内时,将它们作为同一行的文字对象,然后将各行文字对象按照基点Y坐标由大到小的顺序排序,就可将离散的文字对象分为若干行。如图4所示TextC与TextD的基点Y坐标相同,并且较大,因此作为第一行,而TextA与TextB的基点Y坐标相同,并且小于TextC与TextD的基点Y坐标,因此作为第二行。步骤3:然后根据步骤2中得到的同一行内的文字对象基点的X坐标,将单行离散文字对象进行重排序;对于步骤2中分行后的每行文字对象,按照它们的基点X坐标进行排序。具体方法为:文字对象的基点X坐标越小,越靠近左侧,按照书写习惯在逻辑上越靠前,因此将每行中的文字对象按照基点X坐标由小到大的顺序排序,就得到由左到右的有序文本序列。如图4-图5所示第一行TextC与TextD的基点X坐标比较,TextD坐标较小,因此TextD在前,TextC在后;同理,TextB在前,TextA在后。步骤4:根据步骤2和步骤3分别得到的行内顺序和行序列,将离散文字对象进行连接和重组。经过步骤2和步骤3的两次排序,就可以得到由左到右,由上到下的多行有序文本;然后将每行的文本内容依次连接,即可将离散的文字对象重组为具有逻辑关系的多行文本信息。如图5所示,排序后的逻辑顺序依次为TextD、TextC、TextB、TextA,依次将各个文本对象存储的文字内容连接起来,得到重构的文本信息。本专利技术图2-图5所示的TextA-TextD是代表虚线框的文本对象,在原始数据中文本对象是拆分开存储的,不是一个完整的文本段落,通过本专利技术的方法将TextA-TextD重构到一起。由此可见,本专利技术基于文字对象的基点坐标,通过两次排序可将离散的文字对象重构为具有逻辑关系的文本信息。上述实施方式并非是对本专利技术的限制,本专利技术也并不仅限于上述举例,本
的技术人员在本专利技术的技术方案范围内所做出的变化、改型、添加或替换,也均属于本专利技术的保护范围。本文档来自技高网
...

【技术保护点】
一种基于空间位置的CAD电子数据中文本信息重构方法,其特征在于,该方法的具体步骤如下:步骤1:将存储在CAD电子数据中待重构的离散文字对象读入内存中,包括文字对象的文本内容、文本高度和基点坐标;步骤2:按照物理存储顺序将文字对象依次读入内存中,然后根据文字对象基点的Y坐标,将离散文字对象进行排序分行,得到若干行文字对象;步骤3:然后根据步骤2中得到的若干行文字对象,选择同一行文字对象,根据同一行内文字对象基点的X坐标,将单行离散文字对象进行重排序;对于步骤2中分行后的每行文字对象,按照它们的基点X坐标进行排序,得到文字对象的有序文本坐标排序;步骤4:根据步骤2和步骤3分别得到的行内顺序和行序列,得到由左到右,由上到下的多行有序文本;然后将每行的文本内容依次连接和重组,得到具有逻辑关系的多行文本信息。

【技术特征摘要】
1.一种基于空间位置的CAD电子数据中文本信息重构方法,其特征在
于,该方法的具体步骤如下:
步骤1:将存储在CAD电子数据中待重构的离散文字对象读入内存中,包括
文字对象的文本内容、文本高度和基点坐标;
步骤2:按照物理存储顺序将文字对象依次读入内存中,然后根据文字对
象基点的Y坐标,将离散文字对象进行排序分行,得到若干行文字对象;
步骤3:然后根据步骤2中得到的若干行文字对象,选择同一行文字对象,
根据同一行内文字对象基点的X坐标,将单行离散文字对象进行重排序;对于
步骤2中分行后的每行文字对象,按照它们的基点X坐标进行排序,得到文字对
象的有序文本坐标排序;
步骤4:根据步骤2和步骤3分别得到的行内顺序和行序...

【专利技术属性】
技术研发人员:万庆周良辰贾明元闾国年张明波谢炯
申请(专利权)人:中国科学院地理科学与资源研究所南京师范大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1