一种制图中文本注记分行方法以及绘制方法技术

技术编号:6200847 阅读:185 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种制图中文本注记分行和绘制方法,该分行方法包括下列步骤:1)根据文本注记的长度确定需要分行的文本注记,并对于所述需要分行的文本注记,利用分词方法切割所述文本注记,获得候选位置集合;2)根据语义和表达习惯来从所述候选位置集合中确定分行位置来分行。通过本发明专利技术的上述注记分行和绘制方法,自动避免了整行长地名的出现,在提升了电子地图的美观性的同时,还使注记的表达符合语义从而大幅提高了分行的准确率。

【技术实现步骤摘要】

本专利技术涉及电子地图和数字制图领域,具体涉及一种文本注记的处理方法。
技术介绍
地图文本注记是地图上文字和数字的通称,是地图语言之一,直接关系着地图的美观性与实用性。因此,电子地图的制作中,注记是一项重要的内容。但是,如果使用目前的自动制图软件来发布中文注记的地图,注记工作仍然需要大量的人工干预,特别是其中的点状地物的注记工作。具体而言,针对上述点状地物注记问题,目前业内许多软件不具备对文本注记进行分行的能力。虽然少数制图工具支持注记分行,但分行效果也很不理想。以ArcGIS9.2 为例,说明其注记分行的实现手段。其主要步骤如下首先,加载Maplex扩展模块;然后,打开Label Expression对话框,用户编写VB脚本,如按照注记的字数,将前一半的文本分到第一行,后一半的文本分到下一行中。其中VB脚本如下所示function FindLabel() { if( .length<=5){return ; } else{return. substr(0, .length/2)+"\n"+.substr( .length/2);按照如上的步骤,虽然可实现注记分行,但是存在如下问题1)步骤繁琐,它要求用户手工编写脚本,对于普通用户有一定的难度;2)分行时只参考了文本字数的简单特征,因此分行后的注记不具备语义效果。例如“北辰购物中心”显示效果是“北辰购\n物中心”,其中Vl表示分行的位置,由此,短语 “购物”被分到了不同行中,可观性很差。3)标注结果不能保证注记之间互不压盖。如附图说明图1为ArcGIS 9. 2的注记分行效果, 可以看到诸多注记彼此压盖。由于注记互不压盖是注记配置的共性,是硬性约束条件,后续必须进行注记的人工编辑。显然,在大规模制图时,基本不可行。综上所述,现有技术中,用户为了得到更美观的电子地图,需要大量的后续手工注记编辑工作。所以,为了减少大规模制图中的人工编辑工作量,需要一种制图中文本注记智能分行的方法,能够语义清晰地放置地图上点状地物的注记。
技术实现思路
本专利技术的目的在于实现对点状地物的注记智能分行,使得注记的表达符合语义, 从而减少目前电子地图制图中注记的手工编辑工作量。根据本专利技术的一个方面,提供了一种制图中文本注记分行的方法,包括下列步骤1)根据文本注记的长度确定需要分行的文本注记,并对于所述需要分行的文本注记,利用分词方法切割所述文本注记,获得候选位置集合;2)根据语义和表达习惯来从所述候选位置集合中确定分行位置来分行。在上述方法中,所述文本注记的长度用根据文本注记中中文字符和其它字符的权重计算的文本注记的加权得分来表示。在上述方法中,所述文本注记的长度用文本注记中字符的个数表示。在上述方法中,所述步骤1)前还包括步骤0),读取地名缩略名称字典,建立地名与缩略名的哈希映射表;所述步骤1)中所述切割之前,对于所述需要分行的文本注记,首先查找所述哈希映射表,对于存在匹配项的文本注记,用其对应缩略名替换该存在匹配项的文本注记。在上述方法中,所述步骤2、替换为对文本注记累计得分,每达到特定分数就分行。在上述方法中,所述步骤幻后还包括判断最后一行中所有字符的个数,对于字符个数小于所分的行数的情况,则更改分行方式使得所分行数减1。在上述方法中,其中中文字符的权重大于其它字符的权重。在上述方法中,所述中文字符的权重为1,数字和英文字母的权重为0. 183,且标点符号的权重为0. 1。在上述方法中,在所述步骤1)中切割所述文本注记之后,还包括连接地名后缀和其前面的短语。在上述方法中,所述地名后缀包括表示行政区划、方位和地理名词的中文字符。在上述方法中,其特征在于,所述步骤1)中还包括通过判断是否满足下述限制条件进一步确定候选位置集合的步骤假设分行后的文本注记中上下两行文本的加权得分差距在If , ^之间,其中w为该文本注记的加权得分,d为上下两行文本的最大差距,其中d大于1。在所述方法中,所述步骤幻中所述确定分行位置时还考虑每行文本的字数。根据本专利技术的另一方面,还提供了一种文本注记绘制方法,包括1)生成文本注记的合法候选位置;2)根据权利要求1-15任一项方法所获得的分行结果,计算出该文本注记的每一行文本的宽度Wi与高度hi;其中i为该文本注记所分行数;3)对于候选位置Ci,取宽为权利要求1.一种制图中文本注记分行的方法,包括下列步骤1)根据文本注记的长度确定需要分行的文本注记,并对于所述需要分行的文本注记, 利用分词方法切割所述文本注记,获得候选位置集合;2)根据语义和表达习惯来从所述候选位置集合中确定分行位置来分行。2.根据权利要求1所述的方法,其特征在于,所述文本注记的长度用根据文本注记中中文字符和其它字符的权重计算的文本注记的加权得分来表示。3.根据权利要求1所述的方法,其特征在于,其中,所述文本注记的长度用文本注记中字符的个数表示。4.根据权利要求1至3任一项所述的方法,其特征在于,所述步骤1)前还包括步骤0),读取地名缩略名称字典,建立地名与缩略名的哈希映射表;所述步骤1)中所述切割之前,对于所述需要分行的文本注记,首先查找所述哈希映射表,对于存在匹配项的文本注记,用其对应缩略名替换该存在匹配项的文本注记。5.根据权利要求4所述的方法,其特征在于,所述地名缩略名称字典中仅包括中文字符数大于5个的地名和该地名的缩略名。6.根据权利要求4所述的方法,其特征在于,所述步骤幻替换为对文本注记累计得分,每达到特定分数就分行。7.根据权利要求6所述的方法,其特征在于,所述步骤2)后还包括判断最后一行中所有字符的个数,对于字符个数小于所分的行数的情况,则更改分行方式使得所分行数减 1。8.根据权利要求1至3任一项所述的方法,其特征在于,其中中文字符的权重大于其它字符的权重。9.根据权利要求8所述的方法,其特征在于,所述中文字符的权重为1,数字和英文字母的权重为0. 183,且标点符号的权重为0. 1。10.根据权利要求1至3任一项所述的方法,其特征在于,所述分词方法为隐马尔可夫中分分词方法。11.根据权利要求1至3任一项所述的方法,其特征在于,在所述步骤1)中切割所述文本注记之后,还包括连接地名后缀和其前面的短语。12.根据权利要求11所述的方法,其特征在于,所述地名后缀包括表示行政区划、方位和地理名词的中文字符。13.根据权利要求1至3任一项所述的方法,其特征在于,所述步骤1)中还包括通过判断是否满足下述限制条件进一步确定候选位置集合的步骤假设分行后的文本注记中上下两行文本的加权得分差距在$,^之间,其中w为该文本注记的加权得分,d为上下两行文本的最大差距,其中d大于1。14.根据权利要求13所述的方法,其特征在于,d等于3。15.根据权利要求1至3任一项所述的方法,其特征在于,所述步骤幻中所述确定分行位置时还考虑每行文本的字数。16.一种文本注记绘制方法,包括1)生成文本注记的合法候选位置;2)根据权利要求1-15任一项方法所获得的分行结果,计算出该文本注记的每一行文本的宽度Wi与高度hi;其中i为该文本注记所分行数;3)对于候选位置Ci,取宽为全文摘要本专利技术提供一种制图中文本注记分行和绘制方法,该分行方法包括下列步骤1)根据文本注记的长度确定需要分行的文本注记,并对本文档来自技高网
...

【技术保护点】
1.一种制图中文本注记分行的方法,包括下列步骤:1)根据文本注记的长度确定需要分行的文本注记,并对于所述需要分行的文本注记,利用分词方法切割所述文本注记,获得候选位置集合;2)根据语义和表达习惯来从所述候选位置集合中确定分行位置来分行。

【技术特征摘要】

【专利技术属性】
技术研发人员:孙尚椿李亚平方金云刘栋
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1