一种蒙板叠加词云生成方法及其系统技术方案

技术编号:38714218 阅读:16 留言:0更新日期:2023-09-08 14:57
本发明专利技术涉及一种蒙板叠加词云生成方法,所述方法为:在蒙板中输入词云形状主图和词云形状副图;缩小词云形状副图,把词云形状主图和修改后的词云形状副图合并成待生成词云形状图;输入文本,然后对输入的文本进行分词处理,得到分词处理后的词语;获取各词语对应的词频,提取出核心词语;提取待生成词云形状图的形状轮廓并获取待生成词云形状图的中心位置;利用形状螺旋线放置核心词语,将剩余的词语放置入形状螺旋线的空隙中,形成形状词云;通过形状词云生成形状词云图,把词云形状副图放回到形状词云图,生成带有词云形状副图的形状词云图,符合人们快速阅读的习惯,能更直观地反映出具体文本的内容,节省读者时间。节省读者时间。节省读者时间。

【技术实现步骤摘要】
一种蒙板叠加词云生成方法及其系统


[0001]本专利技术涉及计算机
,特别是一种蒙板叠加词云生成方法及其系统。

技术介绍

[0002]词云图是文本数据中关键词的视觉化的图片表述,是对文本中出现频率较高的关键词给予以视觉上的突出,形成关关键词突出渲染,从而过滤掉大量的文本信息,使浏览者只需要一眼扫过就能够领略文本数据的所要表述的主要大意。
[0003]现有的词云图处理大多是在处理文本信息后,在图片形状上进行排布,通常都是文字,虽然能按词云大小看出图所要表述的大体意思,但主题不够明确,而要是能在此基础上加上公司的log或者品牌标识或者词云图所表达主要含义的图标,则更能够突出主题。

技术实现思路

[0004]为克服上述问题,本专利技术的目的是提供一种蒙板叠加词云生成方法及其系统,能够通过图片之间的组合,以及根据词语频率自动化排布,生成词云图,效率高,能更直观地反映出具体文本的内容。
[0005]本专利技术采用以下方案实现:
[0006]一种蒙板叠加词云生成方法,所述方法步骤如下:
[0007]步骤1:在蒙板中输入词云形状主图和词云形状副图;
[0008]步骤2:选择词云形状主图的一个区域,然后将词云形状副图缩小至与所述区域相等大小,并放置在所述区域中,词云形状主图和缩小后的词云形状副图合成待生成词云形状图;
[0009]步骤3:输入文本,然后对输入的文本进行分词处理,得到分词处理后的词语;
[0010]步骤4:获取各词语对应的词频,提取出核心词语,即出现频率高的词语;
[0011]步骤5:提取待生成词云形状图的形状轮廓并获取待生成词云形状图的中心位置,创建一个形状螺旋线,所述中心位置为形状螺旋线的起点;
[0012]步骤6:利用形状螺旋线放置核心词语,将剩余的词语作为填充词语放置入形状螺旋线的空隙中,将形状螺旋线的空隙填补完整,形成形状词云;
[0013]步骤7:通过所述形状词云生成形状词云图,把步骤1中的词云形状副图放回到生成的形状词云图中,最后生成带有词云形状副图的形状词云图。
[0014]进一步的,步骤2进一步具体为:在词云形状主图中选择一个区域,把词云形状副图缩小到词云形状主图的所述区域中,并进行图形叠加,非透明位置进行像素化处理,把词云形状主图与词云形状副图重合的位置设置成透明,合成一个待生成词云形状图。
[0015]进一步的,步骤3进一步具体为:通过jieba分词库对文本进行分词,并对文本中的词语进行抽取。
[0016]进一步的,步骤5进一步具体为:通过轮廓法,对待生成词云形状图进行边缘检测,得到待生成词云形状图的轮廓,通过OpenCV库中的moments()函数实现计算轮廓的重心,
作为待生成词云形状图的几何中心。
[0017]进一步的,步骤6进一步具体为:词云的布局以中心为起始点,逐渐以环形向外围扩展,形成文字从中间到外围权重,所述权重为步骤5中所计算的词的频率,词语用到的次数越多,显示出来的字体越大,并放置在图中的越靠中心的位置,随频率减小逐渐外扩,权重大的词语分布在靠近中心的地方,越靠外,词汇权重越低,图形排布整体呈环形向外扩展。
[0018]一种蒙板叠加词云生成系统,所述系统包括:输入模块、词云图合成模块、文本分词模块、词频获取模块、词云图处理模块、词语放置模块、输出模块;
[0019]所述输入模块用于在蒙板中输入词云形状主图和词云形状副图;
[0020]所述词云图合成模块用于选择词云形状主图的一个区域,然后将词云形状副图缩小至与所述区域相等大小,并放置在所述区域中,词云形状主图和缩小后的词云形状副图合成待生成词云形状图;
[0021]所述文本分词模块用于输入文本,然后对输入的文本进行分词处理,得到分词处理后的词语;
[0022]所述词频获取模块用于获取各词语对应的词频,提取出核心词语,即出现频率高的词语;
[0023]所述词云图处理模块用于提取待生成词云形状图的形状轮廓并获取待生成词云形状图的中心位置,创建一个形状螺旋线,所述中心位置为形状螺旋线的起点;
[0024]所述词语放置模块用于利用形状螺旋线放置核心词语,将剩余的词语作为填充词语放置入形状螺旋线的空隙中,将形状螺旋线的空隙填补完整,形成形状词云;
[0025]所述输出模块用于通过所述形状词云生成形状词云图,把输入模块中的词云形状副图放回到生成的形状词云图中,最后生成带有词云形状副图的形状词云图。
[0026]进一步的,所述词云图合成模块进一步具体为:在词云形状主图中选择一个区域,把词云形状副图缩小到词云形状主图的所述区域中,并进行图形叠加,非透明位置进行像素化处理,把词云形状主图与词云形状副图重合的位置设置成透明,合成一个待生成词云形状图。
[0027]进一步的,所述文本分词模块进一步具体为:通过jieba分词库对文本进行分词,并对文本中的词语进行抽取。
[0028]进一步的,所述词云图处理模块进一步具体为:通过轮廓法,对待生成词云形状图进行边缘检测,得到待生成词云形状图的轮廓,通过OpenCV库中的moments()函数实现计算轮廓的重心,作为待生成词云形状图的几何中心。
[0029]进一步的,所述词语放置模块进一步具体为:词云的布局以中心为起始点,逐渐以环形向外围扩展,形成文字从中间到外围权重,所述权重为词云图处理模块中所计算的词的频率,词语用到的次数越多,显示出来的字体越大,并放置在图中的越靠中心的位置,随频率减小逐渐外扩,权重大的词语分布在靠近中心的地方,越靠外,词汇权重越低,图形排布整体呈环形向外扩展。
[0030]本专利技术的有益效果在于:
[0031]本专利技术提供一种蒙板叠加词云生成方法及其系统,改进后的词云图更具吸引力,视觉冲击更强,符合人们快速阅读的习惯,在主题方面更为直接,加上想要表述的主题logo
图标,能更直观地反映出具体文本的内容,能够节省读者时间,使读者在短时间内获得关于文本数据的主要信息。
附图说明
[0032]图1为本专利技术方法的流程图;
[0033]图2为本专利技术系统的结构框图;
[0034]图3为本专利技术实施例中词云形状主图;
[0035]图4为本专利技术实施例中词云形状副图;
[0036]图5为本专利技术实施例中待生成词云形状图;
[0037]图6为本专利技术实施例中文本及生成的形状词云图的示意图;
[0038]图7为本专利技术实施例中带有词云形状副图的形状词云图。
具体实施方式
[0039]下面结合附图对本专利技术做进一步说明。
[0040]一种蒙板叠加词云生成方法,所述方法步骤如下:
[0041]步骤1:在蒙板中输入词云形状主图和词云形状副图;
[0042]步骤2:选择词云形状主图的一个区域,然后将词云形状副图缩小至与所述区域相等大小,并放置在所述区域中,词云形状主图和缩小后的词云形状副图合成待生成词云形状图;...

【技术保护点】

【技术特征摘要】
1.一种蒙板叠加词云生成方法,其特征在于,所述方法步骤如下:步骤1:在蒙板中输入词云形状主图和词云形状副图;步骤2:选择词云形状主图的一个区域,然后将词云形状副图缩小至与所述区域相等大小,并放置在所述区域中,词云形状主图和缩小后的词云形状副图合成待生成词云形状图;步骤3:输入文本,然后对输入的文本进行分词处理,得到分词处理后的词语;步骤4:获取各词语对应的词频,提取出核心词语,即出现频率高的词语;步骤5:提取待生成词云形状图的形状轮廓并获取待生成词云形状图的中心位置,创建一个形状螺旋线,所述中心位置为形状螺旋线的起点;步骤6:利用形状螺旋线放置核心词语,将剩余的词语作为填充词语放置入形状螺旋线的空隙中,将形状螺旋线的空隙填补完整,形成形状词云;步骤7:通过所述形状词云生成形状词云图,把步骤1中的词云形状副图放回到生成的形状词云图中,最后生成带有词云形状副图的形状词云图。2.根据权利要求1所述的一种蒙板叠加词云生成方法,其特征在于,步骤2进一步具体为:在词云形状主图中选择一个区域,把词云形状副图缩小到词云形状主图的所述区域中,并进行图形叠加,非透明位置进行像素化处理,把词云形状主图与词云形状副图重合的位置设置成透明,合成一个待生成词云形状图。3.根据权利要求1所述的一种蒙板叠加词云生成方法,其特征在于,步骤3进一步具体为:通过jieba分词库对文本进行分词,并对文本中的词语进行抽取。4.根据权利要求1所述的一种蒙板叠加词云生成方法,其特征在于,步骤5进一步具体为:通过轮廓法,对待生成词云形状图进行边缘检测,得到待生成词云形状图的轮廓,通过OpenCV库中的moments()函数实现计算轮廓的重心,作为待生成词云形状图的几何中心。5.根据权利要求1所述的一种蒙板叠加词云生成方法,其特征在于,步骤6进一步具体为:词云的布局以中心为起始点,逐渐以环形向外围扩展,形成文字从中间到外围权重,所述权重为步骤5中所计算的词的频率,词语用到的次数越多,显示出来的字体越大,并放置在图中的越靠中心的位置,随频率减小逐渐外扩,权重大的词语分布在靠近中心的地方,越靠外,词汇权重越低,图形排布整体呈环形向外扩展。6.一种蒙板叠加词云生成系统,其特征在于,所述系统包括:输入模块、词云图合成模块、文本分词模块、词频获取模块、词云图处理模块、...

【专利技术属性】
技术研发人员:刘德建李佳张延锋林贵华郑传樟
申请(专利权)人:福建天晴在线互动科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1