生成人物词云画像的方法及装置制造方法及图纸

技术编号:17364434 阅读:30 留言:0更新日期:2018-02-28 15:03
本发明专利技术实施例提供一种生成人物词云画像的方法、装置、电子设备及计算机可读介质,涉及文本处理技术领域。该生成人物词云画像的方法包括:采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;利用预设词库对输入的文本进行处理,生成词汇的排序文档,所述预设词库中包括多个词汇;按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中,得到人物词云画像。该方法可以根据输入的图片以及文本快速生成人像词云画像,既可以快速、实时的反应数据的变化,而且能够保证画像的准确性,因此可以得到美观、色彩丰富的画像。

A method and device for creating a cloud portrait of a character word

An embodiment of the invention provides a method, a device, an electronic device and a computer readable medium for generating a cloud picture of a character word, which relates to the technical field of text processing. The method includes generating character word cloud: the portrait of the input lead color image processing, get the picture color lead effect; use the default thesaurus to the input text processing, sorting document generation of vocabulary, the presupposition includes a plurality of vocabulary thesaurus; according to the sorting document of the vocabulary of the vocabulary fill in the lead color effect of the picture, get the character word cloud picture. This method can generate cloud images quickly based on the input pictures and texts. It can not only reflect the changes of data quickly and realtime, but also ensure the accuracy of the portrait. Therefore, beautiful and colorful images can be obtained.

【技术实现步骤摘要】
生成人物词云画像的方法及装置
本专利技术实施例总体涉及文本处理
,具体而言,涉及一种生成人物词云画像的方法及装置。
技术介绍
“词云”是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页的人只要一眼扫过文本就可以领略文本的主旨。在数据分析过程中,人物词云画像是一种对人物特征信息友好、易懂的描述形式。现有技术方案在生成人物词云画像过程中,主要采用以下两种方式:(1)使用前期数据加工,再加上后期对图片进行美化留白后,把加工好的数据逐个填入,优点是生成的画像准确无误,美观程度较高,缺点是生成画像的周期太长,无法实时、快速地响应数据变化。(2)直接使用图片和词汇生成人像词云画像,图1示出直接生成人物词云画像前的原始图片效果图,图2示出直接生成人物词云画像的效果图,这种方式的优点是生成画像的周期短,但是参见图2可以看出,缺点是生成的画像失真比较严重,色彩杂乱,不能正确的展示人物形象,效果不佳,无法正常使用。因此,现有技术方案的两种处理方式均不能在缩短生成画像周期的同时保证画像的准确性,还存在有待改进之处。在所述
技术介绍
部分公开的上述信息仅用于加强对本专利技术实施例的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本专利技术实施例提供一种生成人物词云画像的方法、装置、电子设备及计算机可读介质,解决现有技术方案不能快速准确的生成人物词云画像的技术问题。本专利技术实施例的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术实施例的实践而习得。根据本专利技术实施例的第一方面,提供一种生成人物词云画像的方法,包括:采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;利用预设词库对输入的文本进行处理,生成词汇的排序文档,所述预设词库中包括多个词汇;按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中,得到人物词云画像。在本专利技术的一些实施例中,对输入的图片进行处理之前还包括:判断所述输入的图片的格式是否符合预设的格式要求,如果所述输入的图片的格式符合预设的格式要求,则继续对所述输入的图片采用彩铅方式进行处理;如果所述输入的图片的格式不符合预设的格式要求,则重新输入新的图片,其中所述预设的格式要求包括PNG、JPG。在本专利技术的一些实施例中,采用彩铅方式对输入的图片进行处理包括:将所述输入的图片转换成黑白图片;对所述黑白图片进行彩铅化处理,得到所述彩铅效果图片。在本专利技术的一些实施例中,利用预设词库对输入的文本进行处理,生成词汇的排序文档包括:对所述输入的文本去除停用词;利用所述预设词库计算所述预设词库中各个词汇的词频以及权重;根据所述词汇的词频和权重计算得到所述词汇的排序参考值;按照所述词汇的排序参考值对所述词汇进行排序得到所述词汇的排序文档。在本专利技术的一些实施例中,所述输入的文本来源于包含有所述预设词库中词汇的文件,计算所述词汇的权重包括:统计包含所述词汇的文件的数目;根据所述包含所述词汇的文件的数目与总文件的数目计算得到所述词汇的权重。在本专利技术的一些实施例中,所述词汇的排序参考值为所述词汇的词频与所述词汇的权重的乘积。在本专利技术的一些实施例中,按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中还包括:根据所述词汇的排序参考值的大小确定填入所述词汇的字体大小。根据本专利技术实施例的第二方面,提供一种生成人物词云画像的装置,包括:图片处理模块,配置为采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;文本处理模块,配置为利用预设词库对输入的文本进行处理,生成词汇的排序文档,所述预设词库中包括多个词汇;填入模块,配置为按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中,得到人物词云画像。在本专利技术的一些实施例中,还包括:格式判断模块,配置为对输入的图片进行处理之前,判断所述输入的图片的格式是否符合预设的格式要求,如果所述输入的图片的格式符合预设的格式要求,则继续对所述输入的图片采用彩铅方式进行处理;如果所述输入的图片的格式不符合预设的格式要求,则重新输入新的图片,其中所述预设的格式要求包括PNG、JPG。在本专利技术的一些实施例中,所述图片处理模块包括:黑白转换子模块,配置为将所述输入的图片转换成黑白图片;彩铅化子模块,配置为对所述黑白图片进行彩铅化处理,得到所述彩铅效果图片。在本专利技术的一些实施例中,所述文本处理模块包括:去停用词子模块,配置为对所述输入的文本去除停用词;第一计算子模块,配置为利用所述预设词库计算所述预设词库中各个词汇的词频以及权重;第二计算子模块,配置为根据所述词汇的词频和权重计算得到所述词汇的排序参考值;排序子模块,配置为按照所述词汇的排序参考值对所述词汇进行排序得到所述词汇的排序文档。在本专利技术的一些实施例中,所述输入的文本来源于包含有所述预设词库中词汇的文件,所述第一计算子模块用于统计包含所述词汇的文件的数目,并根据所述包含所述词汇的文件的数目与总文件的数目计算得到所述词汇的权重。在本专利技术的一些实施例中,所述第二计算子模块根据所述词汇的词频与所述词汇的权重的乘积得到所述词汇的排序参考值。在本专利技术的一些实施例中,所述填入模块根据所述词汇的排序参考值的大小确定填入所述词汇的字体大小。根据本专利技术实施例的第三方面,提供一种电子设备,包括:存储器;处理器及存储在该存储器上并可在该处理器上运行的计算机程序,该程序被该处理器执行时实现上述的方法步骤。根据本公开实施例的第四方面,提供一种计算机可读介质,其上存储有计算机可执行指令,所述可执行指令被处理器执行时实现上述的方法步骤。根据本专利技术实施例提供的生成人物词云画像的方法、装置、电子设备及计算机可读介质,可以根据输入的图片以及文本快速生成人像词云画像,既可以快速、实时的反应数据的变化,而且能够保证画像的准确性,因此可以得到美观、色彩丰富的画像。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本专利技术实施例。附图说明通过参照附图详细描述其示例实施例,本专利技术实施例的上述和其它目标、特征及优点将变得更加显而易见。图1示出现有技术方案中直接生成人物词云画像前的原始图片效果图。图2示出现有技术方案中直接生成人物词云画像的效果图。图3示出本专利技术实施例提供的一种生成人物词云画像的方法的流程图。图4示出本专利技术实施例中步骤S31的流程图。图5示出本专利技术实施例中对图1所示的图片转换成黑白图片的效果图。图6示出本专利技术实施例中对图5所示黑白图片彩铅化处理后的效果图。图7示出本专利技术实施例中步骤S32的流程图。图8示出本专利技术实施例中词汇的排序文档的示意图。图9示出本专利技术实施例中最终得到的人物词云图像的效果图。图10示出本专利技术实施例中提供的一种生成人物词云画像的装置的示意图。图11示出本专利技术实施例中图片处理模块的示意图。图12示出本专利技术实施例中文本处理模块的示意图。图13示出本专利技术实施例提供的另一种生成人物词云画像的装置的示意图。图14示出本专利技术再一实施例提供的适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方本文档来自技高网...
生成人物词云画像的方法及装置

【技术保护点】
一种生成人物词云画像的方法,其特征在于,包括:采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;利用预设词库对输入的文本进行处理,生成词汇的排序文档,所述预设词库中包括多个词汇;按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中,得到人物词云画像。

【技术特征摘要】
1.一种生成人物词云画像的方法,其特征在于,包括:采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;利用预设词库对输入的文本进行处理,生成词汇的排序文档,所述预设词库中包括多个词汇;按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中,得到人物词云画像。2.根据权利要求1所述的方法,其特征在于,对输入的图片进行处理之前还包括:判断所述输入的图片的格式是否符合预设的格式要求,如果所述输入的图片的格式符合预设的格式要求,则继续对所述输入的图片采用彩铅方式进行处理;如果所述输入的图片的格式不符合预设的格式要求,则重新输入新的图片,其中所述预设的格式要求包括PNG、JPG。3.根据权利要求1所述的方法,其特征在于,采用彩铅方式对输入的图片进行处理包括:将所述输入的图片转换成黑白图片;对所述黑白图片进行彩铅化处理,得到所述彩铅效果图片。4.根据权利要求1所述的方法,其特征在于,利用预设词库对输入的文本进行处理,生成词汇的排序文档包括:对所述输入的文本去除停用词;利用所述预设词库计算所述预设词库中各个词汇的词频以及权重;根据所述词汇的词频和权重计算得到所述词汇的排序参考值;按照所述词汇的排序参考值对所述词汇进行排序得到所述词汇的排序文档。5.根据权利要求4所述的方法,其特征在于,所述输入的文本来源于包含有所述预设词库中词汇的文件,计算所述词汇的权重包括:统计包含所述词汇的文件的数目;根据所述包含所述词汇的文件的数目与总文件的数目计算得到所述词汇的权重。6.根据权利要求4或5所述的方法,其特征在于,所述词汇的排序参考值为所述词汇的词频与所述词汇的权重的乘积。7.根据权利要求6所述的方法,其特征在于,按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中还包括:根据所述词汇的排序参考值的大小确定填入所述词汇的字体大小。8.一种生成人物词云画像的装置,其特征在于,包括:图片处理模块,配置为采用彩铅方式对输入的图片进行处理,得到彩铅效果图片;文本处理模块,配置为利用预设词库对输入的文本进行处理,生成词汇的排序文档,所述预设词库中包括多个词汇...

【专利技术属性】
技术研发人员:周松文何金虎
申请(专利权)人:泰康保险集团股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1