生成人物词云画像的方法及装置制造方法及图纸

技术编号：17364434 阅读：30 留言：0更新日期：2018-02-28 15:03

本发明专利技术实施例提供一种生成人物词云画像的方法、装置、电子设备及计算机可读介质，涉及文本处理技术领域。该生成人物词云画像的方法包括：采用彩铅方式对输入的图片进行处理，得到彩铅效果图片；利用预设词库对输入的文本进行处理，生成词汇的排序文档，所述预设词库中包括多个词汇；按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中，得到人物词云画像。该方法可以根据输入的图片以及文本快速生成人像词云画像，既可以快速、实时的反应数据的变化，而且能够保证画像的准确性，因此可以得到美观、色彩丰富的画像。

A method and device for creating a cloud portrait of a character word

An embodiment of the invention provides a method, a device, an electronic device and a computer readable medium for generating a cloud picture of a character word, which relates to the technical field of text processing. The method includes generating character word cloud: the portrait of the input lead color image processing, get the picture color lead effect; use the default thesaurus to the input text processing, sorting document generation of vocabulary, the presupposition includes a plurality of vocabulary thesaurus; according to the sorting document of the vocabulary of the vocabulary fill in the lead color effect of the picture, get the character word cloud picture. This method can generate cloud images quickly based on the input pictures and texts. It can not only reflect the changes of data quickly and realtime, but also ensure the accuracy of the portrait. Therefore, beautiful and colorful images can be obtained.

全部详细技术资料下载

【技术实现步骤摘要】
生成人物词云画像的方法及装置
本专利技术实施例总体涉及文本处理
，具体而言，涉及一种生成人物词云画像的方法及装置。
技术介绍
“词云”是对网络文本中出现频率较高的“关键词”予以视觉上的突出，形成“关键词云层”或“关键词渲染”，从而过滤掉大量的文本信息，使浏览网页的人只要一眼扫过文本就可以领略文本的主旨。在数据分析过程中，人物词云画像是一种对人物特征信息友好、易懂的描述形式。现有技术方案在生成人物词云画像过程中，主要采用以下两种方式：(1)使用前期数据加工，再加上后期对图片进行美化留白后，把加工好的数据逐个填入，优点是生成的画像准确无误，美观程度较高，缺点是生成画像的周期太长，无法实时、快速地响应数据变化。(2)直接使用图片和词汇生成人像词云画像，图1示出直接生成人物词云画像前的原始图片效果图，图2示出直接生成人物词云画像的效果图，这种方式的优点是生成画像的周期短，但是参见图2可以看出，缺点是生成的画像失真比较严重，色彩杂乱，不能正确的展示人物形象，效果不佳，无法正常使用。因此，现有技术方案的两种处理方式均不能在缩短生成画像周期的同时保证画像的准确性，还存在有待改进之处。在所述
技术介绍
部分公开的上述信息仅用于加强对本专利技术实施例的背景的理解，因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本专利技术实施例提供一种生成人物词云画像的方法、装置、电子设备及计算机可读介质，解决现有技术方案不能快速准确的生成人物词云画像的技术问题。本专利技术实施例的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本专利技术实施例的实践而习得...
生成人物词云画像的方法及装置

【技术保护点】
一种生成人物词云画像的方法，其特征在于，包括：采用彩铅方式对输入的图片进行处理，得到彩铅效果图片；利用预设词库对输入的文本进行处理，生成词汇的排序文档，所述预设词库中包括多个词汇；按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中，得到人物词云画像。

【技术特征摘要】
1.一种生成人物词云画像的方法，其特征在于，包括：采用彩铅方式对输入的图片进行处理，得到彩铅效果图片；利用预设词库对输入的文本进行处理，生成词汇的排序文档，所述预设词库中包括多个词汇；按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中，得到人物词云画像。2.根据权利要求1所述的方法，其特征在于，对输入的图片进行处理之前还包括：判断所述输入的图片的格式是否符合预设的格式要求，如果所述输入的图片的格式符合预设的格式要求，则继续对所述输入的图片采用彩铅方式进行处理；如果所述输入的图片的格式不符合预设的格式要求，则重新输入新的图片，其中所述预设的格式要求包括PNG、JPG。3.根据权利要求1所述的方法，其特征在于，采用彩铅方式对输入的图片进行处理包括：将所述输入的图片转换成黑白图片；对所述黑白图片进行彩铅化处理，得到所述彩铅效果图片。4.根据权利要求1所述的方法，其特征在于，利用预设词库对输入的文本进行处理，生成词汇的排序文档包括：对所述输入的文本去除停用词；利用所述预设词库计算所述预设词库中各个词汇的词频以及权重；根据所述词汇的词频和权重计算得到所述词汇的排序参考值；按照所述词汇的排序参考值对所述词汇进行排序得到所述词汇的排序文档。5.根据权利要求4所述的方法，其特征在于，所述输入的文本来源于包含有所述预设词库中词汇的文件，计算所述词汇的权重包括：统计包含所述词汇的文件的数目；根据所述包含所述词汇的文件的数目与总文件的数目计算得到所述词汇的权重。6.根据权利要求4或5所述的方法，其特征在于，所述词汇的排序参考值为所述词汇的词频与所述词汇的权重的乘积。7.根据权利要求6所述的方法，其特征在于，按照所述词汇的排序文档将所述词汇填入到所述彩铅效果图片中还包括：根据所述词汇的排序参考值的大小确定填入所述词汇的字体大小。8.一种生成人物词云画像的装置，其特征在于，包括：图片处理模块，配置为采用彩铅方式对输入的图片进行处理，得到彩铅效果图片；文本处理模块，配置为利用预设词库对输入的文本进行处理，生成词汇的排序文档，所述预设词库中包括多个词汇...

【专利技术属性】
技术研发人员：周松文，何金虎，
申请(专利权)人：泰康保险集团股份有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人