一种词云图生成方法、装置、设备和存储介质制造方法及图纸

技术编号：20657477 阅读：32 留言：0更新日期：2019-03-23 08:52

本发明专利技术实施例公开了一种词云图生成方法、装置、设备和存储介质。该方法通过获取在直播节目内发布或对主播发布的弹幕数据；从所述弹幕数据中提取有效的目标关键词；确定待生成的词云图的预设形状样式；将所述目标关键词转化为具有所述预设形状样式的词云图，解决因弹幕数据表现形式单一而无法显性地展示主播或者直播节目质量的问题，由于采用从弹幕数据中提取出与主播或者直播节目质量有关的有效目标关键词，并进一步以词云图的方式进行展示，以实现丰富弹幕数据的表现形式和增加主播和观众的交流渠道，以进一步达到增加主播或者直播节目的关注度和点击率的效果。

A Method, Device, Equipment and Storage Medium for Word Nebulogram Generation

The embodiment of the present invention discloses a method, device, device and storage medium for generating word nephogram. The method solves the problem that the main broadcast or live broadcast can not be displayed explicitly because of the simplicity of the form of the bullet screen data, extracting the effective target keywords from the bullet screen data, determining the preset shape style of the cloud image to be generated, and transforming the target keywords into the cloud image with the preset shape style. The problem of program quality is that the effective target keywords related to the quality of the host or live program are extracted from the bullet screen data and further displayed in the form of word nephogram, so as to enrich the manifestation of the bullet screen data and increase the channels of communication between the host and the audience, so as to further increase the attention and click-through rate of the host or live program.

全部详细技术资料下载

【技术实现步骤摘要】
一种词云图生成方法、装置、设备和存储介质
本专利技术实施例涉及数据处理的
，尤其涉及一种词云图生成方法、装置、设备和存储介质。
技术介绍
直播业务不断发展，随着观看直播的人数持续增长，观众通过在直播间进行弹幕发送，以便与主播进行交流的情况也越来越普遍。通过统计海量弹幕数据，可以得出观众对直播内容的反馈，也可以反映主播的用户画像。但现有的关于弹幕数据的应用还是较为缺乏。一方面，现有的弹幕数据的表现形式较为单一，如弹幕数据只是在直播时以滚动的形式进行展示。另一方面，现有的弹幕数据虽然能反映主播的用户画像，但还是偏向于直播平台对主播的后台分析，缺乏一种应用将弹幕数据与主播或直播内容建立显性的联系。
技术实现思路
本专利技术提供一种词云图生成方法、装置、设备和存储介质，以实现丰富弹幕数据的表现形式和增加主播和观众的交流渠道，以进一步达到增加关注度和点击率的效果。第一方面，本专利技术实施例提供了一种词云图生成方法，该方法包括：获取在直播节目内发布或对主播发布的弹幕数据；从所述弹幕数据中提取有效的目标关键词；确定待生成的词云图的预设形状样式；将所述目标关键词转化为具有所述预设形状样式的词云图。进一步的，从所述弹幕数据中提取有效的目标关键词，包括：对所述弹幕数据进行预提取处理，以得到原始关键词；根据预设过滤条件对所述原始关键词进行过滤处理，以得到有效的目标关键词。进一步的，确定待生成的词云图的预设形状样式，包括：接收主播客户端针对所述弹幕数据的词云图生成指令；从所述词云图生成指令提取待生成的词云图的预设形状样式。进一步的，将所述目标关键词转化为具有所述预设形状样式的词...

【技术保护点】
1.一种词云图生成方法，其特征在于，包括：获取在直播节目内发布或对主播发布的弹幕数据；从所述弹幕数据中提取有效的目标关键词；确定待生成的词云图的预设形状样式；将所述目标关键词转化为具有所述预设形状样式的词云图。

【技术特征摘要】
1.一种词云图生成方法，其特征在于，包括：获取在直播节目内发布或对主播发布的弹幕数据；从所述弹幕数据中提取有效的目标关键词；确定待生成的词云图的预设形状样式；将所述目标关键词转化为具有所述预设形状样式的词云图。2.根据权利要求1所述的方法，其特征在于，确定待生成的词云图的预设形状样式，包括：接收主播客户端针对所述弹幕数据的词云图生成指令；从所述词云图生成指令提取待生成的词云图的预设形状样式。3.根据权利要求1所述的方法，其特征在于，将所述目标关键词转化为具有所述预设形状样式的词云图，包括：生成符合所述预设形状样式的底图；将所述目标关键词转换为符合预设字体样式的字体图；将所述字体图合并至所述底图，以生成所述词云图。4.根据权利要求3所述的方法，其特征在于，生成符合所述预设形状样式的底图，包括：判断在磁盘中是否存储有符合所述预设形状样式的底图；若是，则从所述磁盘中读取所述底图，并在缓存中转换为二进制格式；若否，则在缓存中生成符合所述预设形状样式的、且格式为二进制的底图。5.根据权利要求4所述的方法，其特征在于，在缓存中生成符合所述预设形状样式的、且格式为二进制的底图，包括：根据所述预设形状样式确定底图的形状、线条颜色和填充颜色；根据所述底图的形状确定画布的大小；根据所述底图的线条颜色和填充颜色，在所述画布上绘制所述底图，以生成格式为二进制的所述底图。6.根据权利要求3所述的方法，其特征在于，将所述目标关键词转换为符合预设字体样式的字体图，包括：统计所述目标关键词的频率；根据所述频率与所述目标关键词的词面积的正相关关系，确定底图面积中可分配给所述目标关键词的词面积；确定所述目标关键词的字体类型和字体颜色；将所述目标关键词转换为符合所述字体类型和字体颜色、且占有所述词面积的字体图。7.根据权利要求6所述的方法，其特征在于，确定所述目标关键词的字体类型和字体颜色，包括：确定所述目标关键词的字体类型；针对每个所述目标关键词...

【专利技术属性】
技术研发人员：陈慕仪，庞金伟，
申请(专利权)人：广州虎牙科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人