一种词云图生成方法、装置、设备和存储介质制造方法及图纸

技术编号:20657477 阅读:32 留言:0更新日期:2019-03-23 08:52
本发明专利技术实施例公开了一种词云图生成方法、装置、设备和存储介质。该方法通过获取在直播节目内发布或对主播发布的弹幕数据;从所述弹幕数据中提取有效的目标关键词;确定待生成的词云图的预设形状样式;将所述目标关键词转化为具有所述预设形状样式的词云图,解决因弹幕数据表现形式单一而无法显性地展示主播或者直播节目质量的问题,由于采用从弹幕数据中提取出与主播或者直播节目质量有关的有效目标关键词,并进一步以词云图的方式进行展示,以实现丰富弹幕数据的表现形式和增加主播和观众的交流渠道,以进一步达到增加主播或者直播节目的关注度和点击率的效果。

A Method, Device, Equipment and Storage Medium for Word Nebulogram Generation

The embodiment of the present invention discloses a method, device, device and storage medium for generating word nephogram. The method solves the problem that the main broadcast or live broadcast can not be displayed explicitly because of the simplicity of the form of the bullet screen data, extracting the effective target keywords from the bullet screen data, determining the preset shape style of the cloud image to be generated, and transforming the target keywords into the cloud image with the preset shape style. The problem of program quality is that the effective target keywords related to the quality of the host or live program are extracted from the bullet screen data and further displayed in the form of word nephogram, so as to enrich the manifestation of the bullet screen data and increase the channels of communication between the host and the audience, so as to further increase the attention and click-through rate of the host or live program.

【技术实现步骤摘要】
一种词云图生成方法、装置、设备和存储介质
本专利技术实施例涉及数据处理的
,尤其涉及一种词云图生成方法、装置、设备和存储介质。
技术介绍
直播业务不断发展,随着观看直播的人数持续增长,观众通过在直播间进行弹幕发送,以便与主播进行交流的情况也越来越普遍。通过统计海量弹幕数据,可以得出观众对直播内容的反馈,也可以反映主播的用户画像。但现有的关于弹幕数据的应用还是较为缺乏。一方面,现有的弹幕数据的表现形式较为单一,如弹幕数据只是在直播时以滚动的形式进行展示。另一方面,现有的弹幕数据虽然能反映主播的用户画像,但还是偏向于直播平台对主播的后台分析,缺乏一种应用将弹幕数据与主播或直播内容建立显性的联系。
技术实现思路
本专利技术提供一种词云图生成方法、装置、设备和存储介质,以实现丰富弹幕数据的表现形式和增加主播和观众的交流渠道,以进一步达到增加关注度和点击率的效果。第一方面,本专利技术实施例提供了一种词云图生成方法,该方法包括:获取在直播节目内发布或对主播发布的弹幕数据;从所述弹幕数据中提取有效的目标关键词;确定待生成的词云图的预设形状样式;将所述目标关键词转化为具有所述预设形状样式的词云图。进一步的,从所述弹幕数据中提取有效的目标关键词,包括:对所述弹幕数据进行预提取处理,以得到原始关键词;根据预设过滤条件对所述原始关键词进行过滤处理,以得到有效的目标关键词。进一步的,确定待生成的词云图的预设形状样式,包括:接收主播客户端针对所述弹幕数据的词云图生成指令;从所述词云图生成指令提取待生成的词云图的预设形状样式。进一步的,将所述目标关键词转化为具有所述预设形状样式的词云图,包括:生成符合所述预设形状样式的底图;将所述目标关键词转换为符合预设字体样式的字体图;将所述字体图合并至所述底图,以生成所述词云图。进一步的,生成符合所述预设形状样式的底图,包括:判断在磁盘中是否存储有符合所述预设形状样式的底图;若是,则从所述磁盘中读取所述底图,并在缓存中转换为二进制格式;若否,则在缓存中生成符合所述预设形状样式的、且格式为二进制的底图。进一步的,在缓存中生成符合所述预设形状样式的、且格式为二进制的底图,包括:根据所述预设形状样式确定底图的形状、线条颜色和填充颜色;根据所述底图的形状确定画布的大小;根据所述底图的线条颜色和填充颜色,在所述画布上绘制所述底图,以生成格式为二进制的所述底图。进一步的,将所述目标关键词转换为符合预设字体样式的字体图,包括:统计所述目标关键词的频率;根据所述频率与所述目标关键词的词面积的正相关关系,确定底图面积中可分配给所述目标关键词的词面积;确定所述目标关键词的字体类型和字体颜色;将所述目标关键词转换为符合所述字体类型和字体颜色、且占有所述词面积的字体图。进一步的,确定所述目标关键词的字体类型和字体颜色,包括:确定所述目标关键词的字体类型;针对每个所述目标关键词,在预设的颜色空间中选择一颜色,以对所述目标关键词分配字体颜色。进一步的,将所述字体图合并至所述底图,以生成所述词云图,包括:将所述字体图按照面积进行排序;按照所述排序从当前剩余未填充的所述字体图中选择待填充的字体图;将所述待填充的字体图填充至底图中未被填充的空位;判断是否还具有未填充的所述字体图;若是,则按照所述排序从当前剩余未填充的所述字体图中选择待填充的字体图;若否,则完成生成所述词云图。进一步的,将所述待填充的字体图填充至底图中未被填充的空位,包括:确定所述待填充的字体图的放置角度为设定的角度;在底图中搜索能容纳以所述放置角度放置的所述待填充的字体图的空位;判断是否存在所述空位;若是,则将所述待填充的字体图填充至所述空位;若否,则调整所述放置角度,并在底图中搜索能容纳以所述放置角度放置的所述待填充的字体图的空位。进一步的,在将所述目标关键词转化为具有所述预设形状样式的词云图之后,包括:接收分享指令;根据所述分享指令将所述词云图进行分享。第二方面,本专利技术实施例还提供了一种词云图生成装置,该装置包括:弹幕数据获取模块,用于获取在直播节目内发布或对主播发布的弹幕数据;目标关键词提取模块,用于从所述弹幕数据中提取有效的目标关键词;预设形状样式确定模块,用于确定待生成的词云图的预设形状样式;词云图转化模块,用于将所述目标关键词转化为具有所述预设形状样式的词云图。第三方面,本专利技术实施例还提供了一种词云图生成设备,该设备包括:存储器以及一个或多个处理器;所述存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面中任一所述的词云图生成方法。第四方面,本专利技术实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面中任一所述的词云图生成方法。本专利技术实施例的技术方案,通过获取在直播节目内发布或对主播发布的弹幕数据;从所述弹幕数据中提取有效的目标关键词;确定待生成的词云图的预设形状样式;将所述目标关键词转化为具有所述预设形状样式的词云图,由此,弹幕数据不仅仅可以滚动的方式呈现给观众,还可以以词云图的方式进行展示,解决因弹幕数据表现形式单一的问题,丰富了弹幕数据的表现形式;而且由于该目标关键词是弹幕数据中的有效词语,可以体现直播节目质量或主播用户画像,从而建立了弹幕数据与直播节目或主播的显性联系,进而观众可以通过该词云图了解直播节目或主播,从而达到增加主播或者直播节目的关注度和点击率的效果。附图说明图1为本专利技术实施例一提供的一种词云图生成方法的流程图;图2为本专利技术实施例二提供的一种词云图生成方法的流程图;图3为本专利技术实施例三提供的一种词云图生成方法的流程图;图4为本专利技术实施例四提供的一种词云图生成装置的结构示意图;图5为本专利技术实施例五提供的一种词云图生成设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种词云图生成方法的流程图,本实施例可适用于直播领域的弹幕处理情况,本实施例对应用场景不作限定,只要实现将提取的有效的目标关键词生成具有预设形状样式的词云图即可。该方法可以由词云图生成设备来执行,词云图生成设备可以是电脑,手机和平板等。实施例中,以词云图生成设备为电脑为例,进行描述。该词云图生成方法具体包括如下步骤:S110、获取在直播节目内发布或对主播发布的弹幕数据。本实施例对应用场景不作限定,可以是直播或者短视频播放的应用场景,只要满足有弹幕数据即可。本实施例以直播为例进行说明,该词云图生成方法可以由主播客户端执行。弹幕数据是直播过程中,观众针对直播节目发布的评论。本实施例中的弹幕数据可以是一场直播节目内发布的弹幕数据;也可以是针对一个主播上传的多场直播节目内发布的弹幕数据。进一步的,本实施例对弹幕数据的获取方式不作限定,可以是直播平台在接收到观众发送的弹幕数据后,将弹幕数据存储于直播平台服务器中,在需要使用弹幕数据时,进行读取即可。本实施例对弹幕数据的获取时机不作限定,可以是在主播需要生成词云图时进行获取。S120、从所述弹本文档来自技高网...

【技术保护点】
1.一种词云图生成方法,其特征在于,包括:获取在直播节目内发布或对主播发布的弹幕数据;从所述弹幕数据中提取有效的目标关键词;确定待生成的词云图的预设形状样式;将所述目标关键词转化为具有所述预设形状样式的词云图。

【技术特征摘要】
1.一种词云图生成方法,其特征在于,包括:获取在直播节目内发布或对主播发布的弹幕数据;从所述弹幕数据中提取有效的目标关键词;确定待生成的词云图的预设形状样式;将所述目标关键词转化为具有所述预设形状样式的词云图。2.根据权利要求1所述的方法,其特征在于,确定待生成的词云图的预设形状样式,包括:接收主播客户端针对所述弹幕数据的词云图生成指令;从所述词云图生成指令提取待生成的词云图的预设形状样式。3.根据权利要求1所述的方法,其特征在于,将所述目标关键词转化为具有所述预设形状样式的词云图,包括:生成符合所述预设形状样式的底图;将所述目标关键词转换为符合预设字体样式的字体图;将所述字体图合并至所述底图,以生成所述词云图。4.根据权利要求3所述的方法,其特征在于,生成符合所述预设形状样式的底图,包括:判断在磁盘中是否存储有符合所述预设形状样式的底图;若是,则从所述磁盘中读取所述底图,并在缓存中转换为二进制格式;若否,则在缓存中生成符合所述预设形状样式的、且格式为二进制的底图。5.根据权利要求4所述的方法,其特征在于,在缓存中生成符合所述预设形状样式的、且格式为二进制的底图,包括:根据所述预设形状样式确定底图的形状、线条颜色和填充颜色;根据所述底图的形状确定画布的大小;根据所述底图的线条颜色和填充颜色,在所述画布上绘制所述底图,以生成格式为二进制的所述底图。6.根据权利要求3所述的方法,其特征在于,将所述目标关键词转换为符合预设字体样式的字体图,包括:统计所述目标关键词的频率;根据所述频率与所述目标关键词的词面积的正相关关系,确定底图面积中可分配给所述目标关键词的词面积;确定所述目标关键词的字体类型和字体颜色;将所述目标关键词转换为符合所述字体类型和字体颜色、且占有所述词面积的字体图。7.根据权利要求6所述的方法,其特征在于,确定所述目标关键词的字体类型和字体颜色,包括:确定所述目标关键词的字体类型;针对每个所述目标关键词...

【专利技术属性】
技术研发人员:陈慕仪庞金伟
申请(专利权)人:广州虎牙科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1