【技术实现步骤摘要】
一种词云数据生成方法以及装置
本公开涉及信息处理
,尤其涉及一种词云数据生成方法以及装置。
技术介绍
目前,用户通过手机等电子设备能够收到大量的资讯信息,用户需要对资讯信息的所有内容进行查看,才能成功查阅感兴趣的内容,这样会导致用户查阅感兴趣的内容的时间成本非常高,从而会给用户带来非常不好的使用体验。
技术实现思路
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种词云数据生成方法、装置、计算机可读存储介质以及电子设备。根据本公开实施例的一个方面,提供了一种词云数据生成方法,包括:获取资讯信息;根据所述资讯信息,获取指定对象标识对应的词云短语候选集;根据预设筛选策略,确定所述词云短语候选集中待展示的目标词云短语;展示所述指定对象标识以及对应的目标词云短语。在一个可选示例中,所述根据所述资讯信息,获取指定对象标识对应的词云短语候选集,包括:从所述资讯信息中,获取与所述指定对象标识关联的语料;对所述语料进行分词处理,以得到
【技术保护点】
1.一种词云数据生成方法,其特征在于,包括:/n获取资讯信息;/n根据所述资讯信息,获取指定对象标识对应的词云短语候选集;/n根据预设筛选策略,确定所述词云短语候选集中待展示的目标词云短语;/n展示所述指定对象标识以及对应的目标词云短语。/n
【技术特征摘要】
1.一种词云数据生成方法,其特征在于,包括:
获取资讯信息;
根据所述资讯信息,获取指定对象标识对应的词云短语候选集;
根据预设筛选策略,确定所述词云短语候选集中待展示的目标词云短语;
展示所述指定对象标识以及对应的目标词云短语。
2.根据权利要求1所述的方法,其特征在于,
所述根据所述资讯信息,获取指定对象标识对应的词云短语候选集,包括:
从所述资讯信息中,获取与所述指定对象标识关联的语料;
对所述语料进行分词处理,以得到分词处理结果;
对所述分词处理结果进行挖掘处理,以得到词云短语候选集;
所述根据预设筛选策略,确定所述词云短语候选集中待展示的目标词云短语,包括:
根据所述语料的统计数据,确定所述词云短语候选集中待展示的目标词云短语。
3.根据权利要求2所述的方法,其特征在于,所述根据所述语料的统计数据,确定所述词云短语候选集中待展示的目标词云短语,包括:
根据所述语料的统计数据,确定所述词云短语候选集中的每个词云短语在所述语料中的真实出现次数;
根据所述语料的统计数据,确定所述词云短语候选集中的每个词云短语在所述语料中的期望出现次数;
根据所述词云短语候选集中的每个词云短语在所述语料中的真实出现次数和期望出现次数,确定所述词云短语候选集中的每个词云短语的重要性分数;
从所述词云短语候选集中重要性分数大于或等于预设分数的词云短语中,确定待展示的目标词云短语。
4.根据权利要求3所述的方法,其特征在于,所述根据所述语料的统计数据,确定所述词云短语候选集中的每个词云短语在所述语料中的期望出现次数,包括:
确定组成第一词云短语的每个词语在所述词云短语候选集中的真实出现次数,以及根据所述语料的统计数据,确定所述语料中的词语总数量和组成所述第一词云短语的每个词语在所述语料中的真实出现次数;其中,所述第一词云短语为所述词云短语候选集中的任一词云短语;
分别计算组成所述第一词云短语的每个词语在所述词云短语候选集中的真实出现次数与在所述语料中的真实出现次数的比值,以得到组成所述第一词云短语的每个词语对应的比值;
计算组成所述第一词云短语的各个词语对应的比值的乘积;
根据所计算的乘积和所述语料中的词语总数量,确定所述第一词云短语在所述语料中的期望出现次数。
5.根据权利要求3所述的方法,其特征在于,所述根据所述词云短语候选集中的每个词云短语在所述语料中的真实出现次数和期望出现次数,确定所述词云短语候选集中的每个词云短语的重要性分数,包括:
计算第二词云短语在所述语料中的真实出现次数和期望出现次数的差值;其中,所述第二词云短语为所述词云短语候选集中的任一词云短语;
计算所述第二词云短语在所述语料中的真实出现次数的开方结果;
计算所述差值与所述开方结果的比值,并将所计算的比值作为所述第二词云短语的重要性分数。
6.根据权利要求3所述的方法,其特征在于,所述从所述词云短语候选集中重要性分数大于或等于预设分数的词云短语中,确定待展示的目标词云短语,包括:
在重要性分数大于或等于预设分数的词云短语中删除满足预设条件的词云短语,并将剩余的词云短语作为待展示的目标词云短语;
其中,任一词云短语满足所述预设条件是指满足以下至少一项:
词云短语以日期结尾;
词云短语的数字占比大于预设比例;
词云短语包含重复词语;
重要性分数大于或等于预设分数的词云短语中存在与当前词云短语具有指定重复性关系且长于当前词云短语的词云短语。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述展示所述指定对象标识以及对应的目标词云短语,包括:
展示画布;其中,所述画布上具有中心展示层以及围绕所述中心展示层的外围展示层;
在所述中心展示层上展示所述指定对象标识;
根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,并在所述外围展示层的展示位置展示所述目标词云短语。
8.根据权利要求7所述的方法,其特征在于,所述根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,包括:
确定所述目标词云短语的尺寸信息;
根据所述外围展示层的区域信息以及所述目标词云短语的尺寸信息,确定所述目标词云短语在所述外围展示层的展示位置。
9.根据权利要求7所述的方法,其特征在于,围绕所述中心展示层的外围展示层为由内向外邻接设置的N个外围展示层;所述根据所述外围展示层的区域信息,确定所述目标词云短语在所述外围展示层的展示位置,包括:
确定所述目标词云短语的尺寸信息;
从所述N个外围展示层中确定所述目标词云短语待展示的外围展示层;
根据所述目标词云短语待展示的外围展示层的区域信息、所述目标词云短语待展示的外围展示层的指定相邻展示层的区域信息以及所述目标词云短语的尺寸信息,确定所述目标词云短语在所述待展示的外围展示层的展示位置。
10.根据权利要求7所述的方法,其特征在于,所述中心展示层呈半圆盘状,所述外围展示层呈扇环状,所述中心展示层与所述外围展示层同为一个圆心,所述中心展示层和所述外围展示层的区域信息包括中心展示层半径以及外围展示层半径;
所述根据所述外围展示层的区域信息,确定所述目标词云短...
【专利技术属性】
技术研发人员:王晓岚,周晗,柳超,
申请(专利权)人:北京金堤征信服务有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。