一种非输入式动态词云的生成方法技术

技术编号:41209125 阅读:16 留言:0更新日期:2024-05-09 23:31
本发明专利技术公开了一种非输入式动态词云的生成方法,包括:获取两个月中用户移动端设备内经授权的所有数据信息内容生成数据信息集,对其内文本进行分词处理获取分词并进行词频统计,生成对应词频矩阵;通过正态分布条件分置法从词频矩阵中筛选出关键词和非关键词;根据所述关键词对应时间位置获取其时间位置权重;构造所述关键词词频与其时间位置权重的函数模型,计算出关键词的综合比例,根据综合比例决定关键词字体的大小,而非关键词字体的大小则随机设置;运用信息可视化技术对提取出的分词以动态气泡的形式进行展示。针对不同的气泡进行突出和灰化两种不同处理形成前后层次感,同时其半径大小也不尽相同,最终以动态的分层多样化气泡形式显示。

【技术实现步骤摘要】

本专利技术涉及信息可视化尤其涉及一种非输入式动态词云的生成方法


技术介绍

1、随着大数据时代的来临,大量文字信息涌入了人们的生活中,无论是办公、学习还是各种娱乐活动,人们每天都要处理大量的文本信息,如何更简练更高效地表达文本数据中所蕴含的信息成为了信息可视化领域的一个重要问题。

2、词云是一种信息可视化技术,通过布局算法用文字大小表示词频,辅以多种色彩显示,有的甚至为了更好的填充特定的形状而做了相应的均匀变形设计。将不同主题的词汇放置于形状不同的区域从而更好的增强语义,增进用户对词云的理解。最终以包含2d和3d在内的形式进行可视化展示,直观展示文本关键摘要信息。近年来,词云作为极富表现力的可视化载体得到广泛应用,比如tableau,domo他们旨在为公司提供更好的数据分析服务,让公司做出更好的决策(business intelligence)。

3、然而原有的生成方法主要集中注意力于高频词汇也就是所谓的兴趣度较高的词汇进行突出展示,对于频次较低的词汇信息关注度极低甚至直接进行忽视不予展示。在如此的人机交互循环之下用户只可以从高频突本文档来自技高网...

【技术保护点】

1.一种非输入式动态词云的生成方法,其特征在于包括:

2.据权利1要求所述一种非输入式动态词云的生成方法,其特征在于:生成由所述分词的词频组成的词频矩阵,包括:对数据信息集内的文本进行分词处理;对所得到的各个分词进行实词过滤处理;统计经过滤处理后的各个分词在数据信息集内的词频,得到词频矩阵。

3.根据权利1要求所述一种非输入式动态词云的生成方法,其特征在于:

4.根据权利要求1所述的一种非输入式动态词云的生成方法,其特征在于:

5.根据权利1要求所述的一种非输入式动态词云的生成方法,其特征在于:

6.根据权利1要求所述一种非输入...

【技术特征摘要】

1.一种非输入式动态词云的生成方法,其特征在于包括:

2.据权利1要求所述一种非输入式动态词云的生成方法,其特征在于:生成由所述分词的词频组成的词频矩阵,包括:对数据信息集内的文本进行分词处理;对所得到的各个分词进行实词过滤处理;统计经过滤处理后的各个分词在数据信息集内的词频,得到词频矩阵。

3.根据权利1要求所述一种非输入式动...

【专利技术属性】
技术研发人员:杜娜王子轩徐文强宋士虓常菁婧高绪锋
申请(专利权)人:杭州玄霄科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1