【技术实现步骤摘要】
微博概括
本公开涉及可应用于博客或微博以便以缩短的形式呈现被判定为有用的信息的概括技术。
技术介绍
许多公众意见通过万维网(World Wide Web)来表达。常常,这些意见在所谓的博客或微博中表达。博客(网络日志(web log)的缩写)通常用来提供评论、事件描述或诸如图片或视频等其他材料。微博是博客形式的广播媒体,并且与传统博客的区别在于其内容在实际和总计的文件大小二者上通常更小。博客或者微博通常能够包含许多信息。这些信息能够让许多不同的个人感兴趣。 然而,因为博客和微博的庞大数量,这些信息可能经常被混淆或者完全地丢失。
技术实现思路
提供本
技术实现思路
是为了以简化形式来介绍选择的概念,下面在具体实施方式中会进一步描述选择的概念。本
技术实现思路
并非旨在标识所要求保护的主题的关键特征或必要特征。各实施例提供了可应用于博客或微博的以缩短的形式来呈现确定为有用的信息的概括技术。在一个或更多个实施例中,一种方法被用来从诸如免费文本等各种资源中来自动获取一组概念。这些所获取的概念然后用来指导聚类处理。通过合并情感和词的频率, 簇被排名并且随后被概括。附图说明参考附图对具体 ...
【技术保护点】
一种方法,该方法包括:处理(600)多个资源以构建词典,所述词典配置为使得能够概括多条微博;使用(602)所述词典创建概念,至少一些个体概念包括含有多个词的语义标签;将多条微博分配(604)给多个所述概念以有效地形成潜在簇;计算(606)每个微博/簇对的成员分数;以及使用(606)所述成员分数将微博分配给簇。
【技术特征摘要】
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。