当前位置: 首页 > 专利查询>微软公司专利>正文

微博概括制造技术

技术编号:8453066 阅读:174 留言:0更新日期:2013-03-21 17:22
公开了微博概括。各实施例提供了概括技术,该概括技术可应用于博客或微博以便以缩短的形式呈现被判定为有用的信息。在一个或更多个实施例中,一种方法用来从诸如免费文本等各种资源中自动获取概念组。这些所获取的概念然后用来指导聚类处理。对簇进行排名,并随后通过合并词的频率和情感来概括簇。

【技术实现步骤摘要】
微博概括
本公开涉及可应用于博客或微博以便以缩短的形式呈现被判定为有用的信息的概括技术。
技术介绍
许多公众意见通过万维网(World Wide Web)来表达。常常,这些意见在所谓的博客或微博中表达。博客(网络日志(web log)的缩写)通常用来提供评论、事件描述或诸如图片或视频等其他材料。微博是博客形式的广播媒体,并且与传统博客的区别在于其内容在实际和总计的文件大小二者上通常更小。博客或者微博通常能够包含许多信息。这些信息能够让许多不同的个人感兴趣。 然而,因为博客和微博的庞大数量,这些信息可能经常被混淆或者完全地丢失。
技术实现思路
提供本
技术实现思路
是为了以简化形式来介绍选择的概念,下面在具体实施方式中会进一步描述选择的概念。本
技术实现思路
并非旨在标识所要求保护的主题的关键特征或必要特征。各实施例提供了可应用于博客或微博的以缩短的形式来呈现确定为有用的信息的概括技术。在一个或更多个实施例中,一种方法被用来从诸如免费文本等各种资源中来自动获取一组概念。这些所获取的概念然后用来指导聚类处理。通过合并情感和词的频率, 簇被排名并且随后被概括。附图说明参考附图对具体实施方式进行描述。图本文档来自技高网...

【技术保护点】
一种方法,该方法包括:处理(600)多个资源以构建词典,所述词典配置为使得能够概括多条微博;使用(602)所述词典创建概念,至少一些个体概念包括含有多个词的语义标签;将多条微博分配(604)给多个所述概念以有效地形成潜在簇;计算(606)每个微博/簇对的成员分数;以及使用(606)所述成员分数将微博分配给簇。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:安妮·路易斯托德·纽曼
申请(专利权)人:微软公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1