社交媒体分析与输出制造技术

技术编号:12958262 阅读:75 留言:0更新日期:2016-03-03 01:51
一种计算机实施的方法,包括:存储一组社交媒体对象,每个社交媒体对象包括至少一个词语。该方法包括通过以下步骤从该组社交媒体对象中识别相关社交媒体对象的子组:存储至少一篇内容文章,从至少一篇内容文章中提取至少一个关键词,利用重要性值对每个被提取的关键词进行排序,针对重要性值高于预定值的每个被提取的关键词搜索每个社交媒体对象,并将包括重要性值高于预定值的被提取的关键词的每个社交媒体对象添加到相关社交媒体对象的子组中。该方法进一步包括向用户输出相关社交媒体对象的子组。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及社交媒体内容分析与输出,更具体地,涉及相关微博条目的识别和输 出。
技术介绍
微博网站,例如推特(Twitter),是当前实时交换即时信息和讨论的主要平台之 一。需要过滤由微博网站生成的大量信息,以便只有相关信息到达用户。 -种简单的微博过滤技术是推特平台上的"跟踪(Follow) "功能。此功能允许用 户跟进其他实体、人员或事件的帖子,因此该用户被馈送他们的推文。该方法根据用户的兴 趣进行个性化定制。另一种用来跟踪推特上具体的微博的方法涉及搜索给定的井号标签(# 标签),该标签是用户基于提及推文文本内部井号标签获取一些话题更新的常见方式。这种 方法在过滤信息时不太严格,而且通常会使更多推文呈现给用户。但是,由于一些用户滥用 标签,许多不相关的微博经常被呈现。此外,许多和井号标签话题相关的推文可能不包括该 井号标签本身,这导致它们在检索结果中的缺失。
技术实现思路
本专利技术旨在提供一种改进的用于社交媒体内容分析和输出的系统和方法。 根据本专利技术的一个方面,提供一种计算机实施的方法,包括:存储一组社交媒体 对象,每个社交媒体对象包括至少一个词语,通过以下步骤从该组社交媒体对象中识别相 关社交媒体对象的子组:存储至少一篇内容文章,从至少一篇内容文章中提取至少一个关 键词,用重要性值对每个被提取的关键词排序,并且针对重要性值高于预定值的每个被提 取关键词搜索每个社交媒体对象,并将包括重要性值高于所述预定值的被提取关键词的每 个社交媒体对象添加到相关社交媒体对象的子组中,并向用户输出相关社交媒体对象的子 组。 优选地,该方法包括存储多数篇内容文章,每篇内容文章包括和同一地理区域相 关的内容。 方便地,该方法进一步包括:提供至少一个预定义关键词,并且针对每个预定义关 键词搜索一组社交媒体对象中的每个社交媒体对象,并将包括预定义关键词的每个社交媒 体对象添加到相关社交媒体对象的子组中。 有利地,该方法进一步包括:使用包括预定义关键词的社交媒体的内容训练分类 器,并使用该分类器分析一组社交媒体对象中的社交媒体对象,并将由分类器分类为相关 社交媒体对象的社交媒体对象添加到相关社交媒体对象的子组中。 优选地,社交媒体对象包括微博条目、评论或状态更新。 方便地,输出相关社交媒体对象的子组的步骤包括向用户输出相关社交媒体对象 的子组,除了包含在相关社交媒体对象中的词语之外,而不输出来自每篇内容文章的词语。 有利地,该方法包括将相关社交媒体对象的子组作为新闻门户网站输出给用户, 该新闻门户网站包括被分组为多个不同新闻类别的相关社交媒体对象。 根据本专利技术的另一方面,提供了一种存储指令的有形计算机机器可读介质,该指 令在被计算机执行时,使计算机执行之后的权利要求1到7中任一项所述的方法。 根据本专利技术的另一方面,提供了一种新闻门户网站,其包括使用权利要求1到7中 任一项所述的方法输出的相关社交媒体对象的子组,其中,社交媒体对象的子组在新闻门 户网站中被分组为多个不同的类别。 方便地,多个不同类别是新闻类别。 有利地,新闻门户网站通过持续地或周期性重复上述步骤进行更新。 优选地,新闻门户网站包括根据社交媒体对象的受欢迎程度进行分类的社交媒体 对象。 方便地,新闻门户网站包括评论区域以允许用户添加评论到新闻门户网站。 根据本专利技术的另一方面,提供了一种用于分析和输出社交媒体内容的系统,该系 统包括:存储器,可操作为存储一组社交媒体对象,每个社交媒体对象包括至少一个词语; 识别模块,可操作为通过以下步骤从存储在存储器中的一组社交媒体对象中识别相关社交 媒体对象的子组:在存储器中存储至少一篇内容文章,从至少一篇内容文章中提取至少一 个关键词,使用重要性值对每个被提取的关键词排序,并针对重要性值高于预定值的每个 被提取关键词搜索每个社交媒体对象,并将包括重要性值高于预定值的被提取关键词的每 个社交媒体对象添加到存储在存储器中的相关社交媒体的子组中,其中,所述系统进一步 包括:输出模块,可操作为向用户输出相关社交媒体对象的子组。 优选地,所述系统可操作为在存储器中存储多篇内容文章,多篇内容文章包括和 同一地理区域相关的内容。 方便地,存储器存储至少一个预定义关键词,且识别模块可操作为针对每个预定 义关键词搜索存储在存储器中的一组社交媒体对象中的每个社交媒体对象,并将包含预定 义关键词的每个社交媒体对象添加到存储在存储器中的相关社交媒体的子组中。 有利地,所述系统进一步包括:分类器模块,可操作为使用包括预定义关键词的社 交媒体对象的内容进行训练,分类器模块可操作为分析存储在存储器中的一组社交媒体对 象中的社交媒体对象,并将由分类器模块分类为相关社交媒体对象的社交媒体对象添加到 存储在存储器中的相关社交媒体对象的子组中。 优选地,社交媒体对象包括微博条目、评论或者状态更新。 方便地,输出模块可操作为向用户输出相关社交媒体对象的子组,除了包含在相 关社交媒体对象中的词语之外,而不输出来自每篇内容文章的词语。 有利地,输出模块可操作为将相关社交媒体对象的子组作为新闻门户网站输出给 用户,该新闻门户网站包括被分组为多个不同新闻类别的相关社交媒体对象。【附图说明】 现将通过实例并参见附图对本专利技术的实施方式进行描述,因此本专利技术可以更容易 地理解,其中: 图1是本专利技术的实施方式的方法的流程图, 图2是本专利技术的实施方式的用于识别与新闻类别相关的微博的方法的一部分的 流程图, 图3是本专利技术的实施方式的方法的另一部分流程图,图4是用于本专利技术的实施方式的微博过滤技术的流程图,以及 图5是以社会新闻门户网站的形式的本专利技术的实施方式的输出实的例示意图。【具体实施方式】 本专利技术的一个实施方式可操作为输出新闻门户网站,其包括至少部分或全部由微 博条目、或其他诸如推文的社交媒体帖子生成的内容。本专利技术的一个实施方式呈现分享在 推特上的有关不同地区正在发生的新闻中最受欢迎的内容。网站的访问者可以看到人们分 享在推特上的与当今最热门的新闻消息相关的最流行的推文、笑话、视频、图片,以及新闻 文章的全面报告。 标准新闻网站告知访问者在特定地区正在发生什么事件。相比之下,本专利技术的实 施方式提供的内容告诉用户人们感兴趣的新闻话题,以及他们如何对这些话题做出反应。 此外,该实施方式还捕捉分享在社交媒体上的,传统新闻网站上可能不存在的其他新闻消 息或新闻消息的其他方面。 本专利技术的实施方式的方法应用微博过滤技术以检索社交媒体对象(例如微博条 目或推文)。社交媒体对象包括评论、博客条目、微博条目、状态更新、情感和表达。在一个 实施方式中,社交媒体对象是多达140个字符的文本字符串。另一个实施方式配置用于通 常表现为脸书网(Facebook)、博客或论坛等社交帖子形式的社交媒体对象。 优选地,本专利技术的实施方式的方法是计算机实施的方法。计算机可操作为使用包 括本领域的技术人员所熟知的存储器和处理器的计算机硬件来执行所述方法的步骤。所述 方法可在可连接到计算机网络(例如互联网)的至少一个计算机上执行。本专利技术的这些实 施方式还扩展到包括可操作为实施所述方法的硬件的系统。 在一个实施方式中,所述方法的步骤存储于有形计算机可读介质中。该计算机可 读介质被配置为由可操作为执行所述本文档来自技高网...

【技术保护点】
一种计算机实施的方法,包括:存储一组社交媒体对象,每个社交媒体对象包括至少一个词语,通过以下步骤从所述一组社交媒体对象中识别相关社交媒体对象的子组:存储至少一篇内容文章,从所述至少一篇内容文章中提取至少一个关键词,利用重要性值对每个被提取的关键词排序,并且针对重要性值比预定值高的每个被提取的关键词搜索每个社交媒体对象,并且将包括重要性值高于所述预定值的被提取的关键词的每个社交媒体对象添加到所述相关社交媒体对象的子组中,并向用户输出所述相关社交媒体对象的子组。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:瓦利德·玛格迪
申请(专利权)人:卡塔尔基金会
类型:发明
国别省市:卡塔尔;QA

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1