[问题]为了更精确地并在较早的阶段检测社交媒体中的突发信息(以不同于正常的规模散布的信息)。[解决方案]提出一种方法,其中在社交媒体中,从由多个用户传送的多个消息选择特定消息组。这里,在消息中包括其中由一个用户传送的消息由另一用户引用和重新传送的消息。本方法具有下列步骤:对于其中由一个用户传送的消息由另一用户引用和重新传送的消息,执行进一步重新传送的可能性的初级评估;识别已经传送了其中初级评估结果高于预定第一阈值的消息的一个用户;基于其中由一个用户传送的消息已被引用和重新传送的消息组,识别与已重新传送的消息组相似的消息组;执行将进一步重新传送相似消息组的可能性的次级评估;以及选择其中次级评估结果高于预定第二阈值的消息组。
【技术实现步骤摘要】
【国外来华专利技术】用于检测社交媒体中的趋势的方法、计算机程序和计算机
本专利技术涉及一种信息处理技术,并且更具体地,其涉及一种用于更快速和更精确地检测社交媒体中的突发信息(以不同于正常的规模散布的信息)的技术。
技术介绍
存在一种现象,其中当自然灾害或重要社会问题出现时,社交媒体上的信息以极快的速度和庞大的规模散布,并且该现象有时被称为“突发(burst)”现象。在这种突发信息中包括了与事实不同的信息(例如错误信息、谣言)并且取决于情况该信息可能成为企业活动的威胁。因此,寻求可以快速和精确地检测“突发”现象的技术。响应于该需要,提供了各种先前的技术。作为示例,在专利文献I中,对于称为“提供能够从网络上公开的信息取得谣言信息,同时提取与这种谣言信息相关的信息,并且同时将其呈现给用户的技术”的问题,提供了一种技术,其“包括数据收集装置,用于接收由网络上的服务器设备公开的数据,以及用于在收集数据存储器装置中将所述数据存储为各种收集数据;谣言信息判断装置,用于提取包括在收集数据中的字符串,并且用于基于字符串获得收集数据是否是谣言信息的判断结果;相关信息数据提取装置,用于从网络上的服务器设备或从预先累积的相关信息数据库提取被判断为谣言信息的谣言信息数据和至少是谣言信息数据的作者、或谣言信息数据的内容、或存储数据的服务器设备的名称或网络地址或者谣言信息数据的文件信息的相关信息数据;以及输出装置,用于同时输出谣言信息数据和相关信息数据。”此外,在非专利文献I中,提供了一种用于通过评估关键字的增加程度而检测信息是否是突发信息的技术。引用列表
技术介绍
专利文献专利文献1:日本公开待审N0.2008-165598非专利文献非专利文献1:J.Kleinberg:Bursty and Hierarchical Structure in Streams, Proceedingof the8th ACM SIGKDD International Conference on Knowledge Discovery and DataMining, (2002).
技术实现思路
技术问题然而,存在改进快速和精确地检测“突发”现象的空间。本专利技术考虑了这种现象,并且其目的是提供能够通过考虑发送信息的人和信息的内容的特征而快速和精确地检测“突发”现象的技术。问题的解决方案具体地,通过专利技术人的研究,在获得下列知识之后创造出本专利技术:1.散布可能性根据发送用户的影响程度而不同(由高影响力的用户发送的信息更可能被重新发送)。2.散布可能性根据用户重新发送的频率而不同(对于经常重新发送的用户和很少重新发送的用户重新发送的重要性不同)。3.重新散布可能性根据信息的独特性而不同(当重新发送的信息的内容不同于正常时,信息散布可能性高)。具体地,本专利技术提供一种用于通过使用计算机从由多个用户通过社交网络发送的多个消息选择识别的消息组的方法。在消息内,包括由与原始消息用户不同的用户发送的消息,并且这些消息引用由原始消息用户发送的消息。所述方法包括下列步骤:对于由与原始消息用户不同的用户发送的引用由原始消息用户发送的消息的消息,执行进一步重新发送的可能性的初级评估;识别已经发送了初级评估结果高于预定第一阈值的消息的单个用户;基于引用由单个用户发送的消息的重新发送消息组,识别与重新发送消息组相似的消息组;执行将进一步重新发送相似消息组的可能性的次级评估;以及选择次级评估结果高于预定第二阈值的消息组。这里,在执行初级评估和次级评估的步骤,可以作为其他用户的影响力的递增函数而计算进一步重新发送的可能性。更具体地,可以作为关注其他用户的用户数量的递增函数而计算其他用户的影响力程度。此外,在执行初级评估和次级评估的步骤,可以作为其他用户过去重新发送引用第一用户的消息的消息的程度的递减函数而计算进一步重新发送的可能性。更具体地,可以作为在过去固定时段内其他用户重新发送引用第一用户的消息的消息的次数而计算已重新发送的程度。此外,在执行初级评估和次级评估的步骤,可以作为由其他用户重新发送的消息内容和由其他用户过去进一步重新发送的消息的相似度的递减函数而计算进一步重新发送的可能性。更具体地,可以通过将由其他用户重新发送的消息和由其他用户过去进一步重新发送的消息进行文本串匹配而计算相似度。此外,消息可以是在规定条件下从在社交媒体上发布的消息采样的消息。此外,消息可以是从在包括规定关键字的条件下在社交媒体上在规定时间段内发布的消息采样的消息。此外,社交媒体可以是微博。此外,可以构架为使得向社交媒体发布的计算机通过网络连接到选择识别的消息组的计算机,并且进一步包括选择计算机接收响应于来自选择计算机的规定条件请求而从发布计算机发送的消息的步骤。还可以进一步包括在选择计算机的存储器装置中存储接收的消息的步骤。显然,在其中本专利技术被理解为计算机程序和计算机系统的情况下,其提供与其中本专利技术被理解为上面描述的方法的情况基本上相同的技术特征。本专利技术的有利效果通过使用本专利技术,通过考虑发送信息的人和信息的内容的特征,能够快速和精确地检测“突发”现象。【附图说明】图1是解释微博(microblog)系统的概略图。图2是解释微博的关注者和被关注的关系的概略图。图3是用作用户终端的智能电话和相关屏幕显示的说明图。图4是存储在微博服务器的硬盘设备中的数据的数据结构的说明图。图5是发送的消息的类型的说明图。图6是解释计算机的硬件结构的框图。图7是解释由计算机执行的处理的流程图。图8是重新发送的可能性的计算的公式的说明图。图9是时间段T过去的时间段Tp⑴的说明图。【具体实施方式】实施例下列部分基于附图详细描述执行本专利技术的最佳模式,但下列实施例并未限制根据权利要求的范围的本专利技术,并且在实施例内描述的特征的整个组合对本专利技术的解决方式并非必要。可以通过许多不同模式执行本专利技术,并且没有理由其应被解释为限于对于实施例记录的内容。此外,应注意在实施例内描述的特征的整个组合对本专利技术的解决方式并非必要。贯穿实施例的整个描述相同标号应用于相同元件(当未另外指定时)。图1是解释微博系统的概略图。该系统包括微博服务器2和用户终端,并且它们相互连接用于通过因特网4通信。用户终端可以是提供通信功能的任何模式的计算机。例如,附图中示出智能电话31、平板32和个人计算机(笔记本型)33,但是此外,虽然未示出,可以利用例如个人数字助理(PDA,移动信息设备)、车载计算机或笔记本计算机。图2是解释微博的关注者和被关注的关系的概略图。微博的用户可以提前登记分享相同爱好或兴趣的其他用户,并且用户可以自动接收由那些其他用户发送的消息。该登记过程被称为“关注(to follow) ”,并且相关关系可以是下列两种类型:其中涉及的用户都彼此关注,以及其中仅用户之一单方面关注其他用户。例如,图2中的箭头示出用户AAA和用户BBB彼此相互关注,而用户BBB单方面关注CCC,并且用户CCC单方面关注用户AAA。图3是用作用户终端的智能电话31和相关屏幕显示的说明图。微博应用的屏幕显示在智能电话31的触摸屏上,并且应用屏幕从顶部顺序分成主页组件311、时间轴(timeline)组件312和操作组件313。在主页组件311内显示菜单按钮和时间轴组件312是用户AAA的时本文档来自技高网...

【技术保护点】
一种用于通过使用计算机从由多个用户通过社交网络发送的多个消息选择识别的消息组的方法,其中,在消息内,包括由与原始消息用户不同的用户发送的消息,并且这些消息引用由原始消息用户发送的消息,并且所述方法包括下列步骤:对于由与原始消息用户不同的用户发送的引用由原始消息用户发送的消息的消息,执行进一步重新发送的可能性的初级评估;识别已经发送了初级评估结果高于预定第一阈值的消息的单个用户;基于引用由单个用户发送的消息的重新发送消息组,识别与重新发送消息组相似的消息组;执行将进一步重新发送相似消息组的可能性的次级评估;以及选择次级评估结果高于预定第二阈值的消息组。
【技术特征摘要】
【国外来华专利技术】2011.12.19 JP 2011-2769731.一种用于通过使用计算机从由多个用户通过社交网络发送的多个消息选择识别的消息组的方法,其中,在消息内,包括由与原始消息用户不同的用户发送的消息,并且这些消息引用由原始消息用户发送的消息,并且所述方法包括下列步骤: 对于由与原始消息用户不同的用户发送的引用由原始消息用户发送的消息的消息,执行进一步重新发送的可能性的初级评估; 识别已经发送了初级评估结果高于预定第一阈值的消息的单个用户; 基于引用由单个用户发送的消息的重新发送消息组,识别与重新发送消息组相似的消息组; 执行将进一步重新发送相似消息组的可能性的次级评估;以及 选择次级评估结果高于预定第二阈值的消息组。2.如权利要求1所述的方法,其中,在执行初级评估和次级评估的步骤,作为其他用户的影响力的递增函数而计算进一步重新发送的可能性。3.如权利要求2所述的方法,其中,作为关注其他用户的用户数量的递增函数而计算其他用户的影响力。4.如权利要求1所述的方法,其中,在执行初级评估和次级评估的步骤,作为其他用户过去重新发送引用第一用户的消息的消息的程度的递减函数而计算进一步重新发送的可能性。5.如权利要求4所述的方法,其中,作为在过去固定时段内其他用户重新发送引用第一用户的消息的消息的次数而计算已重新发送的程度。6.如权利要求1所述的方法,其中,在执行初级评估和次级评估的步骤,作为由其他用户重新发送的消息内容和由其他用户过去进一步重新发送的消息的相似度的递减函数而计算进一步重新发送的可能性。7.如权利要求6所述的方法,其中,通过将由其他用户重新发送的消息和由其他用户过去进一步重新发送的消息进行文本串匹配而计算相似度...
【专利技术属性】
技术研发人员:伊川洋平,榎美纪,RHP鲁迪,那须川哲哉,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。