社群文章影响力预测方法以及社群文章影响力预测装置制造方法及图纸

技术编号:15542100 阅读:70 留言:0更新日期:2017-06-05 11:11
本发明专利技术提供一种社群文章影响力预测方法以及社群文章影响力预测装置。所述社群文章影响力预测方法包括以下步骤。步骤A:对社群文章执行议题分析,以分类社群文章所属的内容领域。步骤B:计算社群文章的基础影响力。步骤C:收集社群文章的作者的作者历史文章,并根据作者历史文章计算作者一般影响力修正量。步骤D:筛选作者在内容领域的作者-领域历史文章,并根据作者-领域历史文章计算作者领域影响力修正量。步骤E:根据基础影响力、作者一般影响力修正量以及作者领域影响力修正量,计算社群文章的预测影响力。

Community article impact prediction method and community article impact prediction device

The invention provides a community article influence prediction method and a community article impact prediction device. The community article impact prediction method comprises the following steps. Step A: analyze the issue of community articles to classify the content areas of the community articles. Step B: calculate the basic impact of community articles. Step C: collect the author's historical articles from the author of the community article, and calculate the author's general impact corrections based on the author's historical articles. Step D: filter the author's field history article in the content field and calculate the author's domain impact corrections based on the author domain history article. Step E: calculate the impact of community articles on the basis of the influence, the author's general impact correction, and the author's field correction.

【技术实现步骤摘要】
社群文章影响力预测方法以及社群文章影响力预测装置
本专利技术关于一种社群文章影响力预测方法,且特别是一种可快速预测社群文章的影响力以实时通知用户的社群文章影响力预测方法,以及使用其的社群文章影响力预测装置。
技术介绍
随着科技迅速发展,信息的传递也变的更加方便且快速。社群媒体是民众发生的主要平台,也是政府与企业了解民意的重要管道。用户发表的文章可能会被广大的网络用户所观看并引起回响。具体来说,消费者在社群媒体上发表对于一产品的社群文章可能会对该产品造成良好的广告效果。或者,公众人物发表的社群文章可能会对特定对象造成负面的影响。社群媒体的多样性高,例如微博、论坛、个人部落格、新闻网站或是电子商务网站等都是常见的社群媒体。每一个社群媒体都可能是重要舆情产生或散布的场所。为了了解社群文章被发表后会造成多少影响,目前已出现一种统计技术,可以持续追踪社群文章,并纪录社群文章扩散后影响了网络用户。举例来说,统计微博上的文章得到了多少网络用户的响应。换句话说,此统计技术可以统计并分析社群文章造成的广告效果。然而,目前的统计技术存在着几个缺点。首先,目前的统计技术是统计社群文章扩散之后产生的影响力,故目前的统计技术并无法实时的判断社群文章的影响力。若社群文章对企业有高度的负面影响,目前的统计技术无法及时的通知企业,并让企业能实时做出处置。此外,目前的统计技术仅能针对社群文章的文字进行分析。目前的统计技术并无法将社群文章的内容、作者以及近期发生的新闻事件一同纳入考虑。
技术实现思路
本专利技术实施例提供一种社群文章影响力预测方法。所述社群文章影响力预测方法用以预测社群文章的预测影响力。预测影响力系社群文章所获得的互动量的估计值。所述社群文章影响力预测方法包括以下步骤。步骤A:对社群文章执行议题分析,以分类社群文章所属的内容领域。步骤B:计算社群文章内的多个字词的字词权重,并根据所述字词权重获得社群文章的基础影响力。基础影响力系社群文章发表经过第一预设时间后所获得的互动量的初始估计值。步骤C:收集社群文章的作者的至少一作者历史文章,并根据作者历史文章的互动量计算第一影响力平均值。接着将第一影响力平均值与第一参考影响力平均值相减,以获得作者一般影响力修正量,其中第一参考影响力平均值为所有历史文章的互动量的平均值。步骤D:筛选作者在内容领域的至少一作者-领域历史文章,并根据作者-领域历史文章的互动量计算第二影响力平均值。接着将第二影响力平均值与第二参考影响力平均值相减,以获得作者领域影响力修正量,其中第二参考影响力平均值系此内容领域的所有历史文章的互动量的平均值。步骤E:根据基础影响力、作者一般影响力修正量以及作者领域影响力修正量,计算预测影响力。本专利技术实施例提供一种社群文章影响力预测装置。所述社群文章影响力预测装置用以预测社群文章的预测影响力。预测影响力系社群文章所获得的互动量的估计值。所述社群文章影响力预测装置包括分析模块以及预测模块。预测模块包括基础影响力估计单元、第一影响力修正量产生单元以及运算单元。基础影响力估计单元与第一影响力修正量产生单元分别耦接于分析模块。运算单元耦接于基础影响力估计单元以及第一影响力修正量产生单元。分析模块用以对社群文章执行议题分析,以分类社群文章所属的内容领域。预测模块用以产生预测影响力。基础影响力估计单元用以计算社群文章内的多个字词的字词权重,并根据所述字词权重获得社群文章的基础影响力。基础影响力系社群文章发表经过第一预设时间后所获得的互动量的初始估计值。第一影响力修正量产生单元用以产生作者一般影响力修正量以及作者领域影响力修正量。第一影响力修正量产生单元收集社群文章的作者的至少一作者历史文章,并根据作者历史文章的互动量计算第一影响力平均值。第一影响力修正量产生单元接着将第一影响力平均值与第一参考影响力平均值相减,以获得作者一般影响力修正量。第一参考影响力平均值为所有历史文章的互动量的平均值。第一影响力修正量产生单元筛选作者在此内容领域的至少一作者-领域历史文章,并根据作者-领域历史文章的互动量计算第二影响力平均值。第一影响力修正量产生单元接着将第二影响力平均值与第二参考影响力平均值相减,以获得作者领域影响力修正量。第二参考影响力平均值系内容领域的所有历史文章的互动量的平均值。运算单元用以根据基础影响力、作者一般影响力修正量以及作者领域影响力修正量计算预测影响力。综上所述,本专利技术实施例所提供的社群文章影响力预测方法以及使用其的社群文章影响力预测装置,可以对社群文章进行分析,并在社群文章扩散前预测其影响力,进而迅速地通知需要知道此社群文章的实体。为使能更进一步了解本专利技术的特征及
技术实现思路
,请参阅以下有关本专利技术之详细说明与附图,但是此等说明与所附图式仅系用来说明本专利技术,而非对本专利技术的权利范围作任何的限制。附图说明图1是本专利技术实施例提供的社群文章影响力预测装置的示意图。图2是本专利技术实施例提供的社群文章影响力预测方法的流程图。图3是本专利技术实施例提供的分析模块的运作流程图。图4是本专利技术实施例提供的预测模块的示意图。图5是本专利技术实施例提供的基础影响力估计单元的运作流程图。图6是本专利技术实施例提供的第一影响力修正量产生单元的运作流程图。图7是本专利技术实施例提供的第二影响力修正量产生单元的运作流程图。具体实施方式在下文将参看随附图式更充分地描述各种例示性实施例,在随附图式中展示一些例示性实施例。然而,本专利技术概念可能以许多不同形式来体现,且不应解释为限于本文中所阐述之例示性实施例。确切而言,提供此等例示性实施例使得本专利技术将为详尽且完整,且将向熟习此项技术者充分传达本专利技术概念的范畴。在诸图式中,可为了清楚而夸示层及区的大小及相对大小。类似数字始终指示类似组件。应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件或信号等,但此等组件或信号不应受此等术语限制。此等术语乃用以区分一组件与另一组件,或者一信号与另一信号。另外,如本文中所使用,术语「或」视实际情况可能包括相关联之列出项目中之任一者或者多者的所有组合。图1是本专利技术实施例提供的社群文章影响力预测装置的示意图。社群文章影响力预测装置1包括分析模块10、预测模块11、关联模块12以及通报清单产生模块13。分析模块10耦接于预测模块11以及关联模块12。通报清单产生模块13分别耦接于分析模块10、预测模块11以及关联模块12。此外,分析模块10、预测模块11以及通报清单产生模块13分别耦接于一历史文章数据库2。关联模块12耦接于一实体关联数据库3。分析模块10包含适当的逻辑、电路和/或编码,用以接收社群文章contenti,并根据历史文章数据库2提供的历史文章对社群文章contenti执行议题分析,进而获得社群文章contenti所属的内容领域以及领域议题。历史文章可以是任何在社群文章contenti被发表前就公开的数据。内容领域代表社群文章contenti所属的领域,例如为政治、运动、科技或是财经等。领域议题代表社群文章contenti的内容属于哪一种议题。举例来说,社群文章contenti的内容是讨论特定手机产品的故障问题,则社群文章contenti的内容领域为科技领域内的手机类,而领域议题为故障讨论。分析模块10还可以将社群文章co本文档来自技高网
...
社群文章影响力预测方法以及社群文章影响力预测装置

【技术保护点】
一种社群文章影响力预测方法,用以预测一社群文章的一预测影响力,其中该预测影响力为该社群文章所获得的互动量的一估计值,其特征在于,包括下列步骤:步骤A:对该社群文章执行一议题分析,以分类该社群文章所属的一内容领域;步骤B:计算该社群文章内的多个字词的字词权重,并根据所述字词权重获得该社群文章的一基础影响力,其中该基础影响力为该社群文章发表经过一第一预设时间后所获得的互动量的一初始估计值;步骤C:收集该社群文章的一作者的至少一作者历史文章,并根据该作者历史文章的互动量计算一第一影响力平均值,接着将该第一影响力平均值与一第一参考影响力平均值相减,以获得一作者一般影响力修正量,其中该第一参考影响力平均值为所有历史文章的互动量的一平均值;步骤D:筛选该作者在该内容领域的至少一作者‑领域历史文章,并根据该作者‑领域历史文章的互动量计算一第二影响力平均值,接着将该第二影响力平均值与一第二参考影响力平均值相减,以获得一作者领域影响力修正量,其中该第二参考影响力平均值为该内容领域的所有历史文章的互动量的一平均值;及步骤E:根据该基础影响力、该作者一般影响力修正量以及该作者领域影响力修正量,计算该预测影响力。...

【技术特征摘要】
2015.11.18 TW 1041380611.一种社群文章影响力预测方法,用以预测一社群文章的一预测影响力,其中该预测影响力为该社群文章所获得的互动量的一估计值,其特征在于,包括下列步骤:步骤A:对该社群文章执行一议题分析,以分类该社群文章所属的一内容领域;步骤B:计算该社群文章内的多个字词的字词权重,并根据所述字词权重获得该社群文章的一基础影响力,其中该基础影响力为该社群文章发表经过一第一预设时间后所获得的互动量的一初始估计值;步骤C:收集该社群文章的一作者的至少一作者历史文章,并根据该作者历史文章的互动量计算一第一影响力平均值,接着将该第一影响力平均值与一第一参考影响力平均值相减,以获得一作者一般影响力修正量,其中该第一参考影响力平均值为所有历史文章的互动量的一平均值;步骤D:筛选该作者在该内容领域的至少一作者-领域历史文章,并根据该作者-领域历史文章的互动量计算一第二影响力平均值,接着将该第二影响力平均值与一第二参考影响力平均值相减,以获得一作者领域影响力修正量,其中该第二参考影响力平均值为该内容领域的所有历史文章的互动量的一平均值;及步骤E:根据该基础影响力、该作者一般影响力修正量以及该作者领域影响力修正量,计算该预测影响力。2.根据权利要求1所述的社群文章影响力预测方法,其中步骤A还包括下列步骤:步骤A-1:分析该社群文章内的所述字词,并判断所述字词属于一情绪词或一否定词,其中该情绪词分为正向情绪词或负向情绪词;步骤A-2:汇整该社群文章内的情绪词或否定词,并判断该社群文章的一情绪极性;及步骤A-3:根据该正向情绪词或该负向情绪词出现于该社群文章的一比例判断一情绪强度。3.根据权利要求1所述的社群文章影响力预测方法,其中步骤B为根据TF-IDF方法计算所述字词的字词权重,并排序所述字词权重以获得该社群文章的多个代表字词。4.根据权利要求3所述的社群文章影响力预测方法,其中步骤B还包括下列步骤:步骤B-1:获取该社群文章于发表前一第二预设时间内,以该社群文章的代表字词的至少其中一者作为一代表字词的至少一参考历史文章;步骤B-2:根据该参考历史文章的互动量计算该社群文章的所述代表字词在该社群文章发表前的平均影响力;及步骤B-3:将所述代表字词的字词权重与对应的平均影响力做加权平均运算,以获得该社群文章的基础影响力。5.根据权利要求1所述的社群文章影响力预测方法,还包括下列步骤:步骤F:根据所述字词权重判断该社群文章所属的至少一新闻事件,并根据该新闻事件计算一事件影响力修正量,其中该新闻事件包括与该社群文章同性质的至少一新闻;及步骤G:根据该基础影响力、该作者一般影响力修正量、该作者领域影响力修正量以及该事件影响力修正量,计算该预测影响力。6.根据权利要求5所述的社群文章影响力预测方法,其中步骤F还包括下列步骤:步骤F-1:分别计算多个新闻内的多个字词的字词权重;步骤F-2:根据所述字词权重判断所述新闻之间的一文章相似度;步骤F-3:比较所述新闻之间的一发表时间,并计算所述新闻彼此间的发表时间间隔;及步骤F-4:将所述新闻中该文章相似度大于等于一最小相似度,且发表时间间隔低于一最短时间间隔的新闻汇总成一新闻事件。7.根据权利要求6所述的社群文章影响力预测方法,其中步骤F还包括下列步骤:步骤F-5:将该新闻事件内的所有新闻的字词权重做加总与平均,以获得该新闻事件的一质心向量;步骤F-6:根据该社群文章的字词权重与该新闻事件的质心向量计算该社群文章与该新闻事件的一事件相似度,以该社群文章的一发表时间与该新闻事件中最晚发表的新闻的一发表时间的差值作为一时间间隔,并根据该事件相似度与该时间间隔筛选与该社群文章相关的新闻事件;步骤F-7:获取该社群文章于发表前一第三预设时间内,与该新闻事件相关的至少一相关历史文章,并依据该相关历史文章的互动量计算该新闻事件的一第三影响力平均值;步骤F-8:将该新闻事件的第三影响力平均值与一第三参考影响力平均值相减,以获得该新闻事件的一影响力修正量,其中该第三参考影响力平均值为该社群文章于发表前该第三预设时间内的所有历史文章的互动量的平均值;及步骤F-9:将该事件相似度与该影响力修正量做加权平均运算,以获得该社群文章的事件影响力修正量。8.根据权利要求5所述的社群文章影响力预测方法,其中步骤G还包括下列步骤:步骤G-1:当该作者一般影响力修正量大于该作者领域影响力修正量,将该基础影响力、该作者一般影响力修正量以及该事件影响力修正量加总作为该预测影响力;及步骤G-2:当该作者一般影响力修正量小于该作者领域影响力修正量,将该基础影响力、该作者领域影响力修正量以及该事件影响力修正量加总作为该预测影响力。9.根据权利要求5所述的社群文章影响力预测方法,其中步骤G还包括下列步骤:步骤G-1’:建立一回归模型,并将该作者一般影响力修正量、该作者领域影响力修正量以及该事件影响力修正量作为自变量,预测该基础影响力与一实际影响力间的误差,以获得该预测影响力。10.根据权利要求1所述的社群文章影响力预测方法,还包括下列步骤:步骤H:根据至少一专家知识、至少一网络信息或至少一历史文章建立多个实体间的一关联模型,其中所述实体为与该社群文章相关联的对象。11.根据权利要求10所述的社群文章影响力预测方法,还包括下列步骤:步骤I:分类该社群文章所属的一领域议题;步骤J:根据该领域议题、该预测影响力以及该关联模型,产生一通报对象清单,其中该通报对象清单包括至少一实体。12.根据权利要求11所述的社群文章影响力预测方法,其中步骤J还包括下列步骤:步骤J-1:分析一特定历史文章的领域议题、预期影响力以及关联模型,以判断该社群文章对于一特定实体的一紧急程度,并根据判断结果产生该通报对象清单,其中该特定历史文章对于该特定实体有高影响力。13.根据权利要求11所述的社群文章影响力预测方法,其中步骤J还包括下列步骤:步骤J-1’:判断该社群文章的领域议题、预测影响力以及关联模型是否符合一指定条件,其中该指定条件包括一预期影响力门坎值、至少一指定议题以及至少一指定实体;步骤J-2’:当该社群文章的预测影响力大于该预期影响力门坎值、该社群文章的领域议题出现于该指定议题、且该社群文章的关联模型包括该指定实体时,产生该通报对象清单以通知该指定条件所对应的实体。14.一种社群文章影响力预测装置,用以预测一社群文章的一预测影响力,其中该预测影响力为该社群文章所获得的互动量的一估计值,其特征在于,该社群文章影响力预测装置包括:一分析模块,用以对该社群文章执行一议题分析,以分类该社群文章所属的一内容领域;一预测模块,用以产生该预测影响力...

【专利技术属性】
技术研发人员:吴家齐林鼎家林蔚君詹雅慧
申请(专利权)人:财团法人资讯工业策进会
类型:发明
国别省市:中国台湾,71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1