The invention provides a topic display system and a topic display method, wherein the topic display system comprises an input unit, a display unit and an arithmetic processing unit. The input unit receives the initial keyword for the user to set the corresponding topic. The display unit displays at least one of the derivative issues within the time interval on the basis of temporal characteristics. The processing unit is coupled to the input unit and a display unit, a plurality of label multiple web pages within the time interval, the current relevance of key phrases according to the label co-occurrence of web page content. Key phrases in the current period include at least one current keyword. Then, the analysis processing unit of current between keywords by community noise is calculated on the basis of the strength of the association, and the repetition of initial keywords compared with the strength of the correlation between the calculated volume according to the community, to decide whether to produce at least one derivative issues. When deciding to generate at least one derivative issue, the display unit displays the topic and at least one derivative topic.
【技术实现步骤摘要】
议题显示系统和议题显示方法
本专利技术涉及一种议题显示系统和议题显示方法,且特别是一种能够自动判断与产生出衍生议题的议题显示系统和议题显示方法。
技术介绍
基于网络的普及,人们经常使用网络获得信息。当一件事件或社会现象正在发生时,网络上会出现相当多具有相关内容的网页,例如:当一件食品安全事件发生时,在新闻媒体或社群媒体上会大量出现食品安全的相关内容。不但如此,人们也基于网络上所发布的信息在网络上进行讨论,如此则形成网络舆论。现有的网络舆论分析系统为搜索引擎式的,其以关键词组进行搜索,并根据搜索结果将有关键词组的各篇新闻文章列出,或者显示文字与文字关联图。然而,在网络社群舆情议题的观察期间,有时会出现讨论议题方向出现改变。然而,难以以关键词组来分析出议题与后续的衍生的议题及其变化。衍生议题的切分需利用人工方式,造成舆论分析的费时与低效率,且不具即时性。并且,以原设定关键词搜索网络文章,可能遗漏衍生议题文章,有涵盖性不足的缺点。
技术实现思路
本专利技术实施例提供了一种议题显示系统和议题显示方法,避免了以人工逐一辨识并汇整相关议题,有助于舆情分析结果的即时性与全面性的舆情观察。本专利技术实施例提供了一种议题显示系统,包括输入单元、显示单元以及运算处理单元。输入单元接收使用者设定对应一议题的一初始关键词。显示单元基于时间特性显示议题在时间区间内的至少一衍生议题。运算处理单元耦接输入单元与显示单元,获得时间区间内的多个网页主题内容的多个标签,并根据所述标签共同出现的关联性获得所述网页主题内容的当期关键词组,其中,当期关键词组包括至少一当期关键词,接着运算处理单元分析当 ...
【技术保护点】
一种议题显示系统,其特征在于,所述议题显示系统包括:一输入单元,所述输入单元接收使用者设定的对应一议题的一初始关键词;一显示单元,所述显示单元基于时间特性显示所述议题在一时间区间内的至少一衍生议题;以及一运算处理单元,所述运算处理单元耦接所述输入单元与所述显示单元,获得所述时间区间内的多个网页主题内容的多个标签,并根据所述标签共同出现的关联性获得所述网页主题内容的一当期关键词组,其中,所述当期关键词组包括至少一当期关键词,接着所述运算处理单元分析所述当期关键词之间以社群声量为基础计算的关联强度,并将所述初始关键词的重复度与根据社群声量计算所得的关联强度进行比较,以决定是否产生所述至少一衍生议题,并且当决定产生所述至少一衍生议题时,所述运算处理单元使所述显示单元显示所述议题和所述至少一衍生议题。
【技术特征摘要】
2015.11.09 TW 1041368671.一种议题显示系统,其特征在于,所述议题显示系统包括:一输入单元,所述输入单元接收使用者设定的对应一议题的一初始关键词;一显示单元,所述显示单元基于时间特性显示所述议题在一时间区间内的至少一衍生议题;以及一运算处理单元,所述运算处理单元耦接所述输入单元与所述显示单元,获得所述时间区间内的多个网页主题内容的多个标签,并根据所述标签共同出现的关联性获得所述网页主题内容的一当期关键词组,其中,所述当期关键词组包括至少一当期关键词,接着所述运算处理单元分析所述当期关键词之间以社群声量为基础计算的关联强度,并将所述初始关键词的重复度与根据社群声量计算所得的关联强度进行比较,以决定是否产生所述至少一衍生议题,并且当决定产生所述至少一衍生议题时,所述运算处理单元使所述显示单元显示所述议题和所述至少一衍生议题。2.根据权利要求1所述的议题显示系统,其中,所述初始关键词能通过所述输入单元接收使用者设定的一主题网页文章并通过所述运算处理单元分析所述主题网页文章的内容而获得。3.根据权利要求1所述的议题显示系统,其中,所述运算处理单元首先根据所述当期关键词组读取的所述网页主题内容,通过标题、内容比对或文章连结追溯方式将所述网页主题内容分群,再根据分群后每一群的网页主题内容来分析所述至少一当期关键词之间的社群声量,并将所述当期关键词组所包括的至少一当期关键词与所述初始关键词计算重叠率,以及将至少一当期关键词的社群声量与所述初始关键词的社群声量进行比较。4.根据权利要求1所述的议题显示系统,其中,所述运算处理单元在分析所述至少一当期关键词之间的关联强度时,分别根据所述当期关键词在所述时间区间内所述网页主题内容中出现的次数以及所述当期关键词在同一所述网页主题内容出现的次数,再加入所述网页主题内容对应的社群声量值来进行计算。5.根据权利要求1所述的议题显示系统,其中,所述运算处理单元根据所述标签共同出现的关联性获得所述网页主题内容的至少一当期关键词,在判断所述网页主题内容的各个标签在所述网页主题内容中出现的次数超过一出现次数的阈值时,所述运算处理单元将所述标签决定为至少一当期关键词。6.根据权利要求1所述的议题显示系统,其中,所述运算处理单元利用K-core演算法建立每一所述网页主题内容的所述标签。7.根据权利要求1或4所述的议题显示系统,其中,所述运算处理单元根据所述至少一当期关键词与所述初始关键词的重叠率,以判断所述时间区间内的所述网页主题内容是否已产生所述至少一衍生议题。8.根据权利要求1或4所述的议题显示系统,其中,所述运算处理单元根据社群声量高的所述至少一当期关键词是否改变,以判断所述时间区间内的所述网页主题内容是否已产生所述至少一衍生议题。9.根据权利要求1所述的议题显示系统,其中,当所述当期关键词组中所有所述当期关键词的社群声量加总高于所述初始关键词的社群声量加总时,所述运算处理单元判断所述时间区间内的所述网页主题内容已产生所述至少一衍生议题且主要讨论议题已转变。10.一种议题显示方法,其特征在于,执行于一议题...
【专利技术属性】
技术研发人员:郭台达,陈棅易,
申请(专利权)人:财团法人资讯工业策进会,
类型:发明
国别省市:中国台湾,71
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。