一种舆情搜索方法、搜索装置、存储介质和终端设备制造方法及图纸

技术编号:20916691 阅读:22 留言:0更新日期:2019-04-20 09:43
本发明专利技术公开了一种舆情搜索方法、装置、存储介质及终端设备,舆情搜索方法包括:接收用户输入的第一搜索关键词,并根据第一搜索关键词搜索对应的第一舆情数据;按照第一预设分类方法对搜索到的第一舆情数据进行聚类分析,得到多个信息大类;计算各个信息大类的第一传播热度,并根据第一传播热度对信息大类进行降序排列;从降序排列的信息大类中抽取位于第一预设数量阈值前的信息大类,并输出所抽取的信息大类给用户。本发明专利技术在根据搜索关键词搜索到对应的舆情数据后,可按照预设分类方法将搜索到的舆情数据划分为多个信息大类,并可根据信息大类的传播热度向用户返回对应的舆情数据,以方便用户快速找到其想要的舆情信息,提高舆情信息的搜索效率。

A Public Opinion Search Method, Search Device, Storage Media and Terminal Equipment

The invention discloses a public opinion search method, device, storage medium and terminal equipment. The public opinion search method includes: receiving the first search keyword input by the user, and searching the corresponding first public opinion data according to the first search keyword; clustering analysis of the first public opinion data searched according to the first presupposition classification method, and obtaining a plurality of information categories; According to the first heat of transmission, the information categories are arranged in descending order; the information categories located before the first preset number threshold are extracted from the descending order information categories, and the extracted information categories are output to users. After searching the corresponding public opinion data according to the search keywords, the public opinion data searched can be divided into several information categories according to the preset classification method, and the corresponding public opinion data can be returned to the user according to the heat of dissemination of the information categories, so as to facilitate the user to quickly find the desired public opinion information and improve the search efficiency of public opinion information.

【技术实现步骤摘要】
一种舆情搜索方法、搜索装置、存储介质和终端设备
本专利技术涉及网络舆情处理
,尤其涉及一种舆情搜索方法、搜索装置、存储介质和终端设备。
技术介绍
舆情是舆论情况的简称,是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度,它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。目前的舆情系统,大多只是对原始舆情数据进行提取和汇总计算,以根据提取后的舆情数据来了解民众的思想动态、掌握大众需求、掌握舆情导向,用户难已准确、快速地找到某一具体舆情数据,难以获知舆情事件的详细情况。
技术实现思路
本专利技术实施例提供了一种舆情搜索方法、搜索装置、存储介质和终端设备,能够根据搜索关键词进行舆情数据的搜索,并能够分类输出舆情数据,以方便用户快速找到其想要的舆情信息,极大地提高了舆情信息的搜索效率。本专利技术实施例的第一方面,提供了一种舆情搜索方法,包括:接收用户输入的第一搜索关键词,并根据所述第一搜索关键词搜索对应的第一舆情数据;按照第一预设分类方法对搜索到的第一舆情数据进行聚类分析,得到多个信息大类;计算各个信息大类的第一传播热度,并根据所述第一传播热度对所述信息大类进行降序排列;从降序排列的所述信息大类中抽取位于第一预设数量阈值前的信息大类,并输出所抽取的信息大类给所述用户。本专利技术实施例的第二方面,提供了一种舆情搜索装置,包括:舆情数据搜索模块,用于接收用户输入的第一搜索关键词,并根据所述第一搜索关键词搜索对应的第一舆情数据;舆情数据聚类模块,用于按照第一预设分类方法对搜索到的第一舆情数据进行聚类分析,得到多个信息大类;第一传播热度计算模块,用于计算各个信息大类的第一传播热度,并根据所述第一传播热度对所述信息大类进行降序排列;信息大类抽取模块,用于从降序排列的所述信息大类中抽取位于第一预设数量阈值前的信息大类,并输出所抽取的信息大类给所述用户。本专利技术实施例的第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如前述第一方面所述舆情搜索方法的步骤。本专利技术实施例的第四方面,提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如下步骤:接收用户输入的第一搜索关键词,并根据所述第一搜索关键词搜索对应的第一舆情数据;按照第一预设分类方法对搜索到的第一舆情数据进行聚类分析,得到多个信息大类;计算各个信息大类的第一传播热度,并根据所述第一传播热度对所述信息大类进行降序排列;从降序排列的所述信息大类中抽取位于第一预设数量阈值前的信息大类,并输出所抽取的信息大类给所述用户。从以上技术方案可以看出,本专利技术实施例具有以下优点:本专利技术实施例中,可在预设舆情系统中接收用户输入的搜索关键词,并可根据搜索关键词搜索对应的舆情数据,在搜索到对应的舆情数据后,可按照预设分类方法将搜索到的舆情数据划分为多个信息大类,并统计各个信息大类的传播热度,随后抽取传播热度在前的多个信息大类返回给用户,从而实现根据搜索关键词搜索舆情数据,并根据传播热度分类输出舆情数据的目的,以方便用户快速找到其想要的舆情信息,极大地提高舆情信息的搜索效率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例中一种舆情搜索方法的一个实施例流程图;图2为本专利技术实施例中一种舆情搜索方法在一个应用场景下排列信息小类的流程示意图;图3为本专利技术实施例中一种舆情搜索方法在一个应用场景下确定与第二搜索关键词相对应的信息大类的流程示意图;图4为本专利技术实施例中一种舆情搜索装置的一个实施例结构图;图5为本专利技术一实施例提供的一种终端设备的示意图。具体实施方式本专利技术实施例提供了一种舆情搜索方法、搜索装置、存储介质和终端设备,用于根据搜索关键词进行舆情数据的搜索,并分类输出舆情数据,以方便用户快速找到其想要的舆情信息,极大地提高了舆情信息的搜索效率。为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。此外,术语“第一”、“第二”和“第三”等是用于区别不同对象,而非用于描述特定顺序。本专利技术实施例中,舆情搜索方法的执行主体为预设舆情系统,且该预设舆情系统在执行舆情搜索方法时,已通过分布式爬虫系统等爬取技术爬取了与各舆情事件相关的舆情数据,并已将所爬取到的舆情数据存储至了该预设舆情系统的数据库中,如已将所爬取到的舆情数据存储至了该预设舆情系统所对应的存储服务器中,因而,当该预设舆情系统接收到某一搜索关键词时,该预设舆情系统则可直接在所对应的存储服务器中进行与该搜索关键词相匹配的舆情数据的搜索。请参阅图1,本专利技术实施例提供了一种舆情搜索方法,所述舆情搜索方法包括:步骤S101、接收用户输入的第一搜索关键词,并根据所述第一搜索关键词搜索对应的第一舆情数据;可以理解的是,本专利技术实施例的预设舆情系统中提供有舆情检索入口,当用户需要搜索某一舆情事件时,用户可通过该舆情检索入口输入与该舆情事件相对应的搜索关键词,如可通过该舆情检索入口输入“足球”和“转会”的搜索关键词,该预设舆情系统在接收到用户输入的“足球”和“转会”的搜索关键词后,即可在该预设舆情系统的数据库中搜索与“足球”及“转会”相关的第一舆情数据,也就是说,在该预设舆情系统所对应的存储服务器中搜索足球领域中与转会相关的第一舆情数据。步骤S102、按照第一预设分类方法对搜索到的第一舆情数据进行聚类分析,得到多个信息大类;在此,在搜索得到对应的第一舆情数据后,该预设舆情系统可按照第一预设分类方法对所搜索到的第一舆情数据进行聚类分析,得到多个信息大类,如按照所搜索到的第一舆情数据所涉及的舆情主体对所搜索到的第一舆情数据进行聚类分析,以将相同主体的第一舆情数据划分为同一信息大类,例如,在搜索到的第一舆情数据所涉及的舆情主体包括球星A、球星B以及球星C时,则可将与球星A转会相关的第一舆情数据划分为信息大类A,将与球星B转会相关的第一舆情数据划分为信息大类B,以及与球星C转会相关的第一舆情数据划分为信息大类C。其中,本专利技术实施例中,所述第一预设分类方法可根据用户所搜索的舆情事件的实际情况进行具体确定,如当用户所搜索的舆情事件涉及不同的舆情主体时,所述第一预设分类方法则可为根据舆情主体进行分类的方法;又如,当用户所搜索的舆情事件涉及不同的传播渠道或者传播来源时,所述第一预设分类方法则可为根据传播渠道和/或者传播来源进行分类的方法;再如,当用户所搜索的舆情事件涉及不同的时间段时,所述第一预设分本文档来自技高网...

【技术保护点】
1.一种舆情搜索方法,其特征在于,包括:接收用户输入的第一搜索关键词,并根据所述第一搜索关键词搜索对应的第一舆情数据;按照第一预设分类方法对搜索到的第一舆情数据进行聚类分析,得到多个信息大类;计算各个信息大类的第一传播热度,并根据所述第一传播热度对所述信息大类进行降序排列;从降序排列的所述信息大类中抽取位于第一预设数量阈值前的信息大类,并输出所抽取的信息大类给所述用户。

【技术特征摘要】
1.一种舆情搜索方法,其特征在于,包括:接收用户输入的第一搜索关键词,并根据所述第一搜索关键词搜索对应的第一舆情数据;按照第一预设分类方法对搜索到的第一舆情数据进行聚类分析,得到多个信息大类;计算各个信息大类的第一传播热度,并根据所述第一传播热度对所述信息大类进行降序排列;从降序排列的所述信息大类中抽取位于第一预设数量阈值前的信息大类,并输出所抽取的信息大类给所述用户。2.根据权利要求1所述的舆情搜索方法,其特征在于,在按照第一预设分类方法对搜索到的第一舆情数据进行聚类分析,得到多个信息大类之后,还包括:按照第二预设分类方法对所述信息大类中的第二舆情数据进行聚类分析,得到多个信息小类;计算各个信息小类的第二传播热度;根据所述第二传播热度在所述信息大类中对所述信息小类进行降序排列。3.根据权利要求2所述的舆情搜索方法,其特征在于,在从降序排列的信息大类中抽取位于第一预设数量阈值前的信息大类,并输出所抽取的信息大类给所述用户之后,包括:接收用户输入的第二搜索关键词;确定与所述第二搜索关键词相对应的信息大类;从所确定的信息大类中搜索与所述第二搜索关键词相匹配的第三舆情数据,并将所搜索到的第三舆情数据输出给所述用户。4.根据权利要求3所述的舆情搜索方法,其特征在于,所述确定与所述第二搜索关键词相对应的信息大类,包括:获取各信息大类所对应的核心关键词,所述核心关键词是指通过预设提取方式从各信息大类的第二舆情数据中提取出的关键词;分别对所述核心关键词和所述第二搜索关键词进行向量化处理,得到所述核心关键词对应的第一向量和所述第二搜索关键词对应的第二向量;计算所述第二向量与各所述第一向量的余弦相似度;获取余弦相似度大于预设相似度阈值的第一向量,并将所获取的第一向量所对应的信息大类确定为与所述第二搜索关键词相对应的信息大类。5.根据权利要求3所述的舆情搜索方法,其特征在于,所述从所确定的信息大类中搜索与所述第二搜索关键词相匹配的第三舆情数据,并将所搜索到的第三舆情数据输出给所述用户,包括:从所确定的信息大类的各个信息小类中搜索与所述第二搜索关键词相匹配的第三舆情数据;计算搜索到的第三舆情数据的第三传播热度,并根据所述第三传播热度对所述第三舆情数据进行降序排列;从降序排列的所述第三舆情数据中抽取位于第二预设数量阈值前的第四舆情数据,并将所抽取的所述第四舆情数据输出给所述用户。6.根据权利要求2至5中任一项所述的舆情搜索方法,其特征在于,所述计算各个信息小类的第二传播热度,包括:获取各个信息小类中的舆情数据所对应的阅读量、评论量以及转发量,并根据下式计算各个信息小类中的舆情数据的第四传播热度:Weig...

【专利技术属性】
技术研发人员:吴壮伟
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1