一种高校舆情监控招生决策方法、装置、设备及存储介质制造方法及图纸

技术编号:23343789 阅读:50 留言:0更新日期:2020-02-15 04:01
本发明专利技术公开了一种高校舆情监控招生决策方法,步骤包括:登入预设监测目标的第一监测网站,抓取所述第一监测网站的高校招生信息同时从所述第一监测网站获取新的监测网址;对获取到的监测网址进行筛选,筛选出链接有效的监测网址并加入至搜索队列;根据高校招生内容信息量对所述搜索队列的监测网址进行排序,并确定下一步要登入的第二监测网站;其中,将在所述第二监测网站获取且经过筛选的监测网址加入所述搜索队列中,并重新评估所述搜索队列原有的监测网址的优先级同时根据新的排序确定下一步要登入的网站。本发明专利技术能够对舆情信息进行过滤、收集和深入分析,为高校招生决策提供较为充分的招生舆情数据支持。

A decision-making method, device, equipment and storage medium for college public opinion monitoring and enrollment

【技术实现步骤摘要】
一种高校舆情监控招生决策方法、装置、设备及存储介质
本专利技术涉及大数据
,尤其是涉及一种高校舆情监控招生决策方法、装置、设备及存储介质。
技术介绍
随着互联网技术的迅速发展,互联网产生的信息数据量呈指数增长趋势,在信息数据量巨大的情况下,对网络舆情进行监测和分析具有重要意义。多年来各高校已积累了大量的生源数据,这些生源数据对高校招生工作有深刻的指导意义,例如,考生会在选择院校的时候先行查看院校的专业介绍等信息。但是,高校现有的生源数据来自对院校内部的网站访问的监控,而且目前各高校的招生工作只是凭经验,依据传统的人工统计和主观决定已不能做出合理的招生决策。
技术实现思路
针对上述技术问题,本专利技术提供了一种高校舆情监控招生决策方法、装置、设备及存储介质,对舆情信息进行过滤、收集和深入分析,为高校招生决策提供较为充分的招生舆情数据支持。第一方面,本专利技术实施例提供了一种高校舆情监控招生决策方法,其特征在于,步骤包括:登入预设监测目标的第一监测网站,抓取所述第一监测网站的高校招生信息同时从所述第一监测网站获取新的监测网址;对获取到的监测网址进行筛选,筛选出链接有效的监测网址并加入至搜索队列;根据高校招生内容信息量对所述搜索队列的监测网址进行排序,并确定下一步要登入的第二监测网站;其中,将在所述第二监测网站获取且经过筛选的监测网址加入所述搜索队列中,并重新评估所述搜索队列原有的监测网址的优先级同时根据新的排序确定下一步要登入的网站。在本专利技术第一方面的第一种可能的实现方式中,所述对获取到的监测网址进行筛选,筛选出链接有效的监测网址并加入至搜索队列,具体为:判断所述监测网址的链接是否有效,若是,则标记为待登入网址;若否,则标记为无效网址;将所述待登入网址及所述无效网址存放至用于确定监测进度的次解析队列。在本专利技术第一方面的第二种可能的实现方式中,所述的高校舆情监控招生决策方法,还包括:设定监测目标,包括网络舆情监测的索引、监测的地址、监测的时间周期、监测的匹配方式。在本专利技术第一方面的第三种可能的实现方式中,所述抓取所述第一监测网站的高校招生信息,具体为:将爬取到的舆情数据存放到本地数据库中;当接收到用户请求时,调用所述舆情数据并对所述舆情数据进行数据处理;对经过数据处理的舆情数据进行统计并反馈给用户界面。第二方面,本专利技术实施例提供了一种高校舆情监控招生决策装置,包括:信息爬取模块,用于登入预设监测目标的第一监测网站,抓取所述第一监测网站的高校招生信息同时从所述第一监测网站获取新的监测网址;网址筛选模块,用于对获取到的监测网址进行筛选,筛选出链接有效的监测网址并加入至搜索队列;搜索排序模块,用于根据高校招生内容信息量对所述搜索队列的监测网址进行排序,并确定下一步要登入的第二监测网站;其中,将在所述第二监测网站获取且经过筛选的监测网址加入所述搜索队列中,并重新评估所述搜索队列原有的监测网址的优先级同时根据新的排序确定下一步要登入的网站。在本专利技术第二方面的第一种可能的实现方式中,所述网址筛选模块,用于包括:判断模块,用于判断所述监测网址的链接是否有效,若是,则标记为待登入网址;若否,则标记为无效网址;进度更新模块,用于将所述待登入网址及所述无效网址存放至用于确定监测进度的次解析队列。在本专利技术第二方面的第二种可能的实现方式中,所述的高校舆情监控招生决策装置,还包括:监测目标设置模块,用于设定监测目标,包括网络舆情监测的索引、监测的地址、监测的时间周期、监测的匹配方式。在本专利技术第二方面的第三种可能的实现方式中,所述信息爬取模块包括:保存模块,用于将爬取到的舆情数据存放到本地数据库中;数据处理模块,用于当接收到用户请求时,调用所述舆情数据并对所述舆情数据进行数据处理;反馈模块,用于对经过数据处理的舆情数据进行统计并反馈给用户界面。第三方面,本专利技术提供了一种高校舆情监控招生决策设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的高校舆情监控招生决策方法。第四方面,本专利技术提供一种高校舆情监控招生决策方法的存储介质,所述高校舆情监控招生决策方法的存储介质用于存储一个或多个计算机程序,所述一个或多个计算机程序包括程序代码,当所述计算机程序在计算机上运行时,所述程序代码用于执行上述的高校舆情监控招生决策方法。相比于现有技术,本专利技术实施例具有如下有益效果:本专利技术提供一种高校舆情监控招生决策方法,能够将用户在网络上查看、发布的高校信息进行一个收集,类似官网访问量、百度指数、微信文章阅读量、微博话题量、百度贴吧活跃度等,对互联网海量信息自动抓取、自动分类聚类、主题检测、专题聚焦,满足用户的网络舆情监测和新闻专题追踪等信息需求,高校得以根据舆情数据做出招生决策,减少了招生工作上的繁琐。同时将舆情信息来源的网址进行筛选并置于队列中进行信息爬取的优先排序,有利于在更广泛的范围获取到优质的信息。附图说明图1是本专利技术实施例中的一种高校舆情监控招生决策方法的步骤流程图;图2是本专利技术实施例中的一种高校舆情监控招生决策方法的创建监测方案的步骤流程图;图3是本专利技术实施例中的一种高校舆情监控招生决策方法的利用网络爬虫技术爬取方法的步骤流程图;图4是本专利技术实施例中的一种高校舆情监控招生决策方法的数据处理方法的步骤流程图;图5是本专利技术实施例中的一种高校舆情监控招生决策装置的模块图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参见图1,其示出了本专利技术提供的一种示例性实施例,一种高校舆情监控招生决策方法,步骤包括:设定监测目标,包括网络舆情监测的索引、监测的地址、监测的时间周期、监测的匹配方式;请参见图2,其示出了本实施例的具体实施方式,创建一个监测方案,填写进行网络舆情监测的索引,例如:专业名称;选择进行监测的地址,例如:院校官网的访问量、百度指数、微信公众号阅读量等;设定监测的时间周期:一天以内、两天、三天等;设定监测的匹配方式:按全文、按标题、安正文等;S101、登入预设监测目标的第一监测网站,抓取所述第一监测网站的高校招生信息同时从所述第一监测网站获取新的监测网址;其中,根据先前设定好的规则使用网络爬虫方式,对网络在线招生舆情进行抓取;所述网络爬虫方式具体是,利用获取到的浏览器插件监测到网页上关于高校招生的文字、图像等信息,并且将该文字、图像等信息保存。S102、对获取到的监测网址进行筛选,筛选出链接有效的监测网址并加入至搜索本文档来自技高网...

【技术保护点】
1.一种高校舆情监控招生决策方法,其特征在于,步骤包括:/n登入预设监测目标的第一监测网站,抓取所述第一监测网站的高校招生信息同时从所述第一监测网站获取新的监测网址;/n对获取到的监测网址进行筛选,筛选出链接有效的监测网址并加入至搜索队列;/n根据高校招生内容信息量对所述搜索队列的监测网址进行排序,并确定下一步要登入的第二监测网站;其中,将在所述第二监测网站获取且经过筛选的监测网址加入所述搜索队列中,并重新评估所述搜索队列原有的监测网址的优先级同时根据新的排序确定下一步要登入的网站。/n

【技术特征摘要】
1.一种高校舆情监控招生决策方法,其特征在于,步骤包括:
登入预设监测目标的第一监测网站,抓取所述第一监测网站的高校招生信息同时从所述第一监测网站获取新的监测网址;
对获取到的监测网址进行筛选,筛选出链接有效的监测网址并加入至搜索队列;
根据高校招生内容信息量对所述搜索队列的监测网址进行排序,并确定下一步要登入的第二监测网站;其中,将在所述第二监测网站获取且经过筛选的监测网址加入所述搜索队列中,并重新评估所述搜索队列原有的监测网址的优先级同时根据新的排序确定下一步要登入的网站。


2.如权利要求1所述的高校舆情监控招生决策方法,其特征在于,所述对获取到的监测网址进行筛选,筛选出链接有效的监测网址并加入至搜索队列,具体为:
判断所述监测网址的链接是否有效,若是,则标记为待登入网址;若否,则标记为无效网址;
将所述待登入网址及所述无效网址存放至用于确定监测进度的次解析队列。


3.如权利要求1所述的高校舆情监控招生决策方法,其特征在于,还包括:
设定监测目标,包括网络舆情监测的索引、监测的地址、监测的时间周期、监测的匹配方式。


4.如权利要求1所述的高校舆情监控招生决策方法,其特征在于,所述抓取所述第一监测网站的高校招生信息,具体为:
将爬取到的舆情数据存放到本地数据库中;
当接收到用户请求时,调用所述舆情数据并对所述舆情数据进行数据处理;
对经过数据处理的舆情数据进行统计并反馈给用户界面。


5.一种高校舆情监控招生决策装置,其特征在于,包括:
信息爬取模块,用于登入预设监测目标的第一监测网站,抓取所述第一监测网站的高校招生信息同时从所述第一监测网站获取新的监测网址;
网址筛选模块,用于对获取到的监测网址进行筛选,筛选出链接有效的监测网址并加入至搜索队列;
搜...

【专利技术属性】
技术研发人员:蔡中兴
申请(专利权)人:广州番禺职业技术学院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1