一种预测报考信息的方法和装置制造方法及图纸

技术编号:10579787 阅读:120 留言:0更新日期:2014-10-29 12:09
本发明专利技术提供了一种预测报考信息的方法和装置。其中,建库单元建立用于存储院校信息的院校数据库;日志获取单元获取用户的网络操作日志;日志分析单元对所获取的网络操作日志进行分析,确定用户的需求信息;报考预测单元根据所述院校数据库的院校信息和所述需求信息,预测报考信息。与现有技术相比,本发明专利技术通过整合院校信息和大量用户的网络操作日志,可以为用户提供准确、完善的报考预测信息。

【技术实现步骤摘要】
【专利摘要】本专利技术提供了一种预测报考信息的方法和装置。其中,建库单元建立用于存储院校信息的院校数据库;日志获取单元获取用户的网络操作日志;日志分析单元对所获取的网络操作日志进行分析,确定用户的需求信息;报考预测单元根据所述院校数据库的院校信息和所述需求信息,预测报考信息。与现有技术相比,本专利技术通过整合院校信息和大量用户的网络操作日志,可以为用户提供准确、完善的报考预测信息。【专利说明】一种预测报考信息的方法和装置
本专利技术涉及互联网领域,尤其涉及一种预测报考信息的方法和装置。
技术介绍
目前,考生在填报高考志愿时,通常通过阅读学校统一发放的关于各高校的概况 信息资料,以知晓各高校历年在各省的录取分数线,或者通过从网上搜集各种资料,比如在 诸如微博、贴吧中搜索与报考学校有关的信息,并结合自身的实际情况,预测报考信息,包 括诸如某高校今年的报考热度和报考难度、某专业今年的报考热度和报考难度、被某些院 校录取的成功率等等。但是由于考生获取的信息有限,因而实际情况和考生获取的信息往 往是不对称的,很容易造成报考信息预测的不准确,由此导致考生最终高分低录以及上线 落榜等诸多不理想的情况。
技术实现思路
本专利技术的目的是提供一种预测报考信息的方法和装置,可以为用户提供实时有效 的报考预测信息。 根据本专利技术的一个方面,提供了一种预测报考信息的方法,包括: 建立用于存储院校信息的院校数据库; 获取用户的网络操作日志; 对所获取的网络操作日志进行分析,确定用户的需求信息; 根据所述院校数据库的院校信息和所述需求信息,预测报考信息。 根据本专利技术的另一个方面,还提供了一种向用户提供报考预测信息的方法,包 括: 获取用户的检索词; 判断所获取的检索词是否属于预定检索序列,如果是,则基于该检索词获取对应 的搜索卡片并将所述搜索卡片提供给用户; 获取用户在所述搜索卡片中输入的考生信息; 根据所述考生信息并根据权利要求1所述的方法,生成与所述考生信息对应的报 考预测信息; 响应用户对所述搜索卡片的特定操作,将与所述考生信息对应的报考预测信息提 供给用户。 根据本专利技术的又一个方面,还提供了一种预测报考信息的装置,包括: 用于建立用于存储院校信息的院校数据库的单元; 用于获取用户的网络操作日志的单元; 用于对所获取的网络操作日志进行分析,确定用户的需求信息的单元; 用于根据所述院校数据库的院校信息和所述需求信息,预测报考信息的单元。 与现有技术相比,本专利技术通过对获取的各个院校的信息和确定的用户需求信息进 行统计和分析,可以准确且实时地为用户预测报考相关的信息。而且,本专利技术还可以通过对 获取的院校信息进行交叉对比和排重处理,在排除错误的院校信息的前提下,进一步提升 院校信息的准确性,从而保证所预测的报考信息更接近真实情况。而且,本专利技术通过获取用 户不同维度的网络操作日志,可以更准确地分析用户的潜在需求,从而在结合用户的潜在 需求的前提下,为用户提供更实用更准确的报考预测信息。 【专利附图】【附图说明】 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它 特征、目的和优点将会变得更明显: 图1示出根据本专利技术一个方面的预测报考信息的方法流程图; 图2示出根据本专利技术另一个方面的向用户提供报考预测信息的方法流程图; 图3示出根据本专利技术另一个方面的预测报考信息的装置的示意性框图; 附图中相同或相似的附图标记代表相同或相似的部件。 【具体实施方式】 下面结合附图对本专利技术作进一步详细描述。 图1示出根据本专利技术一个方面的预测报考信息的方法流程图;其中,在步骤si中, 建立用于存储院校信息的院校数据库;在步骤s2中,获取用户的网络操作日志;在步骤S3 中,对所获取的网络操作日志进行分析,确定用户的需求信息;在步骤s4中,根据所述院校 数据库的院校信息和所述需求信息,预测报考信息。 上述各步骤是持续不断工作的,在此,此处的"持续"是指上述各步骤分别实时地, 或者按照设定的或实时调整的工作模式要求进行工作。 其中,在步骤si中,通过数据挖掘技术获取院校信息,将所获取的院校信息存储 至建立的院校数据库。在此,本领域技术人员应能理解此处的数据挖掘技术在此不作限定, 任何可适用于本专利技术的数据挖掘技术都应包含在本专利技术保护范围以内,并在此以引用方式 包含于此。其中的院校信息包括诸如从各个院校的官网上获取的基本情况、综合排名、师资 构成、科研实力等数据,诸如从特定网站或信息源获取的关于各个院校历年的录取分数线、 历年录取情况等数据。 可选地,步骤si包括: 确定目标网站,从所述目标网站中抓取院校信息的步骤; 对所抓取的院校信息进行预处理,将经过预处理的所述院校信息存储至院校数据 库的步骤。 具体地,根据各个网站所提供的数据内容,从中筛选出提供院校信息的网站,并将 所筛选出的网站确定为目标网站,诸如从多个网站中筛选出网站百度知道、百度百科、百度 贴吧、搜索问问、中国教育在线、阳光高考信息网、搜学网、新浪高考频道、搜狐高考频道等 与高校数据有关的网站作为目标网站。进一步地,从所述确定的目标网站中抓取所需的院 校信息。例如,从百度知道和百度百科的网站中抓取"清华大学"的相关信息。在此,信息 抓取的规则在此不作限定。优选地,根据目标网站中的每个网站的不同排版布局,采用不同 的信息抓取规则从中抓取所需的院校信息或从不同网站的不同特定位置抓取所需的院校 信息。例如,对于目标网站百度百科、百度知道、百度贴吧、搜狐高考频道分别采用对应的不 同抓取规则从中抓取院校信息。 进一步地,对所抓取的院校信息进行预处理,将经过预处理的院校信息存储至院 校数据库。 优选地,对所抓取的院校信息进行如下预处理: 确定所述目标网站中所抓取的院校信息的可信度; 基于所述可信度,对所抓取的院校信息进行交叉对比和排重处理。 具体地,可以根据目标网站的知名度、权威性或/和信息提供方的可信度来确定 所述目标网站中所抓取的院校信息的可信度,并基于该可信度对所抓取的院校信息进行交 叉对比和排重处理。例如,从A、B、C、D、E五个网站上分别抓取关于"清华大学2014年电子 工程系录取名额"的信息,其中从A、B、C、D网站上所抓取的信息都显示"清华大学2014年 电子工程系录取名额为M",而E网站上所抓取的信息显示"清华大学2014年电子工程系录 取名额为N",并且,A、B、C、D、E五个网站的知名度和权威性是相同的,则经过对上述信息进 行交叉对比和排重处理,过滤从网站E所抓取的信息"清华大学2014年电子工程系录取名 额为N",并将从网站A、B、C、D中任意一个网站所抓取的信息"清华大学现有院士的数目为 M"存储至院校数据库,也即,虽然从网站A、B、C、D中共抓取四条相同的信息"清华大学2014 年电子工程系录取名额为M",但是经过排重处理,去除重复的信息,仅取其中一条信息存储 至院校数据库。又如,从"百度知道"或"百度贴吧"中的任一个网站抓取多个用户主动提 供的关于问题"清华大学如何"的回答信息,则根据提供所述本文档来自技高网...
一种预测报考信息的方法和装置

【技术保护点】
一种预测报考信息的方法,包括:建立用于存储院校信息的院校数据库;获取用户的网络操作日志;对所获取的网络操作日志进行分析,确定用户的需求信息;根据所述院校数据库的院校信息和所述需求信息,预测报考信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:贾星辉张弛林静赵世奇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1