周报信息处理方法及装置制造方法及图纸

技术编号:14403687 阅读:90 留言:0更新日期:2017-01-11 15:36
本发明专利技术提供了一种周报信息处理方法及装置,其中,该方法包括:从指定网页中获取周报信息;获取指定指令;根据指定指令从周报信息中筛选出指定周报信息。通过本发明专利技术解决了相关技术中无法实现周报信息的自动获取、智能分析等二次处理的问题,进而实现了网页上海量项目周报相关数据的自动采集、智能分析,达到了满足用户可定制需求。

【技术实现步骤摘要】

本专利技术涉及通信领域,具体而言,涉及一种周报信息处理方法及装置
技术介绍
随着信息化技术的发展,政府、企业单位的信息化程度日益提高。大企业的项目数量与项目信息增长迅速,部门内部、部门之间的项目进展信息共享需求迫切,项目管理信息化、自动化是企业信息化建设的重点工作方向之一。网络爬虫是一种按照一定的规则,自动的抓取互联网信息的程序。它从一个初始的网页集出发,遍历自动的采集网络信息。当爬虫打开某个HTML页面后,它会分析HTML标记结构来获取信息,并获取指向其它页面的超级链接,然后通过既定的搜索策略选择下一个要访问的站点。数据挖掘是指从大量的数据中通过算法搜索信息的过程。数据挖掘与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统和模式识别等诸多方法来实现上述目标。分析方法包括分类(Classification)、估计(Estimation)、预测(Prediction)、相关性分组或关联规则(Affinitygroupingorassociationrules)、聚类(Clustering)、复杂数据类型挖掘(Text,Web,图形图像,视频,音频)等。目前很多企业项目管理过程中,需要每周在网页上填写项目周报,一般由各项目的负责人填写,并且每个项目有一个独立的周报。为达到部门间项目信息共享的目的,需每周汇总周报,共享给各个部门。数以千计的周报普遍采用专人人工汇总周报信息方式,耗时间耗人力,并且无法实现数以千计的项目周报信息定期的自动更新,项目管理效率低下。网络爬虫技术虽然能实现网页上信息的获取,但无法实现信息的二次处理及智能分析,需结合数据挖掘技术来实现数以千计周报信息的自动获取、智能分析处理、定制化输出及定期更新。针对相关技术中,无法实现周报信息的自动获取、智能分析等二次处理的问题,还未提出有效的解决方案。
技术实现思路
本专利技术提供了一种周报信息处理方法及装置,以至少解决相关技术中无法实现周报信息的自动获取、智能分析等二次处理的问题。根据本专利技术的一个方面,提供了一种周报信息处理方法,包括:从指定网页中获取周报信息;获取指定指令;根据所述指定指令从所述周报信息中筛选出指定周报信息。可选地,从所述指定网页中获取所述周报信息之后包括:将所述周报信息的编码格式转换为指定编码格式;将转换为指定编码格式的所述周报信息进行存储。可选地,获取所述指定指令包括:通过预先配置的所述周报信息的清洗和对比规则获取所述指定指令。可选地,将所述周报信息的编码格式转换为指定编码格式之前包括:采用字节流的方式对所述周报信息进行读取。可选地,从所述指定网页中获取所述周报信息包括:通过HTML工具从所述指定网页中获取所述周报信息。根据本专利技术的另一个方面,还提供了一种周报信息处理装置,所述装置包括:第一获取模块,用于从指定网页中获取周报信息;第二获取模块,用于获取指定指令;处理模块,用于根据所述指定指令从所述周报信息中筛选出指定周报信息。可选地,所述装置还包括:转换模块,用于将所述周报信息的编码格式转换为指定编码格式;存储模块,用于将转换为指定编码格式的所述周报信息进行存储。可选地,所述第二获取模块还用于通过预先配置的所述周报信息的清洗和对比规则获取所述指定指令。可选地,所述装置还包括:读取模块,用于采用字节流的方式对所述周报信息进行读取。可选地,所述第一获取模块还用于通过HTML工具从所述指定网页中获取所述周报信息。通过本专利技术,采用从指定网页中获取周报信息;获取指定指令;根据指定指令从周报信息中筛选出指定周报信息。解决了相关技术中无法实现周报信息的自动获取、智能分析等二次处理的问题,进而实现了网页上海量项目周报相关数据的自动采集、智能分析,达到了满足用户可定制需求。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的周报信息处理方法的流程图;图2是根据本专利技术实施例的周报信息处理装置的结构框图;图3是根据本专利技术实施例的周报信息处理装置的结构框图(一);图4是根据本专利技术实施例的周报信息处理装置的结构框图(二);图5是根据本专利技术实施例的可定制的项目管理周报自动获取流程图。具体实施方式下文中将参考附图并结合实施例来详细说明本专利技术。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。在本实施例中提供了一种周报信息处理方法,图1是根据本专利技术实施例的周报信息处理方法的流程图,如图1所示,该流程包括如下步骤:步骤S102,从指定网页中获取周报信息;步骤S104,获取指定指令;步骤S106,根据指定指令从周报信息中筛选出指定周报信息。通过上述步骤,首先从指定网页中获取周报相关信息,然后根据用户输入的指定指令从获取到的上述周报相关信息中筛选出用户需求的指定周报信息,相比于相关技术中,需要人工定期汇总、更新项目周报,解决了相关技术中无法实现周报信息的自动获取、智能分析等二次处理的问题,进而实现了网页上海量项目周报相关数据的自动采集、智能分析,达到了满足用户可定制需求。在从指定网页中获取周报信息之后,在一个可选实施例中,将上述周报信息的编码格式转换为指定编码格式,将转换为指定编码格式的周报信息进行存储。进一步地,从转换为指定编码格式的周报信息中筛选出上述的指定周报信息。上述步骤S104中涉及到获取指定指令,需要说明的是,可以通过多种方式获取上述的指定指令,下面对此进行举例说明。在一个可选实施例中,通过预先配置的上述周报信息的清洗和对比规则获取上述指定指令。其中,清洗和对比规则是描述周报信息字段的字段类型是否符合定义,字段取值是否符合定义,可否有值,数据是否一致等。在一个可选实施例中,将上述周报信息的编码格式转换为指定编码格式之前,采用字节流的方式对周报信息进行读取。上述步骤S102中涉及到从上述指定网页中获取上述周报信息,需要说明的是,可以通过多种方式从指定网页中获取上述周报信息,下面对此进行举例说明。在一个可选实施例中,通过HTML工具从指定网页中获取上述周报信息。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本专利技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本专利技术各个实施例上述的方法。在本实施例中还提供了一种周报信息处理装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。图2是根据本专利技术实施例的周报信息处理装置的结构框图,如图2所示,该装置包括:第一获取模块22,用于从指定网页中获取周报信息;第二获取模块24,用于获取指定指令;处理模块26,用于本文档来自技高网
...
周报信息处理方法及装置

【技术保护点】
一种周报信息处理方法,其特征在于,包括:从指定网页中获取周报信息;获取指定指令;根据所述指定指令从所述周报信息中筛选出指定周报信息。

【技术特征摘要】
1.一种周报信息处理方法,其特征在于,包括:从指定网页中获取周报信息;获取指定指令;根据所述指定指令从所述周报信息中筛选出指定周报信息。2.根据权利要求1所述的方法,其特征在于,从所述指定网页中获取所述周报信息之后包括:将所述周报信息的编码格式转换为指定编码格式;将转换为指定编码格式的所述周报信息进行存储。3.根据权利要求1所述的方法,其特征在于,获取所述指定指令包括:通过预先配置的所述周报信息的清洗和对比规则获取所述指定指令。4.根据权利要求2所述的方法,其特征在于,将所述周报信息的编码格式转换为指定编码格式之前包括:采用字节流的方式对所述周报信息进行读取。5.根据权利要求1至4中任一项所述的方法,其特征在于,从所述指定网页中获取所述周报信息包括:通过HTML工具从所述指定网页中获取所述周报信息。6.一种周报...

【专利技术属性】
技术研发人员:胡媛
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1