一种数据处理方法及装置制造方法及图纸

技术编号:12178929 阅读:57 留言:0更新日期:2015-10-08 17:05
本发明专利技术的实施方式提供了一种数据处理方法。该方法包括:从数据源读取网页文件;在所述网页文件中进行查找以生成特定数据内容;对所述特定数据内容进行导出。通过先在网页文件中进行查找以生成所需要的特定数据内容,再仅对获得的特定数据内容进行导出,所导出的内容即为处理后的数据内容,本发明专利技术的方法使得无需将数据源中的全部数据内容导出后再进行人工处理,从而显著地提高了数据处理的速度及效率,为用户带来了更好的体验。此外,本发明专利技术的实施方式还提供了一种数据处理装置。

【技术实现步骤摘要】

本专利技术的实施方式涉及数据处理
,更具体地,本专利技术的实施方式涉及一种数据处理方法及装置
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。随着互联网技术的普及,很多用户习惯于使用一些网络服务或网络空间来记录自己的生活、工作等情况,例如用户可以通过博客来记录日常生活。同时,用户有将上传到网络的数据内容(例如文字、图像等)进行导出并编辑排版处理的需求,例如将博客内容集结成书。目前,现有技术中已经出现了一些将网络数据内容进行导出的方案,例如读取某一数据源的地址,将该数据源中保存的全部数据内容进行导出,之后可以采用人工方式对所导出的数据内容进行所需要的处理。
技术实现思路
但是,现有技术的数据处理方式,需要将数据源中的全部数据内容进行导出后,用户再根据实际需求人工对所导出的数据内容进行编辑、筛选、排版等处理,当用户仅需要数据内容中的特定部分,而数据内容的数量又非常多时,则需要花费大量的时间、人力来完成对数据内容的编辑等处理工作,例如,仅需要数据内容中的文字部分,则需要将大量导出的数据内容中的非文字部分进行删除,数据处理过程的速度及效率极为低下。因此在现有技术中将网络数据进行导出后的数据处理过程,是非常令人烦恼的过程。为此,非常需要一种改进的数据处理方案,以使提高数据处理的速度及效率。在本上下文中,本专利技术的实施方式期望提供一种数据处理方法及装置。在本专利技术实施方式的第一方面中,提供了一种数据处理方法,包括:从数据源读取网页文件;在所述网页文件中进行查找以生成特定数据内容;对所述特定数据内容进行导出。在本专利技术实施方式的第二方面中,提供了一种数据处理装置,包括:读取单元,用于从数据源读取网页文件;生成单元,用于在所述网页文件中进行查找以生成特定数据内容;导出单元,用于对所述特定数据内容进行导出。根据本专利技术实施方式的数据处理方法和装置,可以从数据源中读取网页文件,先在网页文件中进行查找以生成所需要的特定数据内容,再仅对获得的特定数据内容进行导出,所导出的内容即为处理后的数据内容,而无需将数据源中的全部数据内容导出后再进行人工处理,从而显著地提高了数据处理的速度及效率,为用户带来了更好的体验。【附图说明】通过参考附图阅读下文的详细描述,本专利技术示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本专利技术的若干实施方式,其中:图1示意性地示出了本专利技术实施方式可以在其中实施的应用场景;图2示意性地示出了根据本专利技术一实施方式的数据处理方法的流程图;图3示意性地示出了根据本专利技术一实施方式的数据处理装置的结构图。在附图中,相同或对应的标号表不相同或对应的部分。【具体实施方式】下面将参考若干示例性实施方式来描述本专利技术的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本专利技术,而并非以任何方式限制本专利技术的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。本领域技术人员知道,本专利技术的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。根据本专利技术的实施方式,提出了一种数据处理的方法及装置。此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。下面参考本专利技术的若干代表性实施方式,详细阐释本专利技术的原理和精神。发曰月概沐本专利技术人发现,在现有技术中可以从网络中的单一数据源获取到网络数据内容并进行导出,针对所导出的网络数据内容可以使用文本编辑软件进行编辑、排版等处理。但是,当需要数据内容中的特定部分,数据内容数量又非常多时,则需要花费大量的时间、人力来完成对数据内容的编辑等处理工作。针对以上问题,本专利技术的基本思想在于:从数据源中读取网页文件,该数据源可以为单一数据源也可以为多个数据源,通过从读取的网页文件中进行查找以生成所需要的特定数据内容,例如,在网页文件中查找文字部分和/或者图片部分以生成所需要的特定数据内容,再仅对获得的特定数据内容进行导出,这样所导出的内容即为用户所需要的处理后的数据内容,而无需将数据源中的全部数据内容导出后再进行人工处理,从而显著地提高了数据处理的速度及效率,为用户带来了更好的体验。在介绍了本专利技术的基本原理之后,下面具体介绍本专利技术的各种非限制性实施方式。应用场景总览首先参考图1,图1是本专利技术的实施方式的一个示例性应用场景的框架示意图。其中,用户通过用户设备上的客户端102与提供数据记录的服务器101进行交互。本领域技术人员可以理解,图1所示的框架示意图仅是本专利技术的实施方式可以在其中得以实现的一个示例。本专利技术实施方式的适用范围不受到该框架任何方面的限制。例如,在另一个示例性应用场景中,提供数据记录的服务也可以是由客户端102自行提供的,用户也可以仅与用户设备上的客户端102进行交互。需要注意的是,此处的用户设备可以是现有的、正在研发的或将来研发的、能够通过任何形式的有线和/或无线连接(例如,W1-Fi, LAN、蜂窝、同轴电缆等)实现其上客户端102与服务器101交互的任何用户设备,包括但不限于:现有的、正在研发的或将来研发的智能手机、非智能手机、平板电脑、膝上型个人计算机、桌面型个人计算机、小型计算机、中型计算机、大型计算机等。还需要注意的是,此处的服务器101仅是现有的、正在研发的或将来研发的、能够向用户提供数据记录服务的设备的一个示例。本专利技术的实施方式在此方面不受任何限制。基于图1所示的框架,客户端102可以从数据源读取网页文件;然后,客户端102在网页文件中进行查找以生成特定数据内容;再后,客户端102可以对特定数据内容进行Q山寸出O可以理解的是,本专利技术的应用场景中,虽然此处和下面将本专利技术实施方式的动作描述为由客户端102执行,但是这些动作也可以部分由客户端102执行、部分由服务器101执行。本专利技术在执行主体方面不受限制,只要执行了本专利技术实施方式所公开的动作即可。示例性方法下面结合图1的应用场景,参考图2来描述根据本专利技术示例性实施方式的用于数据处理的方法。需要注意的是,上述应用场景仅是为了便于理解本专利技术的精神和原理而示出,本专利技术的实施方式在此方面不受任何限制。相反,本专利技术的实施方式可以应用于适用的任何场景。参见图2,示出了本专利技术中数据处理方法一实施例的流程图,例如具体可以包括如下步骤:步骤201:从数据源读取网页文件。数据源可以为网络中的数据源,例如某一用户的博客地址即为一个数据源,所述数据源可以包括单个数据源或者多个不同的数据源,也就是说在本实施例中可以从单一数据源读取网页文件,也可以从多个不同的数据源同时读取网页文件。从多个不同的数据源同时读取网页文件,并进行后续步骤的处理,可以实现对多个不同的数据源内的特定数据内容一并进行导出,进一步提升数据处理的效率。一个数据源可以对应一个或多个网页文件,网页文件可以为HTML(Hyper TextMarkup Language,超级文本标记语言)文件。例如,某一用户博本文档来自技高网...

【技术保护点】
一种数据处理方法,包括:从数据源读取网页文件;在所述网页文件中进行查找以生成特定数据内容;对所述特定数据内容进行导出。

【技术特征摘要】

【专利技术属性】
技术研发人员:张琦刘锋
申请(专利权)人:网易传媒科技北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1