This application discloses a structured processing method and device for network data. Among them, the method includes: obtaining the first network data, in which the first network data is semi-structured or unstructured network data; displaying the first network data and the second network data, in which the second network data is structured network data automatically from the first network data; receiving user operation instructions, in which user operation instructions refer to pairs of structured network data. The first network data and/or the second network data are manipulated to obtain instructions for the third network data, and the third network data is displayed, where the third network data is structured data that meets the requirements according to the user's operation instructions. This application achieves the technical effect of structured processing of unstructured network data and/or semi-structured network data combined with automatic identification and manual operation.
【技术实现步骤摘要】
网络数据的结构化处理方法和装置
本申请涉及数据处理领域,具体而言,涉及一种网络数据的结构化处理方法和装置。
技术介绍
随着网络技术的大力发展,通过网络获取数据已成为当前人们获取信息资源的重要途径,也为基于海量数据进行数据挖掘、分析和处理处理提供了基础。然而,目前网络中充斥着大量的半结构化或非结构化数据,这些数据都需要进行结构化处理之后才能使用。在现有的技术方案中,通常基于一种算法对半结构化或非结构化数据进行自动识别,将其处理为结构化数据,或者通过人工点击选择操作对半结构化或非结构化数据进行自动识别,由于网络数据的多样性,基于算法的自动识别方法准确率不足,而人工点击选择操作由于过于依赖人工操作无法实现自动化的处理过程导致效率过低。针对上述网络数据从半结构化或非结构化到结构化处理的过程中,自动化识别处理准确率不足和人工点击选择操作效率低下的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种网络数据的结构化处理方法和装置,以至少解决网络数据从半结构化或非结构化到结构化处理的过程中,自动化识别处理准确率不足和人工点击选择操作效率低下的技术问题。根据本申请实施例的一个方面,提供了一种网络数据的结构化处理方法,包括:获取第一网络数据,其中,第一网络数据为半结构化或非结构化网络数据;展示第一网络数据和第二网络数据,其中,第二网络数据是自动对第一网络数据进行结构化处理得到的结构化网络数据;接收用户操作指令,其中,用户操作指令是指对第一网络数据和/或第二网络数据进行操作以得到第三网络数据的指令;展示第三网络数据,其中,第三网络数据为根据用户操作指令得到的符 ...
【技术保护点】
1.一种网络数据的结构化处理方法,其特征在于,包括:获取第一网络数据,其中,所述第一网络数据为半结构化或非结构化网络数据;展示所述第一网络数据和第二网络数据,其中,所述第二网络数据是自动对所述第一网络数据进行结构化处理得到的结构化网络数据;接收用户操作指令,其中,所述用户操作指令是指对所述第一网络数据和/或所述第二网络数据进行操作以得到第三网络数据的指令;展示所述第三网络数据,其中,所述第三网络数据为根据所述用户操作指令得到的符合条件的结构化数据。
【技术特征摘要】
1.一种网络数据的结构化处理方法,其特征在于,包括:获取第一网络数据,其中,所述第一网络数据为半结构化或非结构化网络数据;展示所述第一网络数据和第二网络数据,其中,所述第二网络数据是自动对所述第一网络数据进行结构化处理得到的结构化网络数据;接收用户操作指令,其中,所述用户操作指令是指对所述第一网络数据和/或所述第二网络数据进行操作以得到第三网络数据的指令;展示所述第三网络数据,其中,所述第三网络数据为根据所述用户操作指令得到的符合条件的结构化数据。2.根据权利要求1所述的方法,其特征在于,接收用户操作指令,包括如下任意之一:接收删除指令,其中,所述删除指令用于删除所述第二网络数据中的一个或多个字段;接收编辑指令,其中,所述编辑指令用于编辑所述第二网络数据中的一个或多个字段;接收添加指令,其中,所述添加指令用于向所述第二网络数据中添加一个或多个字段。3.根据权利要求2所述的方法,其特征在于,在接收添加指令之后,所述方法还包括:接收点击指令,其中,所述点击指令为点击所述第一网络数据中一个或多个数据元素的指令;根据所述点击指令所点击的数据元素,在所述第二网络数据中添加新的字段;对第一网络数据中所点击的数据元素对应的数据进行结构化处理并同步到新添加的字段中,更新第二网络数据得到第三网络数据。4.根据权利要求1所述的方法,其特征在于,获取第一网络数据,包括:接收所述第一网络数据的地址信息;根据所述地址信息,获取所述第一网络数据。5.根据权利要求1所述的方法,其特征在于,在基于所述操作指令,展示第三网络数据之后,所述方法还包括:接收数据导出指令,其中,所述数据导出指令用于将所述第三网络数据导出到预定格式的文件中;根据所述数据导出指令,导出所述第三网络数据。6.根据权利要求1至5中任意一项所述的方法,其特征在于,所述网络数据包括如下至少之一:网页数据、...
【专利技术属性】
技术研发人员:吴桐,师敬超,刘钱飞,
申请(专利权)人:杭州快忆科技有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。