信息采集方法、装置、电子设备及存储介质制造方法及图纸

技术编号:46084103 阅读:4 留言:0更新日期:2025-08-12 18:06
本申请实施例公开了一种信息采集方法、装置、电子设备及存储介质。所述方法包括:获取待采集页面的格式信息;从规则引擎中获取与所述待采集页面的格式信息对应的至少一种信息采集规则;基于所述至少一种信息采集规则,获取所述待采集页面的页面信息。通过上述方法,通过待采集页面的格式信息可以精确获取待采集页面对应的至少一种信息采集规则,进而可以对待采集页面的页面信息进行全面采集。

【技术实现步骤摘要】

本申请属于信息采集,具体涉及一种信息采集方法、装置、电子设备及存储介质


技术介绍

1、随着移动智能设备(如智能手机、平板电脑等)的日益普及,出现了越来越多的移动终端应用,简称为移动应用app(应用程序,application)。移动应用的页面信息是一种重要数据,很多处理需要获取页面信息,如国际化电商app要基于页面内容来检测页面中是否有未翻译的内容等。但相关技术中,在对页面信息进行采集时,无法对页面信息进行全面的提取。


技术实现思路

1、鉴于上述问题,本申请提出了一种信息采集方法、装置、电子设备以及存储介质,以实现改善上述问题。

2、第一方面,本申请实施例提供了一种信息采集方法,所述方法包括:获取待采集页面的格式信息;从规则引擎中获取与所述待采集页面的格式信息对应的至少一种信息采集规则;基于所述至少一种信息采集规则,获取所述待采集页面的页面信息。

3、第二方面,本申请实施例提供了一种信息采集装置,所述装置包括:格式获取单元,用于获取待采集页面的格式信息;规则获取单元,用于从规则引擎中本文档来自技高网...

【技术保护点】

1.一种信息采集方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,获取待采集页面的格式信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述页面标识,从规则引擎中获取所述待采集页面对应的至少一种信息采集规则,包括:

4.根据权利要求1所述的方法,其特征在于,所述获取待采集页面的格式信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述获取待采集页面的格式信息,包括:

6.根据权利要求1所述的方法,其特征在于,所述基于所述至少一种信息采集规则,获取所述待采集页面的页面信息之后还包括:<...

【技术特征摘要】

1.一种信息采集方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,获取待采集页面的格式信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述页面标识,从规则引擎中获取所述待采集页面对应的至少一种信息采集规则,包括:

4.根据权利要求1所述的方法,其特征在于,所述获取待采集页面的格式信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述获取待采集页面的格式信息,包括:

6.根据权利要求1所述的方法,其特征在于,所述基于所述至少一种信息采集规则,获取所述待采集页面的页面信息之后还包括:

7.根据权利要求6所述的方法,其特征在于,所述基于所述页面信息,生成桌面卡片,包括:

8.根据权利要求7所述的方法,其特征在于,所述方法还包括:

9.根据权利要求1-8任一所述的方法,其特征在于,所述规则引擎中至少包括文本采集规则、图片采集规则、文件路径采集规则、自渲染控件采集规则、ocr采集规则、云爬虫采集规则、页面链接采集规则以及大图路径采集规则;其中,所述文本采集规则用于获取所述待采集页面的文本信息;所述图片采集规则用于获取所述待采集页面...

【专利技术属性】
技术研发人员:魏曦李轩恺王冰杰刘剑王剑锋
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1