一种数据分析方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40512016 阅读:17 留言:0更新日期:2024-03-01 13:27
本申请涉及一种数据分析方法、装置、电子设备及存储介质,涉及数据处理的领域,该方法包括根据设置的关键词进行检索,得到多个待选网站,提取每个待选网站中的文本信息,每个文本信息中记载有关键词,确定每个文本信息的质量分,并基于质量分确定目标文本信息,质量分表征待选段落与关键词的相关程度,基于目标文本信息以及每个目标文本信息对应的待选网站生成数据报告。本申请具有减少数据检索结果中的无用数据的效果。

【技术实现步骤摘要】

本申请涉及数据处理的领域,尤其是涉及一种数据分析方法、装置、电子设备及存储介质


技术介绍

1、在行业调研、市场大数据检索等领域,通常需要在互联网上检索海量数据,然后将海量数据进行整合过滤得到所需数据。目前通常通过在搜索引擎中输入相关关键词进行检索,然后保留记载有关键词的数据,从而得到所需数据,但得到的数据中仍存在大量无用数据,影响并干扰后续对所需数据的使用分析,从而降低最终的检索效果。


技术实现思路

1、为了尽可能地减少数据检索结果中的无用数据,本申请提供一种数据分析方法、装置、电子设备及存储介质。

2、第一方面,本申请提供一种数据分析方法,采用如下的技术方案:

3、一种数据分析方法,包括:

4、根据设置的关键词进行检索,得到多个待选网站;

5、提取每个待选网站中的文本信息,每个文本信息中记载有所述关键词;

6、确定每个文本信息的质量分,并基于所述质量分确定目标文本信息,所述质量分表征待选段落与所述关键词的相关程度;

>7、基于所述目标文本文档来自技高网...

【技术保护点】

1.一种数据分析方法,其特征在于,包括:

2.根据权利要求1所述的一种数据分析方法,其特征在于,所述确定每个文本信息的质量分,并基于所述质量分确定目标文本信息,包括:

3.根据权利要求1所述的一种数据分析方法,其特征在于,每个目标文本信息包括多个段落,所述基于所述目标文本信息以及每个目标文本信息对应的待选网站生成数据报告,包括:

4.根据权利要求1所述的一种数据分析方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的一种数据分析方法,其特征在于,所述对所述数据报告进行更新,之后还包括:

6.根据权利要求3所述的一种数据分...

【技术特征摘要】

1.一种数据分析方法,其特征在于,包括:

2.根据权利要求1所述的一种数据分析方法,其特征在于,所述确定每个文本信息的质量分,并基于所述质量分确定目标文本信息,包括:

3.根据权利要求1所述的一种数据分析方法,其特征在于,每个目标文本信息包括多个段落,所述基于所述目标文本信息以及每个目标文本信息对应的待选网站生成数据报告,包括:

4.根据权利要求1所述的一种数据分析方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的一种数据分析方法,其特征在于,所述...

【专利技术属性】
技术研发人员:隗伟齐成斌
申请(专利权)人:北京瑞索咨询股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1