一种数据挖掘分析方法技术

技术编号:40220104 阅读:30 留言:0更新日期:2024-02-02 22:26
本发明专利技术提供一种数据挖掘分析方法,涉及数据挖掘技术领域。该种数据挖掘分析方法,包括:步骤1:获取用户搜索需求,来对所述用户搜索需求进行第一需求词提取,并与预设数据库进行第一匹配,来获取得到每个第一需求词的第一搜索资源库;步骤2:对所述步骤1中的原始数据进行处理,包括去除重复数据、处理缺失值、处理异常值等,以确保数据质量;步骤3:将所述步骤2中来自不同来源的数据整合在一起,以便进行综合分析和挖掘。通过对数据集中存在大量缺失值、异常值等问题,进行处理,可减少异常值和缺失值对数据分析产生不必要的干扰和误导,从而影响模型的准确性,提高模型的稳定性和可靠性。

【技术实现步骤摘要】

本专利技术涉及数据挖掘,具体为一种数据挖掘分析方法


技术介绍

1、数据挖掘是指通过应用统计学和机器学习等技术,从大规模数据中自动发现模式、关联和隐藏信息的过程,可以帮助企业和组织深入了解客户需求、市场趋势和竞争对手行为等商业信息,通过分析大数据,企业可以制定更准确的营销策略、优化产品设计、提升客户满意度,从而获得竞争优势,并且,通过挖掘历史数据中的模式和规律,可以对未来的趋势进行预测,从而帮助企业和政府做出更明智的决策,还可以通过数据挖掘技术,分析社交媒体数据、网络日志、交通数据等,了解人群行为、社会趋势和事件关联,对于社会管理、公共安全和反恐等方面具有重要意义,帮助相关部门及时发现异常情况并采取相应措施,此外,数据挖掘还可以应用于公共卫生管理、流行病预测等领域,提高健康和医疗服务的质量和效率。

2、现有的,数据挖掘分析方法在面对数据集中存在大量缺失值、异常值等问题时,缺失值会对数据挖掘过程产生影响,因为算法通常无法处理缺失值,常见的处理方式包括删除带有缺失值的样本或特征、使用均值或中值填充缺失值等,然而,这些方法都可能引入偏差或丢失重要信息本文档来自技高网...

【技术保护点】

1.一种数据挖掘分析方法,其特征在于,包括:

2.根据权利要求1所述的一种数据挖掘分析方法,其特征在于:获取用户搜索需求,来对所述用户搜索需求进行第一需求词提取,包括:

3.根据权利要求1所述的一种数据挖掘分析方法,其特征在于:所述步骤2中通过删除包含缺失值的行或列、用均值、中位数或众数等基础统计量填补缺失值和使用插值法、回归分析等高级技术填充缺失值;

4.根据权利要求1所述的一种数据挖掘分析方法,其特征在于:所述步骤3中通过将来自同一对象的不同属性或特征整合在一起,形成宽表格或高表格,通过标识符或关键信息来匹配不同数据源中的记录或实体,并将它们整合在...

【技术特征摘要】

1.一种数据挖掘分析方法,其特征在于,包括:

2.根据权利要求1所述的一种数据挖掘分析方法,其特征在于:获取用户搜索需求,来对所述用户搜索需求进行第一需求词提取,包括:

3.根据权利要求1所述的一种数据挖掘分析方法,其特征在于:所述步骤2中通过删除包含缺失值的行或列、用均值、中位数或众数等基础统计量填补缺失值和使用插值法、回归分析等高级技术填充缺失值;

4.根据权利要求1所述的一种数据挖掘分析方法,其特征在于:所述步骤3中通过将来自同一对象的不同属性或特征整合在一起,形成宽表格或高表格,通过标识符或关键信息来匹配不同数据源中的记录或实体,并将它们整合在一起,对象匹配需要依据业务和数据需求来确定匹配规则,并使用相应的技术进行处理。

5.根据权利要求1所述的一种数据挖掘分析方法,其特征在于:所述步骤4中使用直方图、柱状图、箱线图等方式对数值...

【专利技术属性】
技术研发人员:刘永利苏金平
申请(专利权)人:上海禾亘科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1