当前位置:首页 > 数据挖掘 > 正文

数据挖掘的五个主要任务

1、描述性数据挖掘


— 频率分析:计算数据集中每个值的频率,以了解数据的分布情况。
— 集中趋势:计算数据集中数据的平均值、中位数和众数,以了解数据的集中趋势。
— 分散趋势:计算数据集中数据的标准差、方差和四分位数范围,以了解数据的分散程度。
— 相关性分析:计算数据集中不同变量之间的相关系数,以了解变量之间的关系强度和方向。

2、诊断性数据挖掘


— 数据探索:使用数据可视化和统计方法,探索数据中的模式和关系。
— 异常值检测:识别数据集中与其他数据点显著不同的数据点。
— 关联分析:发现数据集中频繁出现的项集,并计算它们之间的关联强度。
— 序列分析:发现数据集中按时间顺序出现的事件序列,并计算它们之间的关联强度。

3、预测性数据挖掘


— 分类:根据数据集中现有数据,预测新数据点的类别。
— 回归:根据数据集中现有数据,预测新数据点的数值。
— 时间序列预测:根据数据集中现有数据,预测未来时间点的数据值。

4、处方性数据挖掘


— 推荐系统:根据用户过去的行为数据,推荐用户可能感兴趣的产品或服务。
— 决策支持系统:帮助决策者分析数据,并做出更明智的决策。
— 优化:根据数据集中现有数据,找到最优的解决方案。

5、评估性数据挖掘


— 模型评估:使用各种指标评估数据挖掘模型的性能。
— 模型选择:从多个数据挖掘模型中选择最优的模型。
— 模型解释:解释数据挖掘模型的内部机制,并使其更易于理解和使用。