当前位置:首页 > 数据挖掘 > 正文

数据挖掘的一般步骤是

4、建立模型 建立模型,指选择和使用各种建模技术,并对其参数进行调优。 一般地,相同数据挖掘问题类型会有几种技术手段。 某些技术对于数据形式有特殊规定,这通常需要重新返回到数据准备阶段。

数据输入:输入要发掘的数据。 数据转化:做数据预处理的步骤,经过了数据转化之后,数据就是一个可用的,简练的、完整的、一致的、精确的数据集。 (1)数据清理:对噪声数据和不一致的数据做铲除操作。 或者是对重复数据做删除,或者是对缺失数据做填充(众数、中位数、自己判断)。

(1)信息收集:根据确定的数据分析对象抽象出在数据分析中所需要的特征信息,然后选择合适的信息收集方法,将收集到的信息存入数据库。 对于海量数据,选择一个合适的数据存储和管理的数据仓库是至关重要的。