当前位置:首页 > 数据挖掘 > 正文

数据挖掘主要有哪些内容


I、什么是数据挖掘
1.什么是数据挖掘?
数据挖掘是运用数学、统计学、人工智能和神经网络领域的科学方法,如记忆推理、聚类分析、相关分析、决策树、神经网络、遗传算法等技术隐式地、从大量数据中挖掘出以前未知的对决策具有潜在价值的关系、模式和趋势,并利用这些见解和规则来构建决策支持模型,并为预测性决策支持提供方法、工具和流程。
数据挖掘综合了不同学科的技术,具有多种功能。 事物。 例如,银行部门根据以往的数据将客户分为不同的类别。
(2)分组:识别分析对的内在规则,并根据这些规则将对象分为几类。 例如:将申请人分为高风险申请人、中风险申请人、低风险申请人。
(3)关联规则:关联是当某件事发生时,其他事情也会发生的联系。 例如:每天购买啤酒的人也可能购买香烟。 该百分比可以用协会的支持度和可靠性来描述。
(4)预测:捕捉分析对象的发展规律,预测未来趋势。 例如:判断未来经济发展。
(5)偏差检测:描述分析对象罕见、极端的特殊情况,以发现根本原因。 例如:银行100万笔交易中有500起欺诈案件,银行要想稳定运营,就必须发现这500起案件的内在因素,降低未来运营的风险。
当然,除了上面列出的这些之外,还有时间序列分析等其他功能,需要注意的是,各种数据功能并不是独立存在的,而是相互关联、在数据中发挥作用的。 矿业。