当前位置:首页 > 数据分析 > 正文

数据分析公式一览表


基本统计量
平均值 (μ):数据的总和除以数据量
中位数 (M):数据按升序排列后处于中间位置的值
众数 (Md):出现频率最高的某个数据值
标准差 (σ):衡量数据离散程度的度量
方差 (σ^2):标准差的平方
频率分布
相对频率 (f):数据值出现次数除以数据总和
累积相对频率 (F):小于或等于给定数据值的相对频率之和
频率直方图:按数据值范围显示频率的图表
概率分布
正态分布:以钟形曲线表示的分布
二项分布:描述独立试验中成功次数的分布
泊松分布:描述给定时间间隔内事件发生的分布
假设检验
p 值:衡量零假设为真与统计显著性之间的关系
t 检验:比较两个独立样本的平均值
ANOVA:比较多个独立样本的平均值
卡方检验:比较实际观测值与预期观测值之间的差异
回归分析
线性回归模型:y = mx + b
相关系数 (r):衡量两个变量之间线性关系的度量
R 平方 (R^2):衡量回归模型拟合数据程度的度量
预测
预测区间:给定置信度,预测值可能落入的范围
预测误差:实际值与预测值之间的差值
其他常用公式
几何平均值:n 个数的 nth 根
调和平均值:n 个数的倒数平均值
协方差:衡量两个变量之间线性关系的度量
皮尔逊相关系数:衡量两个变量之间线性关系的度量
斯皮尔曼等级相关系数:衡量两个变量之间单调关系的度量
请注意,这些公式仅供参考,具体的公式选择和应用可能因具体数据分析问题而异。