统计学常见概念及解析大纲

才智馆 人气:2.42W

统计学常见概念有哪些你知道吗?下面是本站小编为大家带来的统计学常见概念及解析。欢迎阅读。

统计学常见概念及解析大纲

 (1)自由度 d.f.

统计学上的自由度是指当以样本的统计量来估计总体的参数时, 样本中独立或能自由变化的自变量的个数,称为该统计量的自由度。 统计学上的自由度包括两方面的内容:

首先,在估计总体的平均数时,由于样本中的 n 个数都是相互独立的,从其中抽出任何一个数都不影响其他数据,所以其自由度为n。

在估计总体的方差时,使用的是离差平方和。只要n-1个数的离差平方和确定了,方差也就确定了;因为在均值确定后,如果知道了其中n-1个数的值,第n个数的值也就确定了。这里,均值就相当于一个限制条件,由于加了这个限制条件,估计总体方差的自由度为n-1。

例如,有一个有4个数据(n=4)的样本,其平均值m等于5,即受到m=5的条件限制,在自由确定4、2、5三个数据后, 第四个数据只能是9,否则m≠5。因而这里的自由度υ=n-1=4-1=3。推而广之,任何统计量的自由度υ=n-k(k为限制条件的个数)。

其次,统计模型的自由度等于可自由取值的自变量的个数。如在回归方程中,如果共有p个参数需要估计,则其中包括了p-1个自变量(与截距对应的自变量是常量1)。因此该回归方程的自由度为p-1。

(2)偏相

Partial correlation coefficient

在多元回归分析中,在消除其他变量影响的条件下,所计算的某两变量之间的相关系数。

在多元相关分析中,简单相关系数可能不能够真实的反映出变量X和Y之间的相关性,因为变量之间的关系很复杂,它们可能受到不止一个变量的影响。这个时候偏相关系数是一个更好的选择。

假设我们需要计算X和Y之间的相关性,Z代表其他所有的变量,X和Y的偏相关系数可以认为是X和Z线性回归得到的残差Rx与Y和Z线性回归得到的残差Ry之间的简单相关系数,即pearson相关系数。

(3)标准回归系数

标准回归系数,是指消除了因变量y和自变量x1,x2,…xn所取单位的.影响之后的回归系数,其绝对值的大小直接反映了xi对y的影响程度。

(4)Wald 检验

Wald 统计量我们先对无约束模型得到参数的估计值,再代入约束条件检查约束条件是否成立;

wald 检验一般适用于检验非线性的约束条件(当然也可以检验线性的约束条件),通过对原方程(无约束模型)进行估计,构造出检验统计量,该统计量在大样本下服从卡方分布,自由度为约束条件。

wald检验的思想是:如果约束是有效的,那么在没有约束情况下估计出来的估计量应该渐进地满足约束条件,因为MLE(极大似然估计)是一致的。

 (5)显著水平

显著性水平是估计总体参数落在某一区间内,可能犯错误的概率为显著性水平,用α表示。显著性是对差异的程度而言的,程度不同说明引起变动的原因也有不同:一类是条件差异,一类是随机差异。它是在进行假设检验时事先确定一个可允许的作为判断界限的小概率标准。