spss参数估计


一个总体均值的估计

总体均值在一定置信水平下的置信区间一般表示为: $ \overline x\pm(分位数\times\overline x的标准误差) $

大样本的估计

在样本量n>30时为大样本,这时总体均值在一定置信水平下的置信区间一般表示为:

  • 当样本标准差σ已知时为:$\overline x \pm z_{α/2}\frac{\sigma}{\sqrt n}$
  • 当样本标准差σ未知时为:$\overline x \pm z_{α/2}\frac{s}{\sqrt n}$

小样本的估计

在样本量n<30时为小样本,这时总体均值在一定置信水平下的置信区间一般表示为:

  • 当样本标准差σ已知时为:$\overline x \pm z_{α/2}\frac{\sigma}{\sqrt n}$
  • 当样本标准差σ未知时,此时样本均值服从自由度为n-1的t分布,此时为:$\overline x \pm t_{α/2}\frac{s}{\sqrt n}$

两个总体均值的估计

总体均值在一定置信水平下的置信区间一般表示为: $ (\overline x_1-\overline x_2)\pm(分位数\times(\overline x_1-\overline x_2)的标准误差) $

  1. 独立大样本的估计
    • 如果两个样本是从两个总体中抽取的,即一个样本的元素与另一个样本中的元素相互独立则称为独立样本
    • 当两个总体的方差都已知时在1-α置信水平下的置信区间为:$(\overline x_1-\overline x_2) \pm z_{α/2}\sqrt{\frac{\sigma_1^2} {\sqrt n}+\frac{\sigma_2^2} {\sqrt n} }$
    • 当两个总体的方差都已知时在1-α置信水平下的置信区间为:$(\overline x_1-\overline x_2) \pm z_{α/2}\sqrt{\frac{s_1^2} {\sqrt n}+\frac{s_2^2} {\sqrt n} }$
  2. 独立小样本的估计

    • 当两个总体方差未知但相等时:$(\overline x_1-\overline x_2)\pm t_{α/2}(n_1+n_2-2)\sqrt{s_p^2(\frac{1} {n_1}+\frac{1} {n_2})}$
    • 当两个总体方差未知且不相等时:$(\overline x_1-\overline x_2)\pm t_{α/2}(v)\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}$其中$v=\frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2}{\frac{(s_1^2/n_1)^2} {n_1-1}+\frac{(s_2^2/n_2)^2} {n_2-1}}$
  3. 配对样本的估计
    • 一个样本的中的数据与另一个样本的对应,如让同一组人使用两种方法组装产品,两种方法的组装时间数据就是配对数据
    • 在大样本时两个总体均值之差$u_d=u_1-u_2$在1-α置信水平下的置信区间为:$\overline d\pm z_{α/2} \frac{\sigma_d} {\sqrt n}$
    • 在小样本时假定两个总体的各观察值服从正态分布,此时在1-α置信水平下的置信区间为:$\overline d\pm t_{α/2}(n-1) \frac{s_d} {\sqrt n}$

一个总体比例的估计

推断总体比例时,当样本量非常大时,可采用传统的估计方法,对于中小样本,改进的方法更适用

  1. 大样本的估计方法(传统方法)
    • $\pi在1-α水平下的$置信区间一般表示为:$p\pm(分为数值\times p的标准误差)$
    • 适用于大样本的传统方法给出的总体比例$\pi在1-α水平下的置信区间为:p\pm z_{α/2}\sqrt \frac{p(1-p)} {n}$
    • $z_{α/2}$是标准正态分布两侧两侧面积各为α/2时的z值$ z_{α/2}\sqrt \frac{p(1-p)} {n}$是估计误差
  2. 大样本的估计方法(改进方法)
    • 对于任意样本,将试验次数(样本量)n加上4,即用$\widetilde{n}=n+4$将试验成功的次数加上2即用$\widetilde{p}=(x+2)/\widetilde{n}$代替p此时$\pi在1-α水平下的置信区间为:\widetilde{p} \pm z_{α/2}\sqrt \frac{\widetilde{p}(1-\widetilde{p})} {\widetilde{n} }$

两个总体比例的估计

  1. 两个总体比例之差的估计(传统方法)
    • $\pi在1-α水平下的$置信区间一般表示为:$(p_1-p_2)\pm(分为数值\times (p_1-p_2)的标准误差)$
    • $(\pi_1-\pi_2)$在1-α置信水平下的置信区间为:$(p_1-p_2)\pm z_{α/2}\sqrt {\frac{p_1(1-p_1)} {n_1}+\frac{p_2(1-p_2)} {n_2} }$
  2. 两个总体比例之差的估计(改进方法)
    • 将试验次数(样本量)$n_1和n_2个加上2,即用\widetilde n_1=n_1+2代替n_1,\widetilde n_2=n_2+2代替n_2$将试验成功次数$x_1和x_2各加上1即用\widetilde p_1=(x_1+1)/\widetilde n_1,代替p1,\widetilde p_2=(x_2+1)/\widetilde n_2,代替p2$,这里的实验成功次数是指满足条件个体个数比如看某种电视的男士有200个这里的男士个数就是试验成功次数

一个总体方差的估计

估计总体方差时,首先假定服从正态分布,其原理与总体均值和总体比例的区间估计不同,不再是点估计加减估计误差。这是因为样本方差的抽样分布服从自由度为(n-1)$\chi^2分布,所以用\chi^2分布构造总体方差的置信区间。\chi^2分布式不对称分布,所以无法向样本均值那样构造置信区间$

总体方差$\sigma^2在1-α的置信水平下的置信区间为:\frac {(n-1)s^2} {\chi^2_{1-α/2}}\le\sigma^2\le\frac {(n-1)s^2} {\chi^2_{α/2}}$

两个总体方差比的估计

总体方差的估计服从f分布

两个总体方差比在1-α置信水平下的置信区间为:$\frac{s_1^2/s_2^2} {F_{1-α/2}}\le\frac{\sigma_1^2} {\sigma_2^2}\le \frac{s_1^2/s_2^2} {F_{α/2}}$

样本量的确定

估计总体均值时的样本量的确定

  1. 估计一个总体均值时样本量的确定时导出所需样本量的计算公式如下:$n=\frac{(z_{α/2})^2}{E^2}$这里的E是指使用者在给定的置信水平下可以接受的估计误差
  2. 估计两个总体均值之差时,对于给定的估计误差和置信水平1-α,估计两个总体均值之差所需的样本量是:$n_1=n_2=\frac{(z_{α/2})^2\cdot(\sigma_1^2+\sigma_2^2)}{E^2}$

估计总体比例时样本量的确定

  1. 估计一个总体比例时样本量时计算公式如下:$n=\frac{(z_{α/2})^2\cdot\pi(1-\pi)} {E^2}$E由使用者事先确定,一般E不超过0.1$如\pi的值已知就可用上面的公式计算,若\pi未知则可以用类似的样本比例代替,也可以用实验调查的方法若\pi不可知时取\pi=0.5$
  2. 估计两个总体比例时样本量时公式如下:$n_1=n_2=\frac{(z_{α/2})^2\cdot[\pi_1(1-\pi_1)+\pi_2(1-\pi_2)]} {E^2}$

个人总结

在做题时先判断是大样本还是小样本,若是大样本是正态分布,若是小样本看$\sigma$是否已知,若已知则还是正态分布,若是小样本根据公式做在做总体均值是t分布

总体方差未知时用样本方差代替总体方差,总体比例也是这样,熟练记忆理解上述公式,遇到问题认真分析。


文章作者: 澣云
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 澣云 !
  目录