首页 / 数据分析技术 / 第5章 统计推断基础

第5章 统计推断基础

 

知识点5.1:总体与样本

总体:研究对象的全体。样本:从总体中抽取的一部分。

现实中很难调查总体,通常用样本统计量来估计总体参数。

知识点5.2:中心极限定理

不管总体是什么分布,只要样本量足够大(通常n >= 30),样本均值的分布就接近正态分布。

知识点5.3:置信区间

置信区间表示"总体参数大概落在什么范围"。

记忆口诀

置信度越高,区间越宽;样本量越大,区间越窄。

知识点5.4:假设检验基本思想

  • 原假设H0:默认成立的假设("被告无罪")
  • 备择假设H1:想要证明的假设("被告有罪")
  • P值:在原假设成立时观察到当前结果的概率
  • 判断规则:P值 < alpha(通常0.05),则拒绝原假设
一句话总结

P值越小,越有理由拒绝原假设。

知识点5.5:Excel假设检验实操

数据→数据分析→t检验:双样本等方差假设→选择数据区域→确定。

关注"P(T<=t)双尾",若<0.05则两组均值有显著差异。

配套自学素材

  • 免费教程:B站"统计学简史"假设检验专题
  • 数据集:Kaggle "A/B测试数据集"
  • 工具:Excel数据分析工具包
  • 阅读材料:《统计学关我什么事》(小岛宽之)漫画版
交互式练习
0/5
第1题 选择题
在假设检验中,当P值小于显著性水平alpha时,我们?
A. 接受原假设
B. 拒绝原假设
C. 无法判断
D. 重新抽样
解析
P值<alpha说明有理由拒绝原假设。
第2题 选择题
95%置信区间意味着?
A. 总体参数有95%概率落在区间
B. 重复抽样95次约95次包含总体参数
C. 样本均值95%概率等于总体均值
D. 以上都不对
解析
95%置信区间的正确含义是重复抽样中约有95次包含总体参数。
第3题 选择题
假设检验中,P值表示?
A. 原假设为真的概率
B. 备择假设为真的概率
C. 在原假设成立时观察到当前结果的概率
D. 犯第一类错误的概率
解析
P值是在原假设成立的前提下,观察到当前结果或更极端结果的概率。
第4题 判断题
置信区间越宽,估计的精确度越高。( )
正确
错误
解析
错误。置信区间越宽,精确度越低。
第5题 判断题
某A/B测试中P值=0.03,在alpha=0.05下应拒绝原假设。( )
正确
错误
解析
正确。0.03 < 0.05,应拒绝原假设。
0/5
← 上一章:第4章 下一章:第6章 →