一般将只控制第一类错误的假设检验称为显著性检验。如果 值 ,则我们做出结论“拒绝 ”,并称结果是显著的。
其中, 为标准正态概率分布下侧的面积为 时对应的 值, 为样本容量,绝大多数应用中,样本容量大于等于30时就行;当总体服从正态分布时,适用于任何样本容量;如果总体不是正态分布但至少大致上是对称的,则样本容量需要大于等于15。
法二 用置信区间的方法进行如下形式的假设检验方法
其中, 为自由度 的 分布下侧的面积为 时对应的 值, 为样本容量,绝大多数应用中,样本容量大于等于30时就行;当总体服从正态分布时,适用于任何样本容量;如果总体不是正态分布但至少大致上是对称的,则样本容量需要大于等于15;如果总体不服从正态分布且数据高度偏斜或者含有异常点,则样本容量需要大于等于50。
其中, 为标准正态概率分布下侧的面积为 时对应的 值, 为样本容量,需要 。
当 为假时,做出拒绝 的正确结论的概率称做检验的功效。对于给定的 值,功效为 ,即做出拒绝原假设正确结论的概率等于 1 减去发生第二类错误的概率。 轴为 , 轴为当 为假时做出拒绝 正确结论的概率的曲线为功效曲线。
计算步骤:
其中, 为标准正态分布的上侧面积为 时对应的 值, 为标准正态分布的上侧面积为 时对应的 值, 为总体标准差, 为原假设中样本均值的值, 为第二类错误中所采用的总体均值的值。注意:双侧检验中,需要用 代替 。
令 表示 与 之间假设的差,假设检验的 种形式如下:
其检验统计量为
应用建议:随机样本量需要满足 。如果其中之一或两者的样本容量小于 ,总体的分布需要近似服从正态分布。
当 和 未知时,我们用样本标准差 和 来估计 和 。
其检验统计量为
其中, 统计量的自由度采用如下计算公式
应用建议:如果两个总体的样本容量 和 相等或接近相等,使得总样本容量 至少为 时,即使总体不是正态分布,我们也能期望得到非常好的结果。如果总体分布高度偏斜或含有异常点,则需要较大的样本容量。只有当总体分布近似服从正态分布时才可以使用较小的样本容量。
分析匹配样本时,我们仅考虑数据的差值。运用 分布进行假设检验和区间估计。
假设检验的检验统计量为
其中, 为两样本之差的均值, 为样本标准差, 分布的自由度为 。
假设检验的 种形式如下:
当 时, 的标准误差为
的合并估计量
的检验统计量为
该检验统计量适用于 全都大于或者等于 的大样本情况。
用 表示总体方差的假设值
其中, 表示 分布右侧的面积或概率为 时对应的 值, 分布的自由度为 , 为样本容量,总体的分布为正态分布。
其中,总体 拥有较大的方差。检验统计量服从分子自由度为 和分布自由度为 的 分布, 表示 分布的上侧面积或者概率为 时的值。只有当两个总体至少近似正态分布的假定是合理的情况下才能使用 分布。
针对分类型数据。
对于 个总体,总体比率相等性的 检验的步骤如下: