今天有同事问我,我也蒙了一下,他问我们一直说控制图的管制线是均值μ±3σ,但实际中计算管制线时却是按照μ±A2·R(μ、R是均值)来计算的,为什么?有什么差异?
没人问也就算了,平时都随口说正负三个标注差,实际却一直用A2系数计算,习惯了也没感觉有问题了,被人问了,脑子一下好像短路了,只能回过头来好好学习一下,避免下次再出丑。
首先控制图的管制线是μ±3σ没错,但要注意了,在这里σ的含义是“单个观测值与均值(μ)之间的离散程度,反映数据的波动性,且是总体标准差”,但实际SPC管制中,是取n个样本值的平均值,且是样本不是总体的,所以在计算X-bar图时μ±3σ中的σ不是标准差,而是标准误;标准误其反馈了样本均值与总体均值之间的偏差,反映样本均值的波动性;标准差与标准误的关系与样本数量n有关。
如果还没理解,我们举一个实例,动手算以下,加强理解:假设某工厂生产零件,其长度服从均值为μ=100mm、标准差σ=2mm的正态分布。
- 标准差(SD):
描述单个零件的长度波动,约68%的零件长度在[98mm, 102mm]内(μ±1σ)。 - 标准误(SE):
若每次抽取5个零件(n=5)计算平均长度,则均值的波动为0.89mm; - 即约68%的样本均值会落在[99.11mm, 100.89mm]内(μ±1SE)。
理解上面含义后,在回到SPC上来我们就知道为什么管制线没有按照μ±3σ来计算了;至于A2只是函数的引用,因公式输入较麻烦,具体就看参考看题图:
说了这些的意思基本上可以总结几句:SPC中X-R控制图中是均值的波动,所以管制线的范围是正负三个标准误,不是管制线;标准误与标准差的关系与取样数量n有关;总体的标准差是无法测量的,只能通过样本标准差进行计算;A2的引用是为了简化、方便计算。