» 产品设计 » 方法论 » 质量与工程领域必知的 6 项统计测试

质量与工程领域必知的 6 项统计测试

质量和工程统计测试

Statistical tests are the only way in quality and manufacturing to provide objective evidence for decision-making. They help identify variations in processes and distinguish between random fluctuations and actual problems. In engineering, statistics help identify patterns, outliers, and sources of failure in system performance, ensuring data-driven decision-making. By rigorously analyzing experimental results, engineers can validate product designs and manufacturing processes, detecting potential problems before implementation. This systematic approach reduces the risk of unexpected failures and enhances overall safety by ensuring reliability and compliance with international safety standards.

This post will review main statistical tests used in manufacturing and Total Quality Management (TQM).

注:由于也涉及工程、研究和科学,以下 2 项统计测试和分析

  • 相关性分析: 衡量两个变量之间关系的强度和方向(如皮尔逊相关系数)。
  • 回归分析: 从简单的线性回归到多元回归,研究变量(如输入因素和过程输出)之间的关系。

这里不包括这些算法,而是专门介绍工程学的 10 种主要算法。

正态性检验

光线充足的实验室环境,桌上摆放着各种科学仪器--烧杯、移液管和显微镜。中间一块白板展示了假设检验的清晰步骤,并用公式和图表解释了基本原理。背景是一个书架,上面摆满了技术手册和特定行业的文献,传达出严谨的学术氛围和对细节的关注。整体氛围是科学探索和解决问题,重点是质量控制的系统方法。
列出最常用的质量和工程统计测试。

在统计检验领域,许多常用的统计方法(t 检验、方差分析、线性回归等)都假定数据是正态/高斯分布的(或残差/误差是正态的)。违反这一假设会使结果不可靠:P 值可能会误导人,置信区间可能会出错,I/II 类错误的风险也会增加。请注意,有些检验(如单因素方差分析)可以很好地处理非正态分布。

注意:如果您的数据不符合正态性,请参阅下面的实际案例,您可能需要使用非参数检验(如 Mann-Whitney U 检验或 Kruskal-Wallis 检验),这些检验不假定数据符合正态性,或者对数据进行转换,这不在本篇文章的讨论范围之内。

虽然有多种统计检验方法,但在此我们将详细介绍 Shapiro-Wilk 检验方法,该方法尤其适用于小样本量,通常 n < 50,但也可用于多达 2000 个样本。

顺便提一下,其他常见的正态性检验:

    • Kolmogorov-Smirnov (K-S) 检验(带 Lilliefors 校正):样本量较大时效果更好,但灵敏度不如 Shapiro-Wilk,尤其是在小数据集上
    • 安德森-达林检验:适用于所有样本量,对分布的尾部(极值)更敏感,对检测极值偏离正态性更强。

如何进行 Shapiro-Wilk 正态性检验

1.计算或计算 Shapiro-Wilk 检验统计量 (W):

\(W = \frac{\left(\sum_{i=1}^{n} a_i x_{(i)}\right)^2}{\sum_{i=1}^{n} (x_i – \bar{x})^2}\)

Note: as the calculation of the \(a_i\) coefficients is nontrivial and generally requires a table or algorithm, which is why the Shapiro-Wilk test is nearly always computed by software such as R, Python’s SciPy, MS Excel add-ons or other dedicated softwares. 如需手动计算,请参见本页 provides all the \(a_i\) coefficients and p-value for samples up to 50.

W 值介于 0 和 1 之间(W = 1:完全正态性。W<1:离 1 越远,数据越不正常)。

2.W 是不够的。它需要与相应的 p 值结合起来才能得到置信水平。在 Shapiro-Wilk 表中,在 在 n 个样本量的行中,查找与计算出的 W 值最接近的值,并获取其对应的 顶部的 p 值

分子表示加权有序样本值的平方和。

分母是与样本平均数的平方差之和(即样本方差,按 (n-1) 缩放)。

\(x_{(i)}\) = the i-th order statistic (i.e., the i-th smallest value in the sample)

\(x_i\) = the i-th observed value

\(\bar{x}\) = the sample mean

\(a_i\) = constants (weights) calculated from the mean, variances, and covariances of the order statistics of a sample from a standard normal distribution ((N(0,1))), and depend only on n (sample size).

n = 样本数量

3. 结果 如果 p 值大于所选的α水平(例如 0.05),则有统计证据表明所测试的数据是正态分布的。

对于正态性检验,通常建议将数字方法与图形方法(如亨利线、Q-Q 图或直方图)相结合:

心智非正态分布!

虽然正态分布/高斯分布是最常见的情况,但不应自动假定为正态分布/高斯分布。日常的反例有

  • 个人之间的财富和收入分配。它遵循帕累托(幂律)分布,偏斜的 "长尾 "是非常富有的个人。
  • 一个国家的城市人口规模遵循齐普夫定律(幂律),即几个非常大的城市和许多小城镇。
  • 地震的震级和频率呈幂律/古腾堡-里克特分布:小地震常见,大地震罕见。
  • 金融市场的每日价格变化或回报:肥尾/重尾分布,而非高斯分布;大偏差出现的频率高于正态分布的预测。
  • 语言中的词频,正如上述城市人口一样,遵循齐普夫定律(幂律):经常使用的词很少,大多数词都很罕见。
  • 互联网流量/网站受欢迎程度:幂律/长尾:有些网站的点击率高达数百万次,而大多数网站的点击率却很低。
  • 计算机系统上的文件大小:对数正态分布或幂律分布,大文件少,小文件多。
  • Human lifespans/longevity: right-skewed (can model with Weibull or Gompertz distributions), not normal; more people die at older ages.
  • 社交网络连接遵循幂律:少数用户的连接数多,多数用户的连接数少。

其中大多数的特点是 "少大多小",是幂律、重尾、指数或对数正态分布的特征,而不是高斯分布的对称形状。

 

t 检验(学生 t 检验)

t 检验(又称 "学生 t")由威廉-西利-戈塞特(William Sealy Gosset)于 1908 年以 "学生 "的笔名提出,是一种统计检验,用于在样本量较小且群体方差未知的情况下比较均值。它侧重于比较两个群体的均值,是制造业中最常用的检验之一。

精心打造的实验室环境,时尚现代的工作台上摆放着各种科学仪器和测试设备。烧杯、试管和数字显示屏散发着柔和的环境光,头顶上精确的定向照明将其照亮。前景的电脑屏幕上打开了一个统计分析程序,显示着复杂的图表。中景是一位身穿白大褂的工程师在认真地记录数据,背景则是一面技术图表和工程原理图墙。整体氛围传达出一种严谨的分析、专业的技术和对质量控制的承诺。
在实验室中使用各种科学仪器进行统计测试。

目的是 the t-Test helps engineers and quality professionals determine if there is a statistically significant difference between the means of two groups or between a sample mean and a known standard. It’s commonly used in hypothesis testing to evaluate whether process changes or product modifications have led to real improvements or differences, beyond what could be expected by chance.

行业实例:

  • 在汽车制造领域,t 检验可用于比较来自两个不同供应商的钢材的抗拉强度,以确保质量的一致性。
  • 在制药领域,t 检验用于分析新生产工艺生产的药片的平均重量是否与标准有显著差异。
  • 在电子学中,工程师可能会使用 t 检验来验证是否存在...

您已阅读了文章的 31%。其余部分为社区内容。已经是会员? 登录
(同时也是为了保护我们的原创内容不被机器人搜刮)。

创新世界社区

登录或注册(100% 免费)

查看本文其余部分以及所有会员专享内容和工具。

只有真正的工程师、制造商、设计师和营销人员才是专业人士。
没有机器人,没有仇恨者,没有垃圾邮件发送者。

目录
    添加标题以开始生成目录

    迎接新挑战
    机械工程师、项目、工艺工程师或研发经理
    有效的产品开发

    可在短时间内接受新的挑战。
    通过 LinkedIn 联系我
    塑料金属电子集成、成本设计、GMP、人体工程学、中高容量设备和耗材、精益制造、受监管行业、CE 和 FDA、CAD、Solidworks、精益西格玛黑带、医疗 ISO 13485

    我们正在寻找新的赞助商

     

    您的公司或机构从事技术、科学或研究吗?
    > 给我们发送消息 <

    接收所有新文章
    免费,无垃圾邮件,电子邮件不分发也不转售

    或者您可以免费获得完整会员资格以访问所有受限制的内容>这里<

    涵盖的主题: 统计检验、质量管理、制造过程、客观证据、决策、正态检验、Shapiro-Wilk 检验、非参数检验、P 值、I 类误差、II 类误差、数据驱动、回归分析、相关分析、全面质量管理 (TQM)、方差分析、可靠性、ISO 9001、ISO 25010、ISO 31000、ISO 9000 和 ISO 17025。

    2人评论了“The 6 Must-know Statistical Tests for Quality & Engineering”

    发表评论

    您的邮箱地址不会被公开。 必填项已用 * 标注

    历史背景

    1974
    1974
    1978
    1980
    1980
    1980
    1980
    1972
    1974
    1975-06-01
    1980
    1980
    1980
    1980
    1980

    (如果日期未知或不相关,例如“流体力学”,则提供其显著出现的近似估计)

    相关文章

    滚动至顶部