家 » 产品设计 » 方法论 » 质量与工程领域必知的 6 项统计测试

质量与工程领域必知的 6 项统计测试

精益制造, 流程改进, 工艺优化, 质量保证, 质量控制, 质量管理, 六西格玛, 统计分析, 统计测试

Statistical tests are the only way in quality and manufacturing to provide objective evidence for decision-making. They help identify variations in processes and distinguish between random fluctuations and actual problems. In engineering, statistics help identify patterns, outliers, and sources of failure in system performance, ensuring data-driven decision-making. By rigorously analyzing experimental results, engineers can validate product designs and manufacturing processes, detecting potential problems before implementation. This systematic approach reduces the risk of unexpected failures and enhances overall safety by ensuring reliability and compliance with international safety standards.

This post will review main statistical tests used in manufacturing and Total Quality Management (TQM).

注：由于也涉及工程、研究和科学，以下 2 项统计测试和分析

相关性分析： 衡量两个变量之间关系的强度和方向（如皮尔逊相关系数）。
回归分析： 从简单的线性回归到多元回归，研究变量（如输入因素和过程输出）之间的关系。

这里不包括这些算法，而是专门介绍工程学的 10 种主要算法。

正态性检验

光线充足的实验室环境，桌上摆放着各种科学仪器--烧杯、移液管和显微镜。中间一块白板展示了假设检验的清晰步骤，并用公式和图表解释了基本原理。背景是一个书架，上面摆满了技术手册和特定行业的文献，传达出严谨的学术氛围和对细节的关注。整体氛围是科学探索和解决问题，重点是质量控制的系统方法。 — 列出最常用的质量和工程统计测试。

在统计检验领域，许多常用的统计方法（t 检验、方差分析、线性回归等）都假定数据是正态/高斯分布的（或残差/误差是正态的）。违反这一假设会使结果不可靠：P 值可能会误导人，置信区间可能会出错，I/II 类错误的风险也会增加。请注意，有些检验（如单因素方差分析）可以很好地处理非正态分布。

注意：如果您的数据不符合正态性，请参阅下面的实际案例，您可能需要使用非参数检验（如 Mann-Whitney U 检验或 Kruskal-Wallis 检验），这些检验不假定数据符合正态性，或者对数据进行转换，这不在本篇文章的讨论范围之内。

虽然有多种统计检验方法，但在此我们将详细介绍 Shapiro-Wilk 检验方法，该方法尤其适用于小样本量，通常 n < 50，但也可用于多达 2000 个样本。

顺便提一下，其他常见的正态性检验：

- Kolmogorov-Smirnov (K-S) 检验（带 Lilliefors 校正）：样本量较大时效果更好，但灵敏度不如 Shapiro-Wilk，尤其是在小数据集上
- 安德森-达林检验：适用于所有样本量，对分布的尾部（极值）更敏感，对检测极值偏离正态性更强。

如何进行 Shapiro-Wilk 正态性检验

1.计算或计算 Shapiro-Wilk 检验统计量 (W)：

[latex]W = \frac{left(\sum_{i=1}^{n} a_i x_{(i)}\right)^2}{\sum_{i=1}^{n} (x_i - \bar{x})^2}[/latex]

Note: as the calculation of the [latex]a_i[/latex] coefficients is nontrivial and generally requires a table or algorithm, which is why the Shapiro-Wilk test is nearly always computed by software such as R, Python’s SciPy, MS Excel add-ons or other dedicated softwares. 如需手动计算，请参见本页提供了最多 50 个样本的所有 [latex]a_i[/latex] 系数和 p 值。

W 值介于 0 和 1 之间（W = 1：完全正态性。W<1：离 1 越远，数据越不正常）。

2.W 是不够的。它需要与相应的 p 值结合起来才能得到置信水平。在 Shapiro-Wilk 表中，在在 n 个样本量的行中，查找与计算出的 W 值最接近的值，并获取其对应的顶部的 p 值

分子表示加权有序样本值的平方和。

分母是与样本平均数的平方差之和（即样本方差，按 (n-1) 缩放）。

[latex]x_{(i)}[/latex] = 第 i 阶统计量（即样本中第 i 个最小值）

[latex]x_i[/latex] = 第 i 个观测值

[latex]\bar{x}[/latex] = 样本平均数

[latex]a_i[/latex] = 根据标准正态分布（(N(0,1)）样本阶次统计量的均值、方差和协方差计算得出的常量（权重），且仅取决于 n（样本数）。

n = 样本数量

3. 结果如果 p 值大于所选的α水平（例如 0.05），则有统计证据表明所测试的数据是正态分布的。

对于正态性检验，通常建议将数字方法与图形方法（如亨利线、Q-Q 图或直方图）相结合：

心智非正态分布！

虽然正态分布/高斯分布是最常见的情况，但不应自动假定为正态分布/高斯分布。日常的反例有

个人之间的财富和收入分配。它遵循帕累托（幂律）分布，偏斜的 "长尾 "是非常富有的个人。
一个国家的城市人口规模遵循齐普夫定律（幂律），即几个非常大的城市和许多小城镇。
地震的震级和频率呈幂律/古腾堡-里克特分布：小地震常见，大地震罕见。
金融市场的每日价格变化或回报：肥尾/重尾分布，而非高斯分布；大偏差出现的频率高于正态分布的预测。
语言中的词频，正如上述城市人口一样，遵循齐普夫定律（幂律）：经常使用的词很少，大多数词都很罕见。
互联网流量/网站受欢迎程度：幂律/长尾：有些网站的点击率高达数百万次，而大多数网站的点击率却很低。
计算机系统上的文件大小：对数正态分布或幂律分布，大文件少，小文件多。
Human lifespans/longevity: right-skewed (can model with Weibull or Gompertz distributions), not normal; more people die at older ages.
社交网络连接遵循幂律：少数用户的连接数多，多数用户的连接数少。

其中大多数的特点是 "少大多小"，是幂律、重尾、指数或对数正态分布的特征，而不是高斯分布的对称形状。

t 检验（学生 t 检验）

t 检验（又称 "学生 t"）由威廉-西利-戈塞特（William Sealy Gosset）于 1908 年以 "学生 "的笔名提出，是一种统计检验，用于在样本量较小且群体方差未知的情况下比较均值。它侧重于比较两个群体的均值，是制造业中最常用的检验之一。

精心打造的实验室环境，时尚现代的工作台上摆放着各种科学仪器和测试设备。烧杯、试管和数字显示屏散发着柔和的环境光，头顶上精确的定向照明将其照亮。前景的电脑屏幕上打开了一个统计分析程序，显示着复杂的图表。中景是一位身穿白大褂的工程师在认真地记录数据，背景则是一面技术图表和工程原理图墙。整体氛围传达出一种严谨的分析、专业的技术和对质量控制的承诺。 — 在实验室中使用各种科学仪器进行统计测试。

目的是 the t-Test helps engineers and quality professionals determine if there is a statistically significant difference between the means of two groups or between a sample mean and a known standard. It’s commonly used in hypothesis testing to evaluate whether process changes or product modifications have led to real improvements or differences, beyond what could be expected by chance.

行业实例：

在汽车制造领域，t 检验可用于比较来自两个不同供应商的钢材的抗拉强度，以确保质量的一致性。
在制药领域，t 检验用于分析新生产工艺生产的药片的平均重量是否与标准有显著差异。
在电子学中，工程师可能会使用 t 检验来验证是否存在...

您已阅读了文章的 31%。其余部分为社区内容。已经是会员？登录
(同时也是为了保护我们的原创内容不被机器人搜刮）。

创新世界社区

登录或注册（100% 免费）

查看本文其余部分以及所有会员专享内容和工具。

只有真正的工程师、制造商、设计师和营销人员才是专业人士。
没有机器人，没有仇恨者，没有垃圾邮件发送者。

目录

添加标题以开始生成目录

迎接新挑战
机械工程师、项目、工艺工程师或研发经理

可在短时间内接受新的挑战。
通过 LinkedIn 联系我
塑料金属电子集成、成本设计、GMP、人体工程学、中高容量设备和耗材、精益制造、受监管行业、CE 和 FDA、CAD、Solidworks、精益西格玛黑带、医疗 ISO 13485

我们正在寻找新的赞助商

您的公司或机构从事技术、科学或研究吗？
> 给我们发送消息 <

接收所有新文章
免费，无垃圾邮件，电子邮件不分发也不转售

或者您可以免费获得完整会员资格以访问所有受限制的内容>这里<

涵盖的主题： 统计检验、质量管理、制造过程、客观证据、决策、正态检验、Shapiro-Wilk 检验、非参数检验、P 值、I 类误差、II 类误差、数据驱动、回归分析、相关分析、全面质量管理 (TQM)、方差分析、可靠性、ISO 9001、ISO 25010、ISO 31000、ISO 9000 和 ISO 17025。

2人评论了“The 6 Must-know Statistical Tests for Quality & Engineering”

布伦南
5 月 27, 2025 在 2:41 上午

有趣的阅读！但在非正态分布中，参数检验（如 t 检验）是否会产生误导？很想听听您的看法！

回复
1. 法布里斯
  5 月 27, 2025 在 9:41 上午
  
  当然，但即使是非参数检验也有一些缺陷
  
  回复

发表评论取消回复

历史背景

在专业环境中分析传输控制协议的计算机工作站。.

传输控制协议（TCP）

TCP 是传输层的核心协议，用于在主机上运行的应用程序之间提供可靠、有序且经过错误检查的字节流传输。它是一种面向连接的协议，这意味着它在数据传输开始之前通过三次握手建立连接。与 UDP 相比，这可以确保数据完整性，但开销更高。

在现代办公环境中分析 TCP/IP 分层架构的网络工程师。.

TCP/IP分层架构

互联网协议套件的架构是一个概念模型，它将通信功能划分为四个抽象层：链路层、互联网层、传输层和应用层。这种分层方法简化了协议的设计和开发，因为每个层处理特定的任务，并且只与其上下层交互。

用于热力学应用中压缩空气储能的地下盐洞。.

压缩空气储能（CAES）

压缩空气储能 (CAES) 是一种将某一时刻产生的能量储存起来以供下次使用的方法。在公用事业规模上，能量的储存方式是压缩空气并将其储存在地下储层（例如盐穴）中。当需要电力时，压缩空气在涡轮机中被加热并膨胀，从而驱动发电机。

在全面质量管理会议上开展团队合作，重点关注流程改进。

全面质量管理（TQM）

全面质量管理 (TQM) 是一种管理理念，组织的所有成员都参与改进流程、产品、服务和工作文化。它旨在通过客户满意度实现长期成功。TQM 将质量纪律融入公司的文化和活动中，超越简单的产品检验，成为一种覆盖整个组织的整体方法。

在工业生产线上，工程师们管理着生产过程中的 "Takt time "难题。

节拍时间实施挑战

成功实施节拍时间需要高度稳定的生产环境。常见的挑战包括：管理机器停机时间、确保质量稳定以避免返工，以及平衡生产多种不同工作内容产品的生产线（混合模式生产线）。如果不解决这些波动因素，节拍驱动的系统可能会变得脆弱，无法持续满足需求。

聚合物技术中热塑性塑料部件的激光传输焊接工艺。

塑料的激光透射焊接

激光透射焊接将激光束穿过可透射激光的上部部件，到达可吸收激光的下部部件，从而将两个重叠的热塑性部件连接在一起。被吸收的激光能量加热并熔化界面。夹紧压力使熔层熔合，冷却后形成牢固、清洁的焊缝。该方法精确、非接触，且产生的热应力和颗粒污染极小。

技术员在工厂对金属部件进行相控阵超声波测试。

相控阵超声检测（PAUT）

相控阵超声检测 (PAUT) 采用多晶振换能器，每个晶振均独立发射脉冲，并具有由计算机精确计算的时间延迟。通过控制相位，产生的超声波束可以进行电子操控、聚焦和扫描，而无需物理移动探头。这可以快速、详细地成像缺陷，尤其是在复杂几何形状中，其性能远超传统的单晶振技术。

1974

1974

1978

1980

1980

1980

1980

1972

1974

1975-06-01

1980

1980

1980

1980

1980

在现代化的办公环境中举行具有不同角色的 B2B 决策会议。

B2B 决策中的购买中心模式

采购中心是一个模型，代表组织内参与采购决策的所有个人和团体。它不是一个固定的单元，而是不同的人在不同的采购中承担的一系列角色。这些角色包括发起者、使用者、影响者、决定者、批准者、购买者和把关人，每个角色都通过其特定的职能和权限对最终决策产生影响。

网络运行中心展示互联网协议管理和数据路由。.

互联网协议（IP）

互联网协议 (IP) 是互联网层中用于跨网络边界中继数据报的主要通信协议。其主要功能是根据 IP 地址将数据包从源主机传送到目标主机。IP 是一种无连接协议，提供尽力而为的传输服务，这意味着它不保证传输质量、顺序或数据完整性。

带有 FCC 电磁兼容性认证标志的电子设备。.

FCC EMC兼容性标志

FCC 标志是在美国制造或销售的电子产品上使用的认证标志。它表示设备的电磁干扰 (EMI) 符合美国联邦通信委员会 (FCC) 批准的限值。该法规确保电子设备不会干扰无线电通信和其他设备，从而维护无线电频谱的完整性。

工业技术设计室，工程师们正在优化组装用平板包装家具。

X 设计 (DFX)

一种设计方法，其中“X”代表特定的产品生命周期目标。DFX 包含一系列指南和技术，旨在针对特定目标（例如可制造性 (DFM)、装配性 (DFA)、可靠性 (DFR) 或可持续性 (DfS)）优化产品设计。这种主动方法可在设计阶段早期解决潜在问题，从而降低成本并提高质量。

工程办公室与工程师合作，使用 IGES 和 STEP 格式交换 CAD 数据。

CAD 数据交换：IGES 和 STEP

为了解决不同 CAD 系统之间无法共享数据的问题，人们创建了中性文件格式。20 世纪 70 年代末开发的初始图形交换规范 (IGES) 就是一次早期尝试。后来，它被更强大、更全面的 STEP（产品模型数据交换标准，ISO 10303）所取代，后者可以表示完整的 3D 模型、装配结构和元数据。

利用多样化生态系统净化水的生态废水处理系统。

生活机器

约翰·托德博士研发的专利生态废水处理和水资源回收系统。该系统利用一系列多样化的生态系统，包括细菌、藻类、植物、蜗牛和鱼类，在水箱或温室等受控环境中净化水质。该系统模拟了湿地和其他水生生态系统的自然净化过程，但采用了强化的人工环境。

配备闭环控制系统和自动化反馈装置的数控机床。

CNC 系统中的闭环控制

高精度数控机床采用闭环控制系统来确保精度。该系统使用反馈装置（例如伺服电机上的旋转编码器或机床轴上的线性刻度尺）持续监控机床的实际位置。控制器将实时反馈与程序指令位置进行比较，并立即进行校正，以补偿误差。

工程师们在计算机网络实验室合作研究用户数据报协议应用。.

用户数据报协议（UDP）

用户数据报协议 (UDP) 是一种精简的无连接传输层协议。它提供简单的数据报服务，无需 TCP 的可靠性、排序或流量控制机制。它的主要优势是低开销和低延迟，非常适合 DNS 查询、在线游戏和视频直播等时间敏感型应用，因为在这些应用中，速度比完美的可靠性更为重要。

（如果日期未知或不相关，例如“流体力学”，则提供其显著出现的近似估计）

相关文章

UNESCO Nomenclature

联合国教科文组织命名法全文

Contamination Control Strategy

污染控制策略和洁净室26个最佳实践

GMP到cGMP

从 GMP 到 cGMP：完整的母带制作指南

IQ OQ PQ 工艺验证

IQ OQ PQ 流程验证：完整理论与实践

Lone Nut 首位追随者快速追随者策略

“孤独的坚果”、“第一个追随者”和“快速追随者”策略

工程代理的使用

工程领域代理的 20 个最佳用途