Product Design, Manufacturing & Innovation Resources
Heim » Produktdesign » Methodologien » Die 6 wichtigsten statistischen Tests für Qualität und Technik

Die 6 wichtigsten statistischen Tests für Qualität und Technik

Statistische Tests für Qualität und Technik

Statistical tests are the only way in quality and manufacturing to provide objective evidence for decision-making. They help identify variations in processes and distinguish between random fluctuations and actual problems. In engineering, statistics help identify patterns, outliers, and sources of failure in system performance, ensuring data-driven decision-making. By rigorously analyzing experimental results, engineers can validate product designs and manufacturing processes, detecting potential problems before implementation. This systematic approach reduces the risk of unexpected failures and enhances overall safety by ensuring reliability and compliance with international safety Normen.

This post will review main statistical tests used in manufacturing and Vollständiges Qualitätsmanagement (TQM).

Hinweis: Da sie auch das Ingenieurwesen, die Forschung und die Wissenschaft betreffen, sind die folgenden 2 statistischen Tests und Analysen

  • Korrelationsanalyse: measures the strength and direction of the relationship between two variables (e.g., Pearson correlation coefficient).
  • Regressionsanalyse: untersucht die Beziehung zwischen Variablen (z. B. Inputfaktoren und Prozessoutput), von der einfachen linearen bis zur multiplen Regression.

werden hier nicht aufgeführt, sondern in einem eigenen Artikel über die 10 wichtigsten Algorithmen für das Ingenieurwesen.

Normalitätstests

Eine gut beleuchtete Laborumgebung mit einem Schreibtisch, auf dem verschiedene wissenschaftliche Geräte stehen - Bechergläser, Pipetten und ein Mikroskop. In der Mitte zeigt ein Whiteboard eine klare Schritt-für-Schritt-Anleitung für Hypothesentests, mit Gleichungen und Diagrammen, die die Grundlagen erklären. Im Hintergrund steht ein Bücherregal, das mit technischen Handbüchern und branchenspezifischer Literatur gefüllt ist und eine Atmosphäre von akademischer Strenge und Liebe zum Detail vermittelt. Insgesamt herrscht eine Atmosphäre des wissenschaftlichen Forschens und der Problemlösung vor, wobei der Schwerpunkt auf dem systematischen Ansatz zur Qualitätskontrolle liegt.
Nennen Sie die am häufigsten verwendeten statistischen Tests für Qualität und Technik.

In der Welt der statistischen Tests wird bei vielen gängigen statistischen Methoden (t-Tests, ANOVA, lineare Regression usw.) davon ausgegangen, dass die Daten normal- bzw. gaußverteilt sind (oder dass die Residuen/Fehler normal sind). Ein Verstoß gegen diese Annahme kann dazu führen, dass die Ergebnisse unzuverlässig sind: p-Werte können irreführend sein, Konfidenzintervalle können falsch sein, und das Risiko von Fehlern vom Typ I/II steigt. Beachten Sie, dass einige Tests, wie z. B. die 1-Wege-ANOVA, recht gut mit einer nicht-normalen Verteilung umgehen können.

Hinweis: Wenn Ihre Daten nicht normal sind (siehe unten), müssen Sie möglicherweise nicht-parametrische Tests (wie den Mann-Whitney-U-Test oder den Kruskal-Wallis-Test) verwenden, die keine Normalität voraussetzen, oder Ihre Daten transformieren, was den Rahmen dieses Beitrags sprengen würde.

Es gibt zwar mehrere statistische Tests dafür, aber hier wird der Shapiro-Wilk-Test näher erläutert, der vor allem für kleine Stichprobengrößen bekannt ist, typischerweise n < 50, aber bis zu 2000 verwendet werden kann.

Zu Ihrer Information: andere gängige Normalitätstests:

    • Kolmogorov-Smirnov (K-S)-Test (mit Lilliefors-Korrektur): funktioniert besser bei größeren Stichprobengrößen, ist aber weniger empfindlich als Shapiro-Wilk, insbesondere bei kleinen Datensätzen
    • Anderson-Darling-Test: eignet sich für alle Stichprobenumfänge und ist in den Schwänzen (Extremen) der Verteilung empfindlicher, während er bei der Feststellung von Abweichungen von der Normalität in den Extremen stärker ist.

So führen Sie den Shapiro-Wilk-Normalitätstest durch

1. Berechnen Sie die Shapiro-Wilk-Teststatistik (W):

[latex]W = \frac{\left(\sum_{i=1}^{n} a_i x_{(i)}\right)^2}{\sum_{i=1}^{n} (x_i – \bar{x})^2}[/latex]

Note: as the calculation of the [latex]a_i[/latex] coefficients is nontrivial and generally requires a table or algorithm, which is why the Shapiro-Wilk test is nearly always computed by software such as R, Python’s SciPy, MS Excel add-ons or other dedicated softwares. Für eine manuelle Berechnung, diese Seite provides all the [latex]a_i[/latex] coefficients and p-value for samples up to 50.

Der Wert von W liegt zwischen 0 und 1 (W = 1: perfekte Normalität. W < 1: je weiter er von 1 entfernt ist, desto weniger normal sind Ihre Daten).

2. W ist nicht genug. In Verbindung mit dem entsprechenden p-Wert ergibt sich das Konfidenzniveau. In der Shapiro-Wilk-Tabelle, bei die Zeile des Stichprobenumfangs n, suchen Sie den Wert, der dem von Ihnen berechneten W am nächsten liegt, und ermitteln Sie den entsprechenden Wert p-Wert an der Spitze

Der Zähler ist die quadrierte Summe der gewichteten geordneten Stichprobenwerte.

Der Nenner ist die Summe der quadrierten Abweichungen vom Stichprobenmittelwert (d. h. die Stichprobenvarianz, skaliert mit (n-1)).

[latex]x_{(i)}[/latex] = the i-th order statistic (i.e., the i-th smallest value in the sample)

[latex]x_i[/latex] = the i-th observed value

[latex]\bar{x}[/latex] = the sample mean

[latex]a_i[/latex] = constants (weights) calculated from the mean, variances, and covariances of the order statistics of a sample from a standard normal distribution ((N(0,1))), and depend only on n (sample size).

n = Stichprobenumfang

3. Ergebnis: if the p-value is greater than the chosen alpha-level (example 0.05), there is statistical evidence that the data tested are normally distributed.

Für die Prüfung der Normalität wird häufig empfohlen, eine numerische Methode mit einer grafischen Methode wie der Henry-Linie, Q-Q-Plots oder Histogrammen zu kombinieren:

Nicht-Normalverteilungen beachten!

Obwohl die Normal-/Gauß-Verteilung der häufigste Fall ist, sollte sie nicht automatisch angenommen werden. Zu den täglichen Gegenbeispielen gehören:

  • Verteilung von Reichtum und Einkommen unter den Individuen. Sie folgt einer Pareto-Verteilung (Potenzgesetz), die mit einem "langen Schwanz" sehr wohlhabender Personen schief ist.
  • Die Größe der Stadtbevölkerung in einem Land folgt dem Zipf'schen Gesetz (Potenzgesetz), mit einigen sehr großen Städten und vielen kleinen Städten.
  • Die Stärke und Häufigkeit von Erdbeben entspricht einer Potenzgesetz/Gutenberg-Richter-Verteilung: kleine Erdbeben sind häufig, große sind selten.
  • Tägliche Preisänderungen oder Renditen auf den Finanzmärkten: fat-tailed/heavy-tailed-Verteilungen, nicht gaußförmig; große Abweichungen treten häufiger auf als von einer Normalverteilung vorhergesagt.
  • Die Häufigkeit von Wörtern in der Sprache folgt, wie die Stadtbevölkerung oben, dem Zipfschen Gesetz (Potenzgesetz): Wenige Wörter werden häufig verwendet, die meisten Wörter sind selten.
  • Internetverkehr/Website-Popularität: Potenzgesetz/Long Tail: Einige Websites haben Millionen von Zugriffen, die meisten haben nur sehr wenige.
  • Dateigrößen auf Computersystemen: lognormal oder Potenzgesetz, mit wenigen sehr großen und vielen kleinen Dateien.
  • Menschliche Lebensspanne/Langlebigkeit: rechtsschief (kann Modell mit Weibull oder Gompertz-Verteilung), nicht normal; mehr Menschen sterben im höheren Alter.
  • Die Verbindungen in sozialen Netzwerken folgen einem Potenzgesetz: wenige Nutzer haben viele Verbindungen, die meisten haben wenige.

Die meisten von ihnen sind gekennzeichnet durch "wenige große, viele kleine", eine Signatur von Potenzgesetzen, starke Schwänze, Exponential- oder Lognormalverteilungen und nicht die symmetrische Form des Gauß.

 

Der t-Test (Student's t-Test)

Der t-Test (auch bekannt als "t von Student"), der 1908 von William Sealy Gosset unter dem Pseudonym "Student" entwickelt wurde, ist ein statistischer Test, der zum Vergleich von Mittelwerten verwendet wird, wenn der Stichprobenumfang gering und die Varianz der Population unbekannt ist. Da er sich auf den Vergleich der Mittelwerte zweier Populationen konzentriert, ist er einer der am häufigsten verwendeten Tests in der Fertigung.

Eine sorgfältig gestaltete Laborumgebung mit einer Reihe von wissenschaftlichen Instrumenten und Testgeräten, die auf einer glatten, modernen Werkbank angeordnet sind. Bechergläser, Reagenzgläser und digitale Anzeigen verbreiten ein sanftes Licht, das durch eine präzise, gerichtete Beleuchtung von oben beleuchtet wird. Im Vordergrund ist auf einem Computerbildschirm ein Programm zur statistischen Analyse geöffnet, das komplexe Diagramme und Tabellen anzeigt. Im Mittelgrund ist ein Ingenieur in einem weißen Laborkittel zu sehen, der sorgfältig Daten aufzeichnet, während im Hintergrund eine Wand mit technischen Diagrammen und Konstruktionsplänen zu sehen ist. Die Gesamtatmosphäre vermittelt ein Gefühl von analytischer Strenge, technischem Fachwissen und einer Verpflichtung zur Qualitätskontrolle.
Eine Laborumgebung mit einer Reihe von wissenschaftlichen Instrumenten, die statistische Tests durchführen.

Zweck: Der t-Test hilft Ingenieuren und Qualitätsfachleuten festzustellen, ob ein statistisch signifikanter Unterschied zwischen den Mittelwerten zweier Gruppen oder zwischen einem Stichprobenmittelwert und einem bekannten Standard besteht. Er wird üblicherweise bei Hypothesentests verwendet, um zu bewerten, ob Prozessänderungen oder Produktänderungen geführt zu echten Verbesserungen oder Unterschieden führen, die über das hinausgehen, was durch Zufall zu erwarten wäre.

Praktische Beispiele aus der Industrie:

  • In der Automobilherstellung könnte ein t-Test verwendet werden, um die Zugfestigkeit von Stahl von zwei verschiedenen Lieferanten zu vergleichen, um eine gleichbleibende Qualität sicherzustellen.
  • In der Pharmazie wird der t-Test verwendet, um zu analysieren, ob ein neues Produktionsverfahren zu Tabletten führt, deren mittleres Gewicht sich signifikant von der Norm unterscheidet.
  • In electronics, engineers may use the t-Test to verify if a Designänderung in a Leiterplatte results in a measurable improvement in electrical resistance.

Anleitung zum Student's t-Test

Es gibt viele Varianten des t-Tests; das Beispiel hier konzentriert sich auf einen so genannten "t-Test mit zwei Stichproben" in seiner "ungepaarten" Version, bei dem die Stichproben von 2 verschiedenen Produktionschargen verglichen werden.

  1. Geben Sie Ihre Null- und Alternativhypothese an; in diesem Beispiel "es gibt keinen Unterschied zwischen den Mittelwerten" gegenüber "es gibt Unterschiede".
  2. Sammeln Sie Ihre Daten von den 2 zu vergleichenden Produktionschargen und berechnen Sie
    • the 2 sample means [latex]\bar{X} = \frac{1}{n_1} \sum_{i=1}^{n_1} X_i[/latex] and [latex]\bar{Y} = \frac{1}{n_2} \sum_{j=1}^{n_2} Y_j[/latex]
    • Calculate the 2 sample variances: [latex]S_X^2 = \frac{1}{n_1-1} \sum_{i=1}^{n_1} (X_i – \bar{X})^2[/latex] and [latex]S_Y^2 = \frac{1}{n_2-1} \sum_{j=1}^{n_2} (Y_j – \bar{Y})^2[/latex]
    • Stichprobengrößen.
  3. Berechnen Sie die Teststatistik. Obwohl die Methode davon ausgeht, dass beide Stichproben unabhängig sind und beide Stichproben aus normalverteilten Grundgesamtheiten stammen, gibt es noch zwei Fälle:
    • wenn gleiche Varianzen angenommen werden (“pooled” t-test;): Pooled variance: [latex]S_p^2 = \frac{ (n_1-1)S_X^2 + (n_2-1)S_Y^2 }{ n_1 + n_2 – 2 }[/latex]
      Test statistic: [latex]t = \frac{ \bar{X} – \bar{Y} }{ S_p \sqrt{ \frac{1}{n_1} + \frac{1}{n_2} } }[/latex]
    • bei ungleichen Varianzen (Welch’s t-test): Test statistic: [latex]t = \frac{ \bar{X} – \bar{Y} }{ \sqrt{ \frac{S_X^2}{n_1} + \frac{S_Y^2}{n_2} } }[/latex] Degrees of freedom (approximate, Welch-Satterthwaite): [latex]df = \frac{\left( \frac{S_X^2}{n_1} + \frac{S_Y^2}{n_2} \right)^2}{ \frac{ (S_X^2 / n_1)^2 }{ n_1 – 1 } + \frac{ (S_Y^2 / n_2)^2 }{ n_2 – 1 } }[/latex]
  4. Use the calculated ( t ) and degrees of freedom ([latex]n_1+n_2-2[/latex] for equal variances, or the Welch formula) to look up or compute the p-value from the t-distribution (depending on whether it’s a one-tailed or two-tailed test).
  5. Ergebnis: Vergleichen Sie den berechneten t-Wert mit dem kritischen t-Wert aus statistischen Tabellen auf der Grundlage des von Ihnen gewählten Konfidenzniveaus und der Freiheitsgrade; alternativ können Sie eine Software für den p-Wert verwenden. Wenn die t-Statistik den kritischen Wert übersteigt oder der p-Wert unter dem von Ihnen festgelegten Schwellenwert (in der Regel 0,05) liegt, verwerfen Sie die Nullhypothese.

Link zu die Tabelle der kritischen Werte des t-Tests

🔒

The rest of this article is reserved for members

To limit scraping bots (currently 40,000 hits per day!),
we had to restrict access to full articles and tools to registered members only.

Log in →  or  Register (100% free) →

to access all the rest.

Behandelte Themen: statistical tests, quality management, manufacturing processes, objective evidence, decision-making, normality tests, Shapiro-Wilk test, non-parametric tests, p-value, Type I error, Type II error, data-driven, regression analysis, correlation analysis, Total Quality Management (TQM), ANOVA, reliability, ISO 9001, ISO 25010, ISO 31000, ISO 9000, and ISO 17025..

Historischer Kontext

1974
1974
1978
1980
1980
1980
1980
1972
1974
1975-06-01
1980
1980
1980
1980
1980

(wenn das Datum unbekannt oder nicht relevant ist, z. B. „Strömungsmechanik“, wird eine gerundete Schätzung seines bemerkenswerten Auftretens bereitgestellt)

Bilder in voller Größe und Downloads sind nur für registrierte Mitglieder 100% kostenlos verfügbar.

> Login <