Statistical tests are the only way in quality and manufacturing to provide objective evidence for decision-making. They help identify variations in processes and distinguish between random fluctuations and actual problems. In engineering, statistics help identify patterns, outliers, and sources of failure in system performance, ensuring data-driven decision-making. By rigorously analyzing experimental results, engineers can validate product designs and manufacturing processes, detecting potential problems before implementation. This systematic approach reduces the risk of unexpected failures and enhances overall safety by ensuring reliability and compliance with international safety Normen.
Dieser Beitrag gibt einen Überblick über die wichtigsten statistischen Tests, die in der Fertigung und im Total Quality Management (TQM) verwendet werden.
Hinweis: Da sie auch das Ingenieurwesen, die Forschung und die Wissenschaft betreffen, sind die folgenden 2 statistischen Tests und Analysen
- Korrelationsanalyse: misst die Stärke und Richtung der Beziehung zwischen zwei Variablen (z. B. Korrelationskoeffizient nach Pearson).
- Regressionsanalyse: untersucht die Beziehung zwischen Variablen (z. B. Inputfaktoren und Prozessoutput), von der einfachen linearen bis zur multiplen Regression.
werden hier nicht aufgeführt, sondern in einem eigenen Artikel über die 10 wichtigsten Algorithmen für das Ingenieurwesen.
Normalitätstests

In der Welt der statistischen Tests wird bei vielen gängigen statistischen Methoden (t-Tests, ANOVA, lineare Regression usw.) davon ausgegangen, dass die Daten normal- bzw. gaußverteilt sind (oder dass die Residuen/Fehler normal sind). Ein Verstoß gegen diese Annahme kann dazu führen, dass die Ergebnisse unzuverlässig sind: p-Werte können irreführend sein, Konfidenzintervalle können falsch sein, und das Risiko von Fehlern vom Typ I/II steigt. Beachten Sie, dass einige Tests, wie z. B. die 1-Wege-ANOVA, recht gut mit einer nicht-normalen Verteilung umgehen können.
Hinweis: Wenn Ihre Daten nicht normal sind (siehe unten), müssen Sie möglicherweise nicht-parametrische Tests (wie den Mann-Whitney-U-Test oder den Kruskal-Wallis-Test) verwenden, die keine Normalität voraussetzen, oder Ihre Daten transformieren, was den Rahmen dieses Beitrags sprengen würde.
Es gibt zwar mehrere statistische Tests dafür, aber hier wird der Shapiro-Wilk-Test näher erläutert, der vor allem für kleine Stichprobengrößen bekannt ist, typischerweise n < 50, aber bis zu 2000 verwendet werden kann.
Zu Ihrer Information: andere gängige Normalitätstests:
- Kolmogorov-Smirnov (K-S)-Test (mit Lilliefors-Korrektur): funktioniert besser bei größeren Stichprobengrößen, ist aber weniger empfindlich als Shapiro-Wilk, insbesondere bei kleinen Datensätzen
- Anderson-Darling-Test: eignet sich für alle Stichprobenumfänge und ist in den Schwänzen (Extremen) der Verteilung empfindlicher, während er bei der Feststellung von Abweichungen von der Normalität in den Extremen stärker ist.
So führen Sie den Shapiro-Wilk-Normalitätstest durch
1. Berechnen Sie die Shapiro-Wilk-Teststatistik (W): [latex]W = \frac{\left(\sum_{i=1}^{n} a_i x_{(i)}\right)^2}{\sum_{i=1}^{n} (x_i – \bar{x})^2}[/latex] Note: as the calculation of the [latex]a_i[/latex] coefficients is nontrivial and generally requires a table or algorithm, which is why the Shapiro-Wilk test is nearly always computed by software such as R, Python’s SciPy, MS Excel add-ons or other dedicated softwares. Für eine manuelle Berechnung, diese Seite provides all the [latex]a_i[/latex] coefficients and p-value for samples up to 50. Der Wert von W liegt zwischen 0 und 1 (W = 1: perfekte Normalität. W < 1: je weiter er von 1 entfernt ist, desto weniger normal sind Ihre Daten). 2. W ist nicht genug. In Verbindung mit dem entsprechenden p-Wert ergibt sich das Konfidenzniveau. In der Shapiro-Wilk-Tabelle, bei die Zeile des Stichprobenumfangs n, suchen Sie den Wert, der dem von Ihnen berechneten W am nächsten liegt, und ermitteln Sie den entsprechenden Wert p-Wert an der Spitze | Der Zähler ist die quadrierte Summe der gewichteten geordneten Stichprobenwerte. Der Nenner ist die Summe der quadrierten Abweichungen vom Stichprobenmittelwert (d. h. die Stichprobenvarianz, skaliert mit (n-1)). [latex]x_{(i)}[/latex] = the i-th order statistic (i.e., the i-th smallest value in the sample) [latex]x_i[/latex] = the i-th observed value [latex]\bar{x}[/latex] = the sample mean [latex]a_i[/latex] = constants (weights) calculated from the mean, variances, and covariances of the order statistics of a sample from a standard normal distribution ((N(0,1))), and depend only on n (sample size). n = Stichprobenumfang |
3. Ergebnis: Ist der p-Wert größer als das gewählte Alpha-Niveau (z. B. 0,05), gibt es einen statistischen Beweis dafür, dass die getesteten Daten normalverteilt sind. |
Für die Prüfung der Normalität wird häufig empfohlen, eine numerische Methode mit einer grafischen Methode wie der Henry-Linie, Q-Q-Plots oder Histogrammen zu kombinieren:
Nicht-Normalverteilungen beachten!
Obwohl die Normal-/Gauß-Verteilung der häufigste Fall ist, sollte sie nicht automatisch angenommen werden. Zu den täglichen Gegenbeispielen gehören:
- Verteilung von Reichtum und Einkommen unter den Individuen. Sie folgt einer Pareto-Verteilung (Potenzgesetz), die mit einem "langen Schwanz" sehr wohlhabender Personen schief ist.
- Die Größe der Stadtbevölkerung in einem Land folgt dem Zipf'schen Gesetz (Potenzgesetz), mit einigen sehr großen Städten und vielen kleinen Städten.
- Die Stärke und Häufigkeit von Erdbeben entspricht einer Potenzgesetz/Gutenberg-Richter-Verteilung: kleine Erdbeben sind häufig, große sind selten.
- Tägliche Preisänderungen oder Renditen auf den Finanzmärkten: fat-tailed/heavy-tailed-Verteilungen, nicht gaußförmig; große Abweichungen treten häufiger auf als von einer Normalverteilung vorhergesagt.
- Die Häufigkeit von Wörtern in der Sprache folgt, wie die Stadtbevölkerung oben, dem Zipfschen Gesetz (Potenzgesetz): Wenige Wörter werden häufig verwendet, die meisten Wörter sind selten.
- Internetverkehr/Website-Popularität: Potenzgesetz/Long Tail: Einige Websites haben Millionen von Zugriffen, die meisten haben nur sehr wenige.
- Dateigrößen auf Computersystemen: lognormal oder Potenzgesetz, mit wenigen sehr großen und vielen kleinen Dateien.
- Menschliche Lebensspanne/Langlebigkeit: rechtsschief (kann Modell mit Weibull oder Gompertz-Verteilung), nicht normal; mehr Menschen sterben im höheren Alter.
- Die Verbindungen in sozialen Netzwerken folgen einem Potenzgesetz: wenige Nutzer haben viele Verbindungen, die meisten haben wenige.
Die meisten von ihnen sind gekennzeichnet durch "wenige große, viele kleine", eine Signatur von Potenzgesetzen, starke Schwänze, Exponential- oder Lognormalverteilungen und nicht die symmetrische Form des Gauß.
Der t-Test (Student's t-Test)
Der t-Test (auch bekannt als "t von Student"), der 1908 von William Sealy Gosset unter dem Pseudonym "Student" entwickelt wurde, ist ein statistischer Test, der zum Vergleich von Mittelwerten verwendet wird, wenn der Stichprobenumfang gering und die Varianz der Population unbekannt ist. Da er sich auf den Vergleich der Mittelwerte zweier Populationen konzentriert, ist er einer der am häufigsten verwendeten Tests in der Fertigung.

Zweck:the t-Test helps engineers and quality professionals determine if there is a statistically significant difference between the means of two groups...
You have read 32% of the article. The rest is for our community. Already a member? Einloggen
(and also to protect our original content from scraping bots)
Innovation.world Gemeinschaft
Anmelden oder Registrieren (100% kostenlos)
Lesen Sie den Rest dieses Artikels und alle Inhalte und Tools, die nur für Mitglieder zugänglich sind.
Nur echte Ingenieure, Hersteller, Designer und Marketingfachleute.
Kein Bot, kein Hater, kein Spammer.
Interesting read! But arent parametric tests like t-Test potentially misleading in non-normal distributions? Would love to hear your thoughts!
Sure, but even non-parametric tests have some flaws
Verwandte Artikel
45+ Weitere kognitionswissenschaftliche Tricks für Spiele und Marketing: Psychologie und Engagement
45+ Kognitionswissenschaftliche Tricks für Spiele und Marketing: Psychologie und Engagement
Neueste Veröffentlichungen & Patente zu Zeolithen
Neueste Veröffentlichungen & Patente zu metallorganischen Gerüsten (MOFs)
Neueste Veröffentlichungen & Patente zu kovalenten organischen Gerüsten (COFs)
Neueste Veröffentlichungen und Patente zu Aerogele und Aerographen