I test statistici sono l'unico modo in cui la qualità e la produzione possono fornire prove oggettive per il processo decisionale. Aiutano a identificare le variazioni nei processi e a distinguere tra fluttuazioni casuali e problemi reali. In ingegneria, le statistiche aiutano a identificare schemi, anomalie e fonti di fallimento nelle prestazioni del sistema, garantendo un processo decisionale basato sui dati. Analizzando rigorosamente i risultati sperimentali, gli ingegneri possono convalidare i progetti dei prodotti e i processi di produzione, individuando potenziali problemi prima dell'implementazione. Questo approccio sistematico riduce il rischio di guasti imprevisti e migliora la sicurezza generale, garantendo l'affidabilità e la conformità alle norme di sicurezza internazionali. standard.
In questo articolo verranno esaminati i principali test statistici utilizzati nella produzione e nella gestione della qualità totale (TQM).
Nota: poiché riguardano anche l'ingegneria, la ricerca e la scienza, i seguenti 2 test statistici e analisi
- analisi di correlazione: misura la forza e la direzione della relazione tra due variabili (ad esempio, il coefficiente di correlazione di Pearson).
- analisi di regressione: esamina la relazione tra variabili (ad esempio, fattori di input e output del processo), dalla semplice regressione lineare a quella multipla.
non sono inclusi qui, ma in un articolo specifico sui principali 10 algoritmi per l'ingegneria.
Test di normalità

Nel mondo dei test statistici, molti metodi statistici comuni (t-test, ANOVA, regressione lineare, ecc.) presuppongono che i dati siano distribuiti in modo normale/gaussiano (o che i residui/errori siano normali). La violazione di questo assunto può rendere i risultati inaffidabili: i valori di p possono essere fuorvianti, gli intervalli di confidenza possono essere errati e il rischio di errori di tipo I/II aumenta. Si noti che alcuni test, come l'ANOVA a 1 via, possono gestire ragionevolmente bene una distribuzione non normale.
Nota: se i dati non sono normali (si vedano i casi reali riportati di seguito), potrebbe essere necessario utilizzare test non parametrici (come il test U di Mann-Whitney o il test Kruskal-Wallis), che non presuppongono la normalità, o trasformare i dati, operazioni che esulano dallo scopo di questo post.
Sebbene esistano diversi test statistici a questo proposito, qui descriveremo in dettaglio il test di Shapiro-Wilk, famoso soprattutto per le piccole dimensioni del campione, tipicamente n < 50, ma che può essere utilizzato fino a 2000.
Per vostra informazione, altri test di normalità comuni:
- Test di Kolmogorov-Smirnov (K-S) (con correzione di Lilliefors): funziona meglio con campioni di dimensioni maggiori, ma è meno sensibile di Shapiro-Wilk, soprattutto per i piccoli insiemi di dati.
- Test di Anderson-Darling: è buono con tutte le dimensioni del campione e ha una maggiore sensibilità nelle code (estremi) della distribuzione, mentre è più potente per rilevare gli scostamenti dalla normalità negli estremi.
Come eseguire il test di normalità di Shapiro-Wilk
1. Calcolare o calcolare la statistica del test di Shapiro-Wilk (W): [latex]W = \frac{\left(\sum_{i=1}^{n} a_i x_{(i)}\right)^2}{\sum_{i=1}^{n} (x_i - \bar{x})^2}[/latex] Nota: il calcolo dei coefficienti [latex]a_i[/latex] non è banale e richiede generalmente una tabella o un algoritmo, motivo per cui il test di Shapiro-Wilk viene quasi sempre calcolato da software come R, Python's SciPy, MS Excel componenti aggiuntivi o altri software dedicati. Per un calcolo manuale, questa pagina fornisce tutti i coefficienti [latex]a_i[/latex] e i p-value per campioni fino a 50. Il valore di W è compreso tra 0 e 1 (W = 1: perfetta normalità. W < 1: più si allontana da 1, meno normali sono i dati). 2. W non è sufficiente. Per ottenere il livello di confidenza, il valore di W è associato al valore di p corrispondente. Nella tabella di Shapiro-Wilk, a la riga della dimensione del campione n, cercare il valore più vicino alla W calcolata e ottenere il suo valore corrispondente. p-value in alto | Il numeratore rappresenta la somma quadratica dei valori del campione ordinato ponderato. Il denominatore è la somma degli scarti quadratici dalla media del campione (cioè la varianza del campione, scalata da (n-1)). [latex]x_{(i)}[/latex] = statistica di ordine i-esimo (cioè, l'i-esimo valore più piccolo del campione) [latex]x_i[/latex] = l'i-esimo valore osservato [latex]\bar{x}[/latex] = media del campione [latex]a_i[/latex] = costanti (pesi) calcolate dalla media, dalla varianza e dalla covarianza delle statistiche d'ordine di un campione da una distribuzione normale standard ((N(0,1)), e dipendono solo da n (dimensione del campione). n = dimensione del campione |
3. Risultato: se il valore p è superiore al livello alfa prescelto (ad esempio 0,05), vi è evidenza statistica che i dati testati sono distribuiti normalmente. |
Per i test di normalità, si consiglia spesso di combinare un metodo numerico con un metodo grafico, come la linea di Henry, i diagrammi Q-Q o gli istogrammi:
Attenzione alle distribuzioni non normali!
Sebbene la distribuzione normale/gaussiana sia il caso più frequente, non deve essere assunta automaticamente. Tra i controesempi quotidiani vi sono:
- Distribuzione della ricchezza e del reddito tra gli individui. Segue una distribuzione di Pareto (legge di potenza), con una "coda lunga" di individui molto ricchi.
- Le dimensioni della popolazione di un Paese seguono la legge di Zipf (legge di potenza), con poche città molto grandi e molti piccoli centri.
- La magnitudo e la frequenza dei terremoti sono una distribuzione a legge di potenza/Gutenberg-Richter: i terremoti piccoli sono comuni, quelli grandi sono rari.
- Variazioni giornaliere dei prezzi o dei rendimenti nei mercati finanziari: distribuzioni a coda grassa/coda pesante, non gaussiane; grandi deviazioni si verificano più frequentemente di quanto previsto da una distribuzione normale.
- La frequenza delle parole nel linguaggio, come la popolazione cittadina di cui sopra, segue la legge di Zipf (legge di potenza): Poche parole sono usate spesso, la maggior parte delle parole sono rare.
- Traffico internet/popolarità del sito: legge di potenza/coda lunga: Alcuni siti hanno milioni di visite, la maggior parte ne ha pochissime.
- Dimensioni dei file sui sistemi informatici: log-normale o legge di potenza, con pochi file molto grandi e molti piccoli.
- Durata della vita umana e longevità: con distribuzione a destra (si può modellizzare con Weibull o distribuzioni di Gompertz), non normale; più persone muoiono in età più avanzata.
- Le connessioni dei social network seguono una legge di potenza: pochi utenti hanno molte connessioni, la maggior parte ne ha poche.
La maggior parte di questi è caratterizzata da "pochi grandi, molti piccoli", una firma di leggi di potenza, code pesanti, distribuzioni esponenziali o log-normali e non la forma simmetrica della gaussiana.
Il test t (test t di Student)
Il test t (noto anche come "t di Student"), sviluppato da William Sealy Gosset con lo pseudonimo di "Student" nel 1908, è un test statistico utilizzato per confrontare le medie quando le dimensioni del campione sono piccole e la varianza della popolazione è sconosciuta. Concentrandosi sul confronto delle medie di due popolazioni, è uno dei test più utilizzati nel settore manifatturiero.

Scopo:the t-Test helps engineers and quality professionals determine if there is a statistically significant difference between the means of two groups...
You have read 32% of the article. The rest is for our community. Already a member? Accedi
(and also to protect our original content from scraping bots)
Comunità Innovazione.mondo
Accedi o registrati (100% free)
Visualizza il resto di questo articolo e tutti i contenuti e gli strumenti riservati ai soci.
Solo veri ingegneri, produttori, designer, professionisti del marketing.
Nessun bot, nessun hater, nessuno spammer.
Lettura interessante! Ma i test parametrici come il t-test non sono potenzialmente fuorvianti in caso di distribuzioni non normali? Mi piacerebbe sentire il suo parere!
Certo, ma anche i test non parametrici hanno qualche difetto.
Post correlati
From Lab To Market: The Role of the Pilot Production Run
45+ Altri trucchi di scienza cognitiva per giochi e marketing: Psicologia e coinvolgimento
45+ trucchi di scienza cognitiva per giochi e marketing: Psicologia e coinvolgimento
Ultime pubblicazioni e brevetti sulle zeoliti
Ultime pubblicazioni e brevetti sulle strutture metallo-organiche (MOF)
Ultime pubblicazioni e brevetti sulle strutture organiche covalenti (COF)