I test statistici sono l'unico modo in cui la qualità e la produzione possono fornire prove oggettive per il processo decisionale. Aiutano a identificare le variazioni nei processi e a distinguere tra fluttuazioni casuali e problemi reali. In ingegneria, le statistiche aiutano a identificare schemi, anomalie e fonti di fallimento nelle prestazioni del sistema, garantendo un processo decisionale basato sui dati. Analizzando rigorosamente i risultati sperimentali, gli ingegneri possono convalidare i progetti dei prodotti e i processi di produzione, individuando potenziali problemi prima dell'implementazione. Questo approccio sistematico riduce il rischio di guasti imprevisti e migliora la sicurezza generale, garantendo l'affidabilità e la conformità alle norme di sicurezza internazionali. standard.
In questo articolo verranno esaminati i principali test statistici utilizzati nella produzione e nella gestione della qualità totale (TQM).
Nota: poiché riguardano anche l'ingegneria, la ricerca e la scienza, i seguenti 2 test statistici e analisi
- analisi di correlazione: misura la forza e la direzione della relazione tra due variabili (ad esempio, il coefficiente di correlazione di Pearson).
- analisi di regressione: esamina la relazione tra variabili (ad esempio, fattori di input e output del processo), dalla semplice regressione lineare a quella multipla.
non sono inclusi qui, ma in un articolo specifico sui principali 10 algoritmi per l'ingegneria.
Test di normalità

Nel mondo dei test statistici, molti metodi statistici comuni (t-test, ANOVA, regressione lineare, ecc.) presuppongono che i dati siano distribuiti in modo normale/gaussiano (o che i residui/errori siano normali). La violazione di questo assunto può rendere i risultati inaffidabili: i valori di p possono essere fuorvianti, gli intervalli di confidenza possono essere errati e il rischio di errori di tipo I/II aumenta. Si noti che alcuni test, come l'ANOVA a 1 via, possono gestire ragionevolmente bene una distribuzione non normale.
Nota: se i dati non sono normali (si vedano i casi reali riportati di seguito), potrebbe essere necessario utilizzare test non parametrici (come il test U di Mann-Whitney o il test Kruskal-Wallis), che non presuppongono la normalità, o trasformare i dati, operazioni che esulano dallo scopo di questo post.
Sebbene esistano diversi test statistici a questo proposito, qui descriveremo in dettaglio il test di Shapiro-Wilk, famoso soprattutto per le piccole dimensioni del campione, tipicamente n < 50, ma che può essere utilizzato fino a 2000.
Per vostra informazione, altri test di normalità comuni:
- Test di Kolmogorov-Smirnov (K-S) (con correzione di Lilliefors): funziona meglio con campioni di dimensioni maggiori, ma è meno sensibile di Shapiro-Wilk, soprattutto per i piccoli insiemi di dati.
- Test di Anderson-Darling: è buono con tutte le dimensioni del campione e ha una maggiore sensibilità nelle code (estremi) della distribuzione, mentre è più potente per rilevare gli scostamenti dalla normalità negli estremi.
Come eseguire il test di normalità di Shapiro-Wilk
1. Calcolare o calcolare la statistica del test di Shapiro-Wilk (W): [latex]W = \frac{{left(\sum_{i=1}^{n} a_i x_{(i)}\right)^2}{\sum_{i=1}^{n} (x_i - \bar{x})^2}[/latex] Nota: il calcolo dei coefficienti [latex]a_i[/latex] non è banale e richiede generalmente una tabella o un algoritmo, motivo per cui il test di Shapiro-Wilk viene quasi sempre calcolato da software come R, Python's SciPy, MS Excel componenti aggiuntivi o altri software dedicati. Per un calcolo manuale, questa pagina fornisce tutti i coefficienti [latex]a_i[/latex] e i p-value per campioni fino a 50. Il valore di W è compreso tra 0 e 1 (W = 1: perfetta normalità. W < 1: più si allontana da 1, meno normali sono i dati). 2. W non è sufficiente. Per ottenere il livello di confidenza, il valore di W è associato al valore di p corrispondente. Nella tabella di Shapiro-Wilk, a la riga della dimensione del campione n, cercare il valore più vicino alla W calcolata e ottenere il suo valore corrispondente. p-value in alto | Il numeratore rappresenta la somma quadratica dei valori del campione ordinato ponderato. Il denominatore è la somma degli scarti quadratici dalla media del campione (cioè la varianza del campione, scalata da (n-1)). [latex]x_{(i)}[/latex] = statistica di ordine i-esimo (cioè, l'i-esimo valore più piccolo del campione) [latex]x_i[/latex] = l'i-esimo valore osservato [latex]\bar{x}[/latex] = media del campione [latex]a_i[/latex] = costanti (pesi) calcolate dalla media, dalla varianza e dalla covarianza delle statistiche d'ordine di un campione da una distribuzione normale standard ((N(0,1)), e dipendono solo da n (dimensione del campione). n = dimensione del campione |
3. Risultato: if the p-value is greater than the chosen alpha-level (example 0.05), there is statistical evidence that the data tested are normally distributed. |
Per i test di normalità, si consiglia spesso di combinare un metodo numerico con un metodo grafico, come la linea di Henry, i diagrammi Q-Q o gli istogrammi:
Attenzione alle distribuzioni non normali!
Sebbene la distribuzione normale/gaussiana sia il caso più frequente, non deve essere assunta automaticamente. Tra i controesempi quotidiani vi sono:
- Distribuzione della ricchezza e del reddito tra gli individui. Segue una distribuzione di Pareto (legge di potenza), con una "coda lunga" di individui molto ricchi.
- Le dimensioni della popolazione di un Paese seguono la legge di Zipf (legge di potenza), con poche città molto grandi e molti piccoli centri.
- La magnitudo e la frequenza dei terremoti sono una distribuzione a legge di potenza/Gutenberg-Richter: i terremoti piccoli sono comuni, quelli grandi sono rari.
- Variazioni giornaliere dei prezzi o dei rendimenti nei mercati finanziari: distribuzioni a coda grassa/coda pesante, non gaussiane; grandi deviazioni si verificano più frequentemente di quanto previsto da una distribuzione normale.
- La frequenza delle parole nel linguaggio, come la popolazione cittadina di cui sopra, segue la legge di Zipf (legge di potenza): Poche parole sono usate spesso, la maggior parte delle parole sono rare.
- Traffico internet/popolarità del sito: legge di potenza/coda lunga: Alcuni siti hanno milioni di visite, la maggior parte ne ha pochissime.
- Dimensioni dei file sui sistemi informatici: log-normale o legge di potenza, con pochi file molto grandi e molti piccoli.
- Durata della vita umana e longevità: con distribuzione a destra (si può modellizzare con Weibull o distribuzioni di Gompertz), non normale; più persone muoiono in età più avanzata.
- Le connessioni dei social network seguono una legge di potenza: pochi utenti hanno molte connessioni, la maggior parte ne ha poche.
La maggior parte di questi è caratterizzata da "pochi grandi, molti piccoli", una firma di leggi di potenza, code pesanti, distribuzioni esponenziali o log-normali e non la forma simmetrica della gaussiana.
Il test t (test t di Student)
Il test t (noto anche come "t di Student"), sviluppato da William Sealy Gosset con lo pseudonimo di "Student" nel 1908, è un test statistico utilizzato per confrontare le medie quando le dimensioni del campione sono piccole e la varianza della popolazione è sconosciuta. Concentrandosi sul confronto delle medie di due popolazioni, è uno dei test più utilizzati nel settore manifatturiero.

Scopo:the t-Test helps engineers and quality professionals determine if there is a statistically significant difference between the means of two groups...
You have read 32% of the article. The rest is for our community. Already a member? Accedi
(e anche per proteggere i nostri contenuti originali dai bot di scraping)
Comunità Innovazione.mondo
Accedi o registrati (100% free)
Visualizza il resto di questo articolo e tutti i contenuti e gli strumenti riservati ai soci.
Solo veri ingegneri, produttori, designer, professionisti del marketing.
Nessun bot, nessun hater, nessuno spammer.
Lettura interessante! Ma i test parametrici come il t-test non sono potenzialmente fuorvianti in caso di distribuzioni non normali? Mi piacerebbe sentire il suo parere!
Certo, ma anche i test non parametrici hanno qualche difetto.
Post correlati
Use or Abuse 25 Cognitive Biases in Product Design and Manufacturing
Equazione di sollevamento NIOSH rivista nell'ergonomia della panca
Dark Web vs Darknet vs Deep Web: 101 e altro
Ultime pubblicazioni e brevetti sugli automi cellulari
Strumenti Darknet per l'ingegneria e la scienza
101 consigli su come leggere al meglio un brevetto (per chi non è un avvocato specializzato in brevetti)