Casa » I 6 test statistici indispensabili per la qualità e l'ingegneria

I 6 test statistici indispensabili per la qualità e l'ingegneria

test statistici per la qualità e l'ingegneria

I test statistici sono l'unico modo in cui la qualità e la produzione possono fornire prove oggettive per il processo decisionale. Aiutano a identificare le variazioni nei processi e a distinguere tra fluttuazioni casuali e problemi reali. In ingegneria, le statistiche aiutano a identificare schemi, anomalie e fonti di fallimento nelle prestazioni del sistema, garantendo un processo decisionale basato sui dati. Analizzando rigorosamente i risultati sperimentali, gli ingegneri possono convalidare i progetti dei prodotti e i processi di produzione, individuando potenziali problemi prima dell'implementazione. Questo approccio sistematico riduce il rischio di guasti imprevisti e migliora la sicurezza generale, garantendo l'affidabilità e la conformità alle norme di sicurezza internazionali. standard.

In questo articolo verranno esaminati i principali test statistici utilizzati nella produzione e nella gestione della qualità totale (TQM).

Nota: poiché riguardano anche l'ingegneria, la ricerca e la scienza, i seguenti 2 test statistici e analisi

  • analisi di correlazione: misura la forza e la direzione della relazione tra due variabili (ad esempio, il coefficiente di correlazione di Pearson).
  • analisi di regressione: esamina la relazione tra variabili (ad esempio, fattori di input e output del processo), dalla semplice regressione lineare a quella multipla.

non sono inclusi qui, ma in un articolo specifico sui principali 10 algoritmi per l'ingegneria.

Test di normalità

Un ambiente di laboratorio ben illuminato, con una scrivania che espone varie attrezzature scientifiche: becher, pipette e un microscopio. Al centro, una lavagna mostra un chiaro processo di verifica delle ipotesi passo dopo passo, con equazioni e diagrammi che ne spiegano i fondamenti. Sullo sfondo si trova uno scaffale pieno di manuali tecnici e letteratura specifica del settore, che trasmette un'atmosfera di rigore accademico e attenzione ai dettagli. L'atmosfera generale è quella dell'indagine scientifica e della risoluzione dei problemi, con un'attenzione particolare all'approccio sistematico al controllo di qualità.
Elencare i test statistici più utilizzati per la qualità e l'ingegneria.

Nel mondo dei test statistici, molti metodi statistici comuni (t-test, ANOVA, regressione lineare, ecc.) presuppongono che i dati siano distribuiti in modo normale/gaussiano (o che i residui/errori siano normali). La violazione di questo assunto può rendere i risultati inaffidabili: i valori di p possono essere fuorvianti, gli intervalli di confidenza possono essere errati e il rischio di errori di tipo I/II aumenta. Si noti che alcuni test, come l'ANOVA a 1 via, possono gestire ragionevolmente bene una distribuzione non normale.

Nota: se i dati non sono normali (si vedano i casi reali riportati di seguito), potrebbe essere necessario utilizzare test non parametrici (come il test U di Mann-Whitney o il test Kruskal-Wallis), che non presuppongono la normalità, o trasformare i dati, operazioni che esulano dallo scopo di questo post.

Sebbene esistano diversi test statistici a questo proposito, qui descriveremo in dettaglio il test di Shapiro-Wilk, famoso soprattutto per le piccole dimensioni del campione, tipicamente n < 50, ma che può essere utilizzato fino a 2000.

Per vostra informazione, altri test di normalità comuni:

    • Test di Kolmogorov-Smirnov (K-S) (con correzione di Lilliefors): funziona meglio con campioni di dimensioni maggiori, ma è meno sensibile di Shapiro-Wilk, soprattutto per i piccoli insiemi di dati.
    • Test di Anderson-Darling: è buono con tutte le dimensioni del campione e ha una maggiore sensibilità nelle code (estremi) della distribuzione, mentre è più potente per rilevare gli scostamenti dalla normalità negli estremi.

Come eseguire il test di normalità di Shapiro-Wilk

1. Calcolare o calcolare la statistica del test di Shapiro-Wilk (W):

[latex]W = \frac{\left(\sum_{i=1}^{n} a_i x_{(i)}\right)^2}{\sum_{i=1}^{n} (x_i - \bar{x})^2}[/latex]

Nota: il calcolo dei coefficienti [latex]a_i[/latex] non è banale e richiede generalmente una tabella o un algoritmo, motivo per cui il test di Shapiro-Wilk viene quasi sempre calcolato da software come R, Python's SciPy, MS Excel componenti aggiuntivi o altri software dedicati. Per un calcolo manuale, questa pagina fornisce tutti i coefficienti [latex]a_i[/latex] e i p-value per campioni fino a 50.

Il valore di W è compreso tra 0 e 1 (W = 1: perfetta normalità. W < 1: più si allontana da 1, meno normali sono i dati).

2. W non è sufficiente. Per ottenere il livello di confidenza, il valore di W è associato al valore di p corrispondente. Nella tabella di Shapiro-Wilk, a la riga della dimensione del campione n, cercare il valore più vicino alla W calcolata e ottenere il suo valore corrispondente. p-value in alto

Il numeratore rappresenta la somma quadratica dei valori del campione ordinato ponderato.

Il denominatore è la somma degli scarti quadratici dalla media del campione (cioè la varianza del campione, scalata da (n-1)).

[latex]x_{(i)}[/latex] = statistica di ordine i-esimo (cioè, l'i-esimo valore più piccolo del campione)

[latex]x_i[/latex] = l'i-esimo valore osservato

[latex]\bar{x}[/latex] = media del campione

[latex]a_i[/latex] = costanti (pesi) calcolate dalla media, dalla varianza e dalla covarianza delle statistiche d'ordine di un campione da una distribuzione normale standard ((N(0,1)), e dipendono solo da n (dimensione del campione).

n = dimensione del campione

3. Risultato: se il valore p è superiore al livello alfa prescelto (ad esempio 0,05), vi è evidenza statistica che i dati testati sono distribuiti normalmente.

Per i test di normalità, si consiglia spesso di combinare un metodo numerico con un metodo grafico, come la linea di Henry, i diagrammi Q-Q o gli istogrammi:

Attenzione alle distribuzioni non normali!

Sebbene la distribuzione normale/gaussiana sia il caso più frequente, non deve essere assunta automaticamente. Tra i controesempi quotidiani vi sono:

  • Distribuzione della ricchezza e del reddito tra gli individui. Segue una distribuzione di Pareto (legge di potenza), con una "coda lunga" di individui molto ricchi.
  • Le dimensioni della popolazione di un Paese seguono la legge di Zipf (legge di potenza), con poche città molto grandi e molti piccoli centri.
  • La magnitudo e la frequenza dei terremoti sono una distribuzione a legge di potenza/Gutenberg-Richter: i terremoti piccoli sono comuni, quelli grandi sono rari.
  • Variazioni giornaliere dei prezzi o dei rendimenti nei mercati finanziari: distribuzioni a coda grassa/coda pesante, non gaussiane; grandi deviazioni si verificano più frequentemente di quanto previsto da una distribuzione normale.
  • La frequenza delle parole nel linguaggio, come la popolazione cittadina di cui sopra, segue la legge di Zipf (legge di potenza): Poche parole sono usate spesso, la maggior parte delle parole sono rare.
  • Traffico internet/popolarità del sito: legge di potenza/coda lunga: Alcuni siti hanno milioni di visite, la maggior parte ne ha pochissime.
  • Dimensioni dei file sui sistemi informatici: log-normale o legge di potenza, con pochi file molto grandi e molti piccoli.
  • Durata della vita umana e longevità: con distribuzione a destra (si può modellizzare con Weibull o distribuzioni di Gompertz), non normale; più persone muoiono in età più avanzata.
  • Le connessioni dei social network seguono una legge di potenza: pochi utenti hanno molte connessioni, la maggior parte ne ha poche.

La maggior parte di questi è caratterizzata da "pochi grandi, molti piccoli", una firma di leggi di potenza, code pesanti, distribuzioni esponenziali o log-normali e non la forma simmetrica della gaussiana.

 

Il test t (test t di Student)

Il test t (noto anche come "t di Student"), sviluppato da William Sealy Gosset con lo pseudonimo di "Student" nel 1908, è un test statistico utilizzato per confrontare le medie quando le dimensioni del campione sono piccole e la varianza della popolazione è sconosciuta. Concentrandosi sul confronto delle medie di due popolazioni, è uno dei test più utilizzati nel settore manifatturiero.

Un laboratorio meticolosamente realizzato, con una serie di strumenti scientifici e apparecchiature di prova disposti su un banco di lavoro elegante e moderno. Becher, provette e display digitali proiettano una luce soffusa e ambientale, illuminata da una precisa illuminazione direzionale proveniente dall'alto. In primo piano, sullo schermo di un computer è aperto un programma di analisi statistica che visualizza grafici e diagrammi complessi. Al centro, un ingegnere in camice bianco registra con cura i dati, mentre sullo sfondo si trova una parete di diagrammi tecnici e schemi ingegneristici. L'atmosfera generale trasmette un senso di rigore analitico, competenza tecnica e impegno nel controllo della qualità.
Un laboratorio con una serie di strumenti scientifici che eseguono test statistici.

Scopo:the t-Test helps engineers and quality professionals determine if there is a statistically significant difference between the means of two groups...

Comunità Innovazione.mondo

Accedi o registrati (100% free)

Visualizza il resto di questo articolo e tutti i contenuti e gli strumenti riservati ai soci.

Solo veri ingegneri, produttori, designer, professionisti del marketing.
Nessun bot, nessun hater, nessuno spammer.

Sommario
    إضافة رأس لبدء إنشاء جدول المحتويات

    SFIDA DI DESIGN o DI PROGETTO?
    Ingegnere meccanico, responsabile di progetto o di ricerca e sviluppo
    Sviluppo efficace del prodotto

    Disponibile per una nuova sfida con breve preavviso in Francia e Svizzera.
    Contattami su LinkedIn
    Prodotti in plastica e metallo, Design-to-cost, Ergonomia, Volume medio-alto, Settori regolamentati, CE e FDA, CAD, Solidworks, Lean Sigma Black Belt, ISO 13485 Classe II e III

    Stiamo cercando un nuovo sponsor

     

    La vostra azienda o istituzione si occupa di tecnica, scienza o ricerca?
    > inviaci un messaggio <

    Ricevi tutti i nuovi articoli
    Gratuito, no spam, email non distribuita né rivenduta

    oppure puoi ottenere la tua iscrizione completa -gratuitamente- per accedere a tutti i contenuti riservati >Qui<

    Argomenti trattati: test statistici, gestione della qualità, processi produttivi, prove oggettive, processo decisionale, test di normalità, test di Shapiro-Wilk, test non parametrici, valore p, errore di tipo I, errore di tipo II, data-driven, analisi di regressione, analisi di correlazione, Total Quality Management (TQM), ANOVA, affidabilità, ISO 9001, ISO 25010, ISO 31000, ISO 9000 e ISO 17025.

    1. Brennan

      Lettura interessante! Ma i test parametrici come il t-test non sono potenzialmente fuorvianti in caso di distribuzioni non normali? Mi piacerebbe sentire il suo parere!

      1. Fabrice

        Certo, ma anche i test non parametrici hanno qualche difetto.

    Lascia un commento

    Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

    Post correlati

    Torna in alto

    Potrebbe anche piacerti