innovation.world

Product Design, Manufacturing & Innovation Resources

Maison » Conception de Produits » Méthodologies » Les 6 tests statistiques incontournables pour la qualité et l'ingénierie

Les 6 tests statistiques incontournables pour la qualité et l'ingénierie

Production allégée, Amélioration des processus, Optimisation des processus, Assurance qualité, Contrôle de qualité, Gestion de la qualité, Six Sigma, Statistical Analysis, Tests statistiques

Dans le domaine de la qualité et de la fabrication, les tests statistiques sont le seul moyen de fournir des preuves objectives pour la prise de décision. Ils permettent d'identifier les variations dans les processus et de distinguer les fluctuations aléatoires des problèmes réels. Dans le domaine de l'ingénierie, les statistiques permettent d'identifier les modèles, les valeurs aberrantes et les sources de défaillance dans les performances des systèmes, garantissant ainsi une prise de décision fondée sur des données. En analysant rigoureusement les résultats expérimentaux, les ingénieurs peuvent valider les conceptions de produits et les processus de fabrication, en détectant les problèmes potentiels avant leur mise en œuvre. Cette approche systématique réduit le risque de défaillances inattendues et améliore la sécurité générale en garantissant la fiabilité et la conformité aux normes de sécurité internationales. normes.

Ce billet passe en revue les principaux tests statistiques utilisés dans l'industrie manufacturière et dans le secteur de la santé. Gestion de la qualité totale (TQM).

Note : étant donné qu'ils concernent également l'ingénierie, la recherche et la science, les 2 tests et analyses statistiques suivants

l'analyse des corrélations : measures the strength and direction of the relationship between two variables (e.g., Pearson correlation coefficient).
l'analyse de régression : examine la relation entre les variables (par exemple, les facteurs d'entrée et les résultats du processus), de la simple régression linéaire à la régression multiple.

ne sont pas inclus ici mais dans un article spécifique sur les 10 principaux algorithmes pour l'ingénierie.

Tests de normalité

Un laboratoire bien éclairé, avec un bureau présentant divers équipements scientifiques - béchers, pipettes et microscope. Au centre, un tableau blanc présente un processus clair de test d'hypothèse, étape par étape, avec des équations et des diagrammes expliquant les principes fondamentaux. À l'arrière-plan, une étagère remplie de manuels techniques et d'ouvrages spécifiques à l'industrie dégage une atmosphère de rigueur académique et d'attention aux détails. L'ambiance générale est à la recherche scientifique et à la résolution de problèmes, l'accent étant mis sur l'approche systématique du contrôle de la qualité. — Énumérer les tests statistiques les plus utilisés dans le domaine de la qualité et de l'ingénierie.

Dans le monde des tests statistiques, de nombreuses méthodes statistiques courantes (tests t, ANOVA, régression linéaire, etc.) supposent que les données sont distribuées de façon normale/gaussienne (ou que les résidus/erreurs sont normaux). La violation de cette hypothèse peut rendre les résultats peu fiables : les valeurs p peuvent être trompeuses, les intervalles de confiance peuvent être erronés et le risque d'erreurs de type I/II augmente. Notez que certains tests, comme l'ANOVA à une voie, peuvent raisonnablement bien gérer une distribution non normale.

Remarque : si vos données ne sont pas normales (voir les cas réels ci-dessous), vous devrez peut-être utiliser des tests non paramétriques (comme le test U de Mann-Whitney ou le test de Kruskal-Wallis), qui ne supposent pas la normalité, ou transformer vos données, ce qui n'entre pas dans le cadre de cet article.

Bien qu'il existe plusieurs tests statistiques pour cela, nous détaillerons ici le test de Shapiro-Wilk, célèbre surtout pour les échantillons de petite taille, typiquement n < 50, mais qui peut être utilisé jusqu'à 2000.

Pour information, il existe d'autres tests de normalité courants :

- Test de Kolmogorov-Smirnov (K-S) (avec correction de Lilliefors) : fonctionne mieux avec des tailles d'échantillons plus importantes tout en étant moins sensible que le test de Shapiro-Wilk, en particulier pour les petits ensembles de données.
- Test d'Anderson-Darling : il est efficace pour toutes les tailles d'échantillons et est plus sensible dans les queues (extrêmes) de la distribution tout en étant plus puissant pour détecter les écarts par rapport à la normalité dans les extrêmes.

Comment effectuer le test de normalité de Shapiro-Wilk ?

1. Calculez la statistique du test de Shapiro-Wilk (W) :

[latex]W = \frac{\left(\sum_{i=1}^{n} a_i x_{(i)}\right)^2}{\sum_{i=1}^{n} (x_i - \bar{x})^2}[/latex]

Note : le calcul des coefficients [latex]a_i[/latex] n'étant pas trivial et nécessitant généralement une table ou un algorithme, le test de Shapiro-Wilk est presque toujours calculé par des logiciels tels que R, SciPy de Python, MS Excel ou d'autres logiciels dédiés. Pour un calcul manuel, cette page fournit tous les coefficients [latex]a_i[/latex] et la valeur p pour les échantillons jusqu'à 50.

La valeur de W est comprise entre 0 et 1 (W = 1 : normalité parfaite. W < 1 : plus il s'éloigne de 1, moins les données sont normales).

2. W ne suffit pas. Il est associé à la valeur p correspondante pour obtenir le niveau de confiance. Dans le tableau de Shapiro-Wilk, à la ligne de la taille de l'échantillon n, recherchez la valeur la plus proche de votre W calculé et obtenez la valeur correspondante. Valeur p en haut

Le numérateur représente la somme quadratique des valeurs de l'échantillon ordonné pondéré.

Le dénominateur est la somme des écarts au carré par rapport à la moyenne de l'échantillon (c'est-à-dire la variance de l'échantillon, échelonnée par (n-1)).

[latex]x_{(i)}[/latex] = la statistique d'ordre i (c'est-à-dire la i-ième valeur la plus petite de l'échantillon)

[latex]x_i[/latex] = la i-ième valeur observée

[latex]\bar{x}[/latex] = la moyenne de l'échantillon

[latex]a_i[/latex] = constantes (poids) calculées à partir de la moyenne, des variances et des covariances des statistiques d'ordre d'un échantillon issu d'une distribution normale standard ((N(0,1))), et ne dépendant que de n (taille de l'échantillon).

n = taille de l'échantillon

3. Résultat : si la valeur p est supérieure au niveau alpha choisi (par exemple 0,05), il existe une preuve statistique que les données testées sont normalement distribuées.

Pour les tests de normalité, il est souvent conseillé de combiner une méthode numérique avec une méthode graphique telle que la ligne de Henry, les diagrammes Q-Q ou les histogrammes :

Attention aux distributions non normales !

Bien que la distribution normale/gaussienne soit le cas le plus fréquent, elle ne doit pas être automatiquement présumée. Parmi les contre-exemples quotidiens, on peut citer

Répartition de la richesse et des revenus entre les individus. Elle suit une distribution de Pareto (loi de puissance), asymétrique avec une "longue queue" d'individus très riches.
La taille de la population des villes d'un pays suit la loi de Zipf (loi de puissance), avec quelques très grandes villes et de nombreuses petites villes.
La magnitude et la fréquence des tremblements de terre correspondent à une loi de puissance/Gutenberg-Richter : les petits tremblements de terre sont fréquents, les grands sont rares.
Variations quotidiennes des prix ou des rendements sur les marchés financiers : distributions à queue épaisse/grande, non gaussiennes ; les écarts importants sont plus fréquents que ce que prévoyait une distribution normale.
La fréquence des mots dans la langue, comme la population de la ville ci-dessus, suit une loi de Zipf (loi de puissance) : Peu de mots sont utilisés souvent, la plupart des mots sont rares.
Trafic Internet/popularité des sites web : loi de puissance/longue traîne : Certains sites ont des millions de visites, la plupart en ont très peu.
Taille des fichiers sur les systèmes informatiques : log-normale ou loi de puissance, avec quelques très gros fichiers et beaucoup de petits.
Durée de vie/longévité humaine : asymétrique à droite (peut être modélisée avec Weibull ou de Gompertz), et non normale ; davantage de personnes meurent à des âges plus avancés.
Les connexions sur les réseaux sociaux suivent une loi de puissance : peu d'utilisateurs ont beaucoup de connexions, la plupart en ont peu.

La plupart d'entre elles se caractérisent par "peu de grands, beaucoup de petits", une signature de lois de puissance, de queues lourdes, de distributions exponentielles ou log-normales, et non par la forme symétrique de la gaussienne.

Le test t (test t de Student)

Le test t (alias "t de Student"), mis au point par William Sealy Gosset sous le pseudonyme de "Student" en 1908, est un test statistique utilisé pour comparer des moyennes lorsque la taille des échantillons est faible et que la variance de la population est inconnue. Axé sur la comparaison des moyennes de deux populations, c'est l'un des tests les plus utilisés dans le domaine de la fabrication.

Un laboratoire méticuleusement conçu, avec un ensemble d'instruments scientifiques et de matériel d'essai disposés sur une table de travail moderne et élégante. Les béchers, les éprouvettes et les écrans numériques diffusent une douce lueur ambiante, éclairée par un éclairage précis et directionnel provenant du plafond. Au premier plan, un programme d'analyse statistique est ouvert sur un écran d'ordinateur, affichant des graphiques et des tableaux complexes. Au milieu, un ingénieur en blouse blanche enregistre soigneusement des données, tandis que l'arrière-plan présente un mur de diagrammes techniques et de schémas d'ingénierie. L'atmosphère générale transmet un sentiment de rigueur analytique, d'expertise technique et d'engagement en faveur du contrôle de la qualité. — Un laboratoire équipé d'un ensemble d'instruments scientifiques permettant d'effectuer des tests statistiques.

Objet : Le test t aide les ingénieurs et les professionnels de la qualité à déterminer s'il existe une différence statistiquement significative entre les moyennes de deux groupes ou entre la moyenne d'un échantillon et une norme connue. Il est couramment utilisé dans les tests d'hypothèse pour évaluer si des changements de processus ou des modifications de produits ont eu un impact sur la qualité des produits. dirigé des améliorations ou des différences réelles, au-delà de ce qui pourrait être attendu par hasard.

Exemples pratiques dans l'industrie :

Dans la construction automobile, un test t peut être utilisé pour comparer la résistance à la traction de l'acier provenant de deux fournisseurs différents afin de garantir une qualité constante.
Dans le domaine pharmaceutique, le test t est utilisé pour analyser si un nouveau processus de production permet d'obtenir des comprimés dont le poids moyen est significativement différent de la norme.
In electronics, engineers may use the t-Test to verify if a modification de la conception in a carte de circuit imprimé se traduit par une amélioration mesurable de la résistance électrique.

Comment réaliser le test t de Student

Il existe de nombreuses variantes du test t ; l'exemple qui suit se concentre sur le "test t à deux échantillons" dans sa version "non appariée", qui compare les échantillonnages de deux lots de production différents.

Énoncez votre hypothèse nulle et votre hypothèse alternative ; dans cet exemple, "il n'y a pas de différence entre les moyennes" ou "il y a des différences".
Recueillez les données des deux lots de production comparés et calculez
- les 2 moyennes de l'échantillon [latex]\bar{X} = \frac{1}{n_1} \sum_{i=1}^{n_1} X_i[/latex] et [latex]\bar{Y} = \frac{1}{n_2} \sum_{j=1}^{n_2} Y_j[/latex]
- Calculer les deux variances d'échantillon : [latex]S_X^2 = \frac{1}{n_1-1} \sum_{i=1}^{n_1} (X_i - \bar{X})^2[/latex] et [latex]S_Y^2 = \frac{1}{n_2-1} \sum_{j=1}^{n_2} (Y_j - \bar{Y})^2[/latex]
- la taille des échantillons.
Calculer la statistique du test. Bien que la méthode suppose que les deux échantillons sont indépendants et que les deux échantillons proviennent de populations normalement distribuées, il existe encore deux cas :
- si l'on suppose des variances égales (test t "groupé") : Variance groupée : [latex]S_p^2 = \frac{ (n_1-1)S_X^2 + (n_2-1)S_Y^2 }{ n_1 + n_2 - 2 }[/latex]
  Statistique de test : [latex]t = \frac{ \bar{X} - \bar{Y} }{ S_p \sqrt{ \frac{1}{n_1} + \frac{1}{n_2} } }[/latex]
- si variances inégales (test t de Welch) : Statistique de test : [latex]t = \frac{ \bar{X} - \bar{Y} }{ \sqrt{ \frac{S_X^2}{n_1} + \frac{S_Y^2}{n_2} } }[/latex] Degrés de liberté (approximatifs, Welch-Satterthwaite) : [latex]df = \frac{\left( \frac{S_X^2}{n_1} + \frac{S_Y^2}{n_2} \right)^2}{ \frac{ (S_X^2 / n_1)^2 }{ n_1 - 1 } + \frac{ (S_Y^2 / n_2)^2 }{ n_2 - 1 } }[/latex]
Utilisez la valeur calculée ( t ) et les degrés de liberté ([latex]n_1+n_2-2[/latex] pour des variances égales, ou la formule de Welch) pour rechercher ou calculer la valeur p de la distribution t (selon qu'il s'agit d'un test unilatéral ou bilatéral).
Résultat : comparez la valeur t calculée à la valeur t critique à partir de tableaux statistiques basés sur le niveau de confiance et les degrés de liberté que vous avez choisis ; vous pouvez également utiliser un logiciel pour la valeur p. Si la statistique t dépasse la valeur critique ou si la valeur p est inférieure à votre seuil (généralement 0,05), rejetez l'hypothèse nulle.

Lien vers le tableau des valeurs critiques du test t

🔒

The rest of this article is reserved for members

To limit scraping bots (currently 40,000 hits per day!),
we had to restrict access to full articles and tools to registered members only.

Log in → or Register (100% free) →

to access all the rest.

Sujets abordés : tests statistiques, gestion de la qualité, processus de fabrication, preuves objectives, prise de décision, tests de normalité, test de Shapiro-Wilk, tests non paramétriques, valeur p, erreur de type I, erreur de type II, axés sur les données, analyse de régression, analyse de corrélation, gestion de la qualité totale (TQM), ANOVA, fiabilité, ISO 9001, ISO 25010, ISO 31000, ISO 9000 et ISO 17025.

Contexte historique

Ingénieur réseau analysant l'architecture en couches TCP/IP dans un environnement de bureau moderne.

Architecture en couches TCP/IP

L'architecture de la suite de protocoles Internet repose sur un modèle conceptuel qui divise les fonctions de communication en quatre couches d'abstraction : la couche liaison, la couche Internet, la couche transport et la couche application. Cette approche en couches simplifie la conception et le développement des protocoles, chaque couche gérant des tâches spécifiques et interagissant uniquement avec les couches immédiatement supérieures et inférieures.

Centre d'opérations réseau présentant la gestion du protocole Internet et le routage des données.

Protocole Internet (IP)

Le protocole Internet (IP) est le principal protocole de communication de la couche Internet pour relayer les datagrammes au-delà des frontières du réseau. Sa fonction principale est de transmettre les paquets d'un hôte source à un hôte de destination en fonction de leurs adresses IP. IP est un protocole sans connexion qui offre un service de distribution au mieux, ce qui signifie qu'il ne garantit ni la livraison, ni l'ordre, ni l'intégrité des données.

Caverne de sel souterraine pour le stockage d'énergie par air comprimé dans des applications thermodynamiques.

Stockage d'énergie par air comprimé (CAES)

Le stockage d'énergie par air comprimé (CAES) est une méthode permettant de stocker l'énergie produite à un moment donné pour une utilisation ultérieure. À l'échelle industrielle, l'énergie est stockée en comprimant l'air et en le stockant dans un réservoir souterrain, comme une caverne de sel. Lorsqu'une source d'électricité est nécessaire, l'air sous pression est chauffé et détendu dans une turbine, entraînant ainsi un générateur.

Collaboration d'équipe lors d'une réunion de gestion de la qualité totale axée sur l'amélioration des processus.

Gestion de la qualité totale (TQM)

La gestion de la qualité totale (GQT) est une philosophie de gestion où tous les membres d'une organisation participent à l'amélioration des processus, des produits, des services et de la culture d'entreprise. Son objectif est la réussite à long terme grâce à la satisfaction client. La GQT intègre la discipline qualité à la culture et aux activités de l'entreprise, allant au-delà de la simple inspection des produits pour adopter une approche globale à l'échelle de l'organisation.

Ligne de production industrielle avec des ingénieurs gérant les défis du Takt time dans la fabrication.

Défis de mise en œuvre du Takt Time

Une mise en œuvre réussie du Takt Time nécessite un environnement de production hautement stable. Les défis courants incluent la gestion des arrêts machines, la garantie d'une qualité constante pour éviter les reprises et l'équilibrage des lignes produisant plusieurs produits aux contenus de travail différents (lignes mixtes). Sans prise en compte de ces sources de variabilité, un système piloté par le Takt peut être fragile et ne pas répondre à la demande de manière constante.

Procédé de soudage par transmission laser de composants thermoplastiques en technologie polymère.

Soudage par transmission laser des plastiques

Le soudage par transmission laser assemble deux pièces thermoplastiques superposées en faisant passer un faisceau laser à travers une partie supérieure, transmettant le rayonnement laser, vers une partie inférieure, absorbant le rayonnement laser. L'énergie laser absorbée chauffe et fait fondre l'interface. La pression de serrage fusionne les couches fondues et, après refroidissement, une soudure solide et nette se forme. Cette méthode est précise, sans contact, et minimise les contraintes thermiques et la contamination particulaire.

Machine CNC avec système de contrôle en boucle fermée et dispositifs de rétroaction en automatisation.

Contrôle en boucle fermée dans les systèmes CNC

Les machines CNC de haute précision utilisent un système de contrôle en boucle fermée pour garantir leur précision. Ce système utilise des dispositifs de rétroaction, tels que des codeurs rotatifs sur les servomoteurs ou des règles linéaires sur les axes de la machine, pour surveiller en continu la position réelle de la machine. Le contrôleur compare ce retour d'information en temps réel à la position programmée et corrige immédiatement les erreurs.

1974

1974

1978

1980

1980

1980

1980

1972

1974

1975-06-01

1980

1980

1980

1980

1980

Réunion de prise de décision B2B avec des rôles divers dans un environnement de bureau moderne.

Le modèle du centre d'achat dans la prise de décision B2B

Le centre d'achat est un modèle représentant l'ensemble des individus et des groupes d'une organisation qui participent à une décision d'achat. Il ne s'agit pas d'une unité fixe, mais d'un ensemble de rôles assumés par différentes personnes pour différents achats. Ces rôles incluent : initiateurs, utilisateurs, influenceurs, décideurs, approbateurs, acheteurs et responsables, chacun ayant un impact sur la décision finale par sa fonction et son autorité spécifiques.

Poste de travail informatique analysant le protocole de contrôle de transmission dans un cadre professionnel.

Protocole de contrôle de transmission (TCP)

TCP est un protocole essentiel de la couche transport. Il assure la transmission fiable, ordonnée et vérifiée des flux d'octets entre les applications exécutées sur les hôtes. Ce protocole est orienté connexion, ce qui signifie qu'il établit une connexion via une négociation à trois voies avant le début du transfert de données. Cela garantit l'intégrité des données, mais au prix d'une surcharge plus importante que celle d'UDP.

Appareil électronique avec marque FCC pour la certification de compatibilité électromagnétique.

Marque FCC pour Compatibilité CEM

La marque FCC est une marque de certification utilisée sur les produits électroniques fabriqués ou vendus aux États-Unis. Elle indique que les interférences électromagnétiques (IEM) de l'appareil respectent les limites approuvées par la Commission fédérale des communications (FCC). Cette réglementation garantit que les appareils électroniques n'interfèrent pas avec les communications radio et autres équipements, préservant ainsi l'intégrité du spectre radioélectrique.

Bureau d'études en technologie industrielle avec ingénieurs optimisant les meubles en kit pour le montage.

Conception pour X (DFX)

Une méthodologie de conception où « X » représente un objectif spécifique du cycle de vie du produit. DFX englobe un ensemble de directives et de techniques visant à optimiser la conception d'un produit pour un objectif précis, tel que la fabricabilité (DFM), l'assemblage (DFA), la fiabilité (DFR) ou la durabilité (DfS). Cette approche proactive permet d'aborder les problèmes potentiels dès le début de la phase de conception, réduisant ainsi les coûts et améliorant la qualité.

Bureau d'ingénierie avec des ingénieurs collaborant sur l'échange de données CAO utilisant les formats IGES et STEP.

Échange de données CAO : IGES et STEP

Pour pallier l'incapacité des différents systèmes de CAO à partager des données, des formats de fichiers neutres ont été créés. La spécification initiale d'échange graphique (IGES), développée à la fin des années 1970, en était une première tentative. Elle a ensuite été remplacée par la norme STEP (norme ISO 10303 pour l'échange de données de modèles de produits), plus robuste et plus complète, capable de représenter des modèles 3D complets, la structure d'assemblage et les métadonnées.

Système de traitement écologique des eaux usées avec des écosystèmes diversifiés pour la purification de l'eau.

Machine vivante

Un système breveté de traitement écologique des eaux usées et de récupération des eaux, développé par le Dr John Todd, utilise divers écosystèmes, dont des bactéries, des algues, des plantes, des escargots et des poissons, dans des environnements contrôlés comme des bassins ou des serres, pour purifier l'eau. Ce système imite les processus naturels de purification des zones humides et autres écosystèmes aquatiques, mais dans un environnement artificiel intensifié.

Technicien effectuant un contrôle par ultrasons à faisceau progressif sur un composant métallique dans une usine.

Contrôle par ultrasons multiéléments (PAUT)

Le contrôle ultrasonore multiéléments (PAUT) utilise un transducteur multiéléments où chaque élément est pulsé indépendamment avec des temporisations précises calculées par ordinateur. Le contrôle de ce phasage permet d'orienter, de focaliser et de balayer électroniquement le faisceau ultrasonore obtenu sans déplacer physiquement la sonde. Cela permet une imagerie rapide et détaillée des défauts, notamment dans les géométries complexes, surpassant ainsi les techniques mono-élément conventionnelles.

Ingénieurs collaborant dans un laboratoire de réseaux informatiques sur les applications du protocole User Datagram Protocol.

Protocole de datagramme utilisateur (UDP)

Le protocole UDP (User Datagram Protocol) est un protocole de couche transport minimal et sans connexion. Il fournit un service de datagramme simple sans la fiabilité, l'ordonnancement ni les mécanismes de contrôle de flux de TCP. Ses principaux avantages sont une faible surcharge et une faible latence, ce qui le rend idéal pour les applications sensibles au temps, comme les recherches DNS, les jeux en ligne et le streaming vidéo en direct, où la vitesse prime sur une fiabilité parfaite.

(si la date est inconnue ou non pertinente, par exemple « mécanique des fluides », une estimation arrondie de son émergence notable est fournie)

Articles et publications les plus populaires

Marché

Le guide du dictateur pour la gestion du marché (ou l'art d'être à la fois joueur et arbitre)

Produit minimum viable

Produit minimum viable (MVP) : conseils de pro

Erreurs de conception de produits à éviter

Les 10 « meilleures » erreurs de conception à éviter

Principes mécaniques

90 principes mécaniques pour des solutions de conception astucieuses

toit géométrique

Les formes suivent la fonction… en particulier dans la conception de produits

Moins, c'est plus. Pourquoi concevoir simplement ?

Moins, c'est plus. Pourquoi concevoir simplement ?

Meilleurs outils originaux

Liste de proxys gratuits

Liste de proxys gratuits (mise à jour en continu)

$Éditeur de formules LaTeX$

Éditeur de formules LaTeX

Explorateur de concepts

Concept Explorer™ d'Innovation.world

Arbre de revue de conception™ (DRT)

Le Design Review Tree™ (DRT) : Revérifiez votre Conception de Produit

Recherche de brevets récents

Recherche gratuite des derniers brevets

Publications scientifiques

Recherche gratuite des dernières publications scientifiques