Product Design, Manufacturing & Innovation Resources
Hogar » Diseño de producto » Metodologías » Las 6 pruebas estadísticas imprescindibles para la calidad y la ingeniería

Las 6 pruebas estadísticas imprescindibles para la calidad y la ingeniería

pruebas estadísticas para la calidad y la ingeniería

Statistical tests are the only way in quality and manufacturing to provide objective evidence for decision-making. They help identify variations in processes and distinguish between random fluctuations and actual problems. In engineering, statistics help identify patterns, outliers, and sources of failure in system performance, ensuring data-driven decision-making. By rigorously analyzing experimental results, engineers can validate product designs and manufacturing processes, detecting potential problems before implementation. This systematic approach reduces the risk of unexpected failures and enhances overall safety by ensuring reliability and compliance with international safety estándares.

This post will review main statistical tests used in manufacturing and Gestión de la calidad total (TQM).

Nota: dado que también afectan a la ingeniería, la investigación y la ciencia, las 2 pruebas y análisis estadísticos siguientes

  • análisis de correlación: measures the strength and direction of the relationship between two variables (e.g., Pearson correlation coefficient).
  • análisis de regresión: examina la relación entre variables (por ejemplo, factores de entrada y resultados del proceso), desde la simple regresión lineal hasta la múltiple.

no se incluyen aquí, sino en un artículo específico sobre los 10 principales algoritmos para ingeniería.

Pruebas de normalidad

Un laboratorio bien iluminado, con una mesa en la que se exponen diversos equipos científicos: vasos de precipitados, pipetas y un microscopio. En el centro, una pizarra muestra un claro proceso de comprobación de hipótesis paso a paso, con ecuaciones y diagramas que explican los fundamentos. Al fondo, una estantería repleta de manuales técnicos y bibliografía específica del sector transmite una atmósfera de rigor académico y atención al detalle. El ambiente general es de investigación científica y resolución de problemas, con especial atención al enfoque sistemático del control de calidad.
Enumere las pruebas estadísticas más utilizadas para la calidad y la ingeniería.

En el mundo de las pruebas estadísticas, muchos métodos estadísticos comunes (pruebas t, ANOVA, regresión lineal, etc.) suponen que los datos tienen una distribución normal/gaussiana (o que los residuos/errores son normales). La violación de este supuesto puede hacer que los resultados no sean fiables: los valores p pueden ser engañosos, los intervalos de confianza pueden ser erróneos y el riesgo de errores de tipo I/II aumenta. Tenga en cuenta que algunas pruebas, como el ANOVA de 1 vía, pueden manejar razonablemente bien una distribución no normal.

Nota: si los datos no son normales (véanse los casos reales más abajo), es posible que tenga que utilizar pruebas no paramétricas (como la prueba U de Mann-Whitney o la prueba de Kruskal-Wallis), que no presuponen normalidad, o transformar los datos, lo que queda fuera del ámbito de este artículo.

Aunque existen varias pruebas estadísticas para ello, detallaremos aquí la prueba de Shapiro-Wilk, famosa sobre todo para muestras de pequeño tamaño, normalmente n < 50, pero que puede utilizarse hasta 2000.

Para su información, otras pruebas de normalidad habituales:

    • Prueba de Kolmogorov-Smirnov (K-S) (con corrección de Lilliefors): funciona mejor con muestras de mayor tamaño, aunque es menos sensible que la prueba de Shapiro-Wilk, especialmente para conjuntos de datos pequeños.
    • Prueba de Anderson-Darling: es buena con todos los tamaños de muestra y tiene más sensibilidad en las colas (extremos) de la distribución, al tiempo que es más potente para detectar desviaciones de la normalidad en los extremos.

Cómo realizar la prueba de normalidad de Shapiro-Wilk

1. Calcular o computar el estadístico de la prueba de Shapiro-Wilk (W):

\(W = \frac{\left(\sum_{i=1}^{n} a_i x_{(i)}\right)^2}{\sum_{i=1}^{n} (x_i – \bar{x})^2}\)

Note: as the calculation of the \(a_i\) coefficients is nontrivial and generally requires a table or algorithm, which is why the Shapiro-Wilk test is nearly always computed by software such as R, Python’s SciPy, MS Excel add-ons or other dedicated softwares. Para un cálculo manual, esta página provides all the \(a_i\) coefficients and p-value for samples up to 50.

El valor de W oscila entre 0 y 1 (W = 1: normalidad perfecta. W < 1: cuanto más se aleja de 1, menos normales son los datos).

2. W no es suficiente. Funciona junto con su correspondiente valor p para tener el nivel de confianza. En la tabla de Shapiro-Wilk, en la fila del tamaño de muestra n, busque el valor más cercano a su W calculado y obtenga su correspondiente Valor p en la parte superior

El numerador representa la suma al cuadrado de los valores de la muestra ordenada ponderada.

El denominador es la suma de las desviaciones al cuadrado de la media muestral (es decir, la varianza muestral, escalada por (n-1)).

\(x_{(i)}\) = the i-th order statistic (i.e., the i-th smallest value in the sample)

\(x_i\) = the i-th observed value

\(\bar{x}\) = the sample mean

\(a_i\) = constants (weights) calculated from the mean, variances, and covariances of the order statistics of a sample from a standard normal distribution ((N(0,1))), and depend only on n (sample size).

n = tamaño de la muestra

3. Resultado: if the p-value is greater than the chosen alpha-level (example 0.05), there is statistical evidence that the data tested are normally distributed.

Para comprobar la normalidad, a menudo se aconseja combinar un método numérico con un método gráfico como la línea de Henry, los gráficos Q-Q o los histogramas :

Cuidado con las distribuciones no normales

Aunque la distribución normal/gaussiana es el caso más frecuente, no debe asumirse automáticamente. Entre los contraejemplos cotidianos se encuentran:

  • Distribución de la riqueza y la renta entre los individuos. Sigue una distribución de Pareto (ley de la potencia), sesgada con una "larga cola" de individuos muy ricos.
  • El tamaño de la población de un país sigue la Ley de Zipf (ley de potencias), con unas pocas ciudades muy grandes y muchos pueblos pequeños.
  • Las magnitudes y la frecuencia de los terremotos siguen una distribución de ley de potencia/Gutenberg-Richter: los terremotos pequeños son frecuentes, los grandes son raros.
  • Variaciones diarias de precios o rendimientos en los mercados financieros: distribuciones de cola gruesa/alta, no gaussianas; las grandes desviaciones se producen con más frecuencia de lo previsto por una distribución normal.
  • Las frecuencias de palabras en el lenguaje, como la población de la ciudad anterior, sigue una Ley de Zipf (ley de potencia): Pocas palabras se usan a menudo, la mayoría son raras.
  • Tráfico en Internet/popularidad de los sitios web: ley de potencia/cola larga: Algunos sitios tienen millones de visitas, la mayoría muy pocas.
  • Tamaño de los archivos en los sistemas informáticos: log-normal o ley de potencia, con unos pocos archivos muy grandes y muchos pequeños.
  • Esperanza de vida/longevidad humana: asimétrica a la derecha (puede modelarse con Weibull o Gompertz), no normales; muere más gente a edades más avanzadas.
  • Las conexiones de las redes sociales siguen una ley de potencia: pocos usuarios tienen muchas conexiones; la mayoría, pocas.

La mayoría de ellas se caracterizan por "pocos grandes, muchos pequeños", una firma de leyes de potencia, colas pesadas, distribuciones exponenciales o log-normales, y no la forma simétrica de la gaussiana.

 

La prueba t (prueba t de Student)

La prueba t (también conocida como "t de Student"), desarrollada por William Sealy Gosset bajo el seudónimo de "Student" en 1908, es una prueba estadística utilizada para comparar medias cuando el tamaño de las muestras es pequeño y se desconoce la varianza de la población. Centrada en la comparación de las medias de dos poblaciones, es una de las pruebas más utilizadas en la industria manufacturera.

Un laboratorio meticulosamente diseñado, con una serie de instrumentos científicos y equipos de prueba dispuestos sobre un banco de trabajo moderno y elegante. Los vasos de precipitados, los tubos de ensayo y las pantallas digitales proyectan un suave resplandor ambiental, iluminado por una precisa luz direccional desde arriba. En primer plano, un programa de análisis estadístico está abierto en la pantalla de un ordenador y muestra gráficos y diagramas complejos. En el centro, un ingeniero con bata blanca registra cuidadosamente los datos, mientras que el fondo muestra una pared de diagramas técnicos y esquemas de ingeniería. El ambiente general transmite una sensación de rigor analítico, experiencia técnica y compromiso con el control de calidad.
Un laboratorio con una serie de instrumentos científicos que realizan pruebas estadísticas.

Propósito: La prueba t ayuda a los ingenieros y profesionales de la calidad a determinar si existe una diferencia estadísticamente significativa entre las medias de dos grupos o entre la media de una muestra y una norma conocida. Se suele utilizar en las pruebas de hipótesis para evaluar si los cambios en los procesos o las modificaciones de los productos han condujo a mejoras o diferencias reales, más allá de lo que cabría esperar por azar.

Ejemplos prácticos en la industria:

  • En la fabricación de automóviles, puede utilizarse una prueba t para comparar la resistencia a la tracción del acero de dos proveedores distintos y garantizar así una calidad uniforme.
  • En el sector farmacéutico, la prueba t se utiliza para analizar si un nuevo proceso de producción produce comprimidos con un peso medio significativamente diferente del estándar.
  • In electronics, engineers may use the t-Test to verify if a cambio de diseño in a circuito impreso results in a measurable improvement in electrical resistance.

Cómo realizar la prueba t de Student

Existen muchas variantes de la prueba t; el ejemplo aquí se centrará en la llamada "prueba t de dos muestras" en su versión "no apareada", que compara los muestreos de 2 lotes de producción diferentes.

  1. Plantee sus hipótesis nula y alternativa; en este ejemplo, "no hay diferencia entre las medias" frente a "hay diferencias".
  2. Recopile los datos de los 2 lotes de producción comparados y calcule
    • the 2 sample means \(\bar{X} = \frac{1}{n_1} \sum_{i=1}^{n_1} X_i\) and \(\bar{Y} = \frac{1}{n_2} \sum_{j=1}^{n_2} Y_j\)
    • Calculate the 2 sample variances: \(S_X^2 = \frac{1}{n_1-1} \sum_{i=1}^{n_1} (X_i – \bar{X})^2\) and \(S_Y^2 = \frac{1}{n_2-1} \sum_{j=1}^{n_2} (Y_j – \bar{Y})^2\)
    • tamaño de las muestras.
  3. Calcule el estadístico de la prueba. Aunque el método supone que ambas muestras son independientes y que ambas muestras proceden de poblaciones con distribución normal, todavía hay dos casos:
    • si se suponen varianzas iguales (“pooled” t-test;): Pooled variance: \(S_p^2 = \frac{ (n_1-1)S_X^2 + (n_2-1)S_Y^2 }{ n_1 + n_2 – 2 }\)
      Test statistic: \(t = \frac{ \bar{X} – \bar{Y} }{ S_p \sqrt{ \frac{1}{n_1} + \frac{1}{n_2} } }\)
    • si las varianzas son desiguales (Welch’s t-test): Test statistic: \(t = \frac{ \bar{X} – \bar{Y} }{ \sqrt{ \frac{S_X^2}{n_1} + \frac{S_Y^2}{n_2} } }\) Degrees of freedom (approximate, Welch-Satterthwaite): \(df = \frac{\left( \frac{S_X^2}{n_1} + \frac{S_Y^2}{n_2} \right)^2}{ \frac{ (S_X^2 / n_1)^2 }{ n_1 – 1 } + \frac{ (S_Y^2 / n_2)^2 }{ n_2 – 1 } }\)
  4. Use the calculated ( t ) and degrees of freedom (\(n_1+n_2-2\) for equal variances, or the Welch formula) to look up or compute the p-value from the t-distribution (depending on whether it’s a one-tailed or two-tailed test).
  5. Resultado: compare el valor t calculado con el valor t crítico de las tablas estadísticas basadas en el nivel de confianza y los grados de libertad que haya elegido; alternativamente, utilice un programa informático para obtener el valor p. Si el estadístico t supera el valor crítico o el valor p está por debajo de su umbral (normalmente 0,05), rechace la hipótesis nula.

Enlace la tabla de valores críticos de la prueba t

🔒

The rest of this article is reserved for members

To limit scraping bots (currently 40,000 hits per day!),
we had to restrict access to full articles and tools to registered members only.

Log in →  or  Register (100% free) →

to access all the rest.

Temas tratados: statistical tests, quality management, manufacturing processes, objective evidence, decision-making, normality tests, Shapiro-Wilk test, non-parametric tests, p-value, Type I error, Type II error, data-driven, regression analysis, correlation analysis, Total Quality Management (TQM), ANOVA, reliability, ISO 9001, ISO 25010, ISO 31000, ISO 9000, and ISO 17025..

Contexto histórico

1974
1974
1978
1980
1980
1980
1980
1972
1974
1975-06-01
1980
1980
1980
1980
1980

(Si la fecha es desconocida o no es relevante, por ejemplo "mecánica de fluidos", se proporciona una estimación redondeada de su aparición notable)

Las imágenes a tamaño completo y las descargas sólo están disponibles, 100% gratis, para los miembros registrados.

> Acceso <