innovation.world

Product Design, Manufacturing & Innovation Resources

Hogar » Diseño de producto » Metodologías » Las 6 pruebas estadísticas imprescindibles para la calidad y la ingeniería

Las 6 pruebas estadísticas imprescindibles para la calidad y la ingeniería

Manufactura esbelta, Mejora de procesos, Optimización de procesos, Seguro de calidad, Control de calidad, Gestión de calidad, Seis Sigma, Análisis estadístico, Pruebas estadísticas

Statistical tests are the only way in quality and manufacturing to provide objective evidence for decision-making. They help identify variations in processes and distinguish between random fluctuations and actual problems. In engineering, statistics help identify patterns, outliers, and sources of failure in system performance, ensuring data-driven decision-making. By rigorously analyzing experimental results, engineers can validate product designs and manufacturing processes, detecting potential problems before implementation. This systematic approach reduces the risk of unexpected failures and enhances overall safety by ensuring reliability and compliance with international safety estándares.

This post will review main statistical tests used in manufacturing and Gestión de la calidad total (TQM).

Nota: dado que también afectan a la ingeniería, la investigación y la ciencia, las 2 pruebas y análisis estadísticos siguientes

análisis de correlación: measures the strength and direction of the relationship between two variables (e.g., Pearson correlation coefficient).
análisis de regresión: examina la relación entre variables (por ejemplo, factores de entrada y resultados del proceso), desde la simple regresión lineal hasta la múltiple.

no se incluyen aquí, sino en un artículo específico sobre los 10 principales algoritmos para ingeniería.

Pruebas de normalidad

Un laboratorio bien iluminado, con una mesa en la que se exponen diversos equipos científicos: vasos de precipitados, pipetas y un microscopio. En el centro, una pizarra muestra un claro proceso de comprobación de hipótesis paso a paso, con ecuaciones y diagramas que explican los fundamentos. Al fondo, una estantería repleta de manuales técnicos y bibliografía específica del sector transmite una atmósfera de rigor académico y atención al detalle. El ambiente general es de investigación científica y resolución de problemas, con especial atención al enfoque sistemático del control de calidad. — Enumere las pruebas estadísticas más utilizadas para la calidad y la ingeniería.

En el mundo de las pruebas estadísticas, muchos métodos estadísticos comunes (pruebas t, ANOVA, regresión lineal, etc.) suponen que los datos tienen una distribución normal/gaussiana (o que los residuos/errores son normales). La violación de este supuesto puede hacer que los resultados no sean fiables: los valores p pueden ser engañosos, los intervalos de confianza pueden ser erróneos y el riesgo de errores de tipo I/II aumenta. Tenga en cuenta que algunas pruebas, como el ANOVA de 1 vía, pueden manejar razonablemente bien una distribución no normal.

Nota: si los datos no son normales (véanse los casos reales más abajo), es posible que tenga que utilizar pruebas no paramétricas (como la prueba U de Mann-Whitney o la prueba de Kruskal-Wallis), que no presuponen normalidad, o transformar los datos, lo que queda fuera del ámbito de este artículo.

Aunque existen varias pruebas estadísticas para ello, detallaremos aquí la prueba de Shapiro-Wilk, famosa sobre todo para muestras de pequeño tamaño, normalmente n < 50, pero que puede utilizarse hasta 2000.

Para su información, otras pruebas de normalidad habituales:

- Prueba de Kolmogorov-Smirnov (K-S) (con corrección de Lilliefors): funciona mejor con muestras de mayor tamaño, aunque es menos sensible que la prueba de Shapiro-Wilk, especialmente para conjuntos de datos pequeños.
- Prueba de Anderson-Darling: es buena con todos los tamaños de muestra y tiene más sensibilidad en las colas (extremos) de la distribución, al tiempo que es más potente para detectar desviaciones de la normalidad en los extremos.

Cómo realizar la prueba de normalidad de Shapiro-Wilk

1. Calcular o computar el estadístico de la prueba de Shapiro-Wilk (W):

\(W = \frac{\left(\sum_{i=1}^{n} a_i x_{(i)}\right)^2}{\sum_{i=1}^{n} (x_i – \bar{x})^2}\)

Note: as the calculation of the \(a_i\) coefficients is nontrivial and generally requires a table or algorithm, which is why the Shapiro-Wilk test is nearly always computed by software such as R, Python’s SciPy, MS Excel add-ons or other dedicated softwares. Para un cálculo manual, esta página provides all the \(a_i\) coefficients and p-value for samples up to 50.

El valor de W oscila entre 0 y 1 (W = 1: normalidad perfecta. W < 1: cuanto más se aleja de 1, menos normales son los datos).

2. W no es suficiente. Funciona junto con su correspondiente valor p para tener el nivel de confianza. En la tabla de Shapiro-Wilk, en la fila del tamaño de muestra n, busque el valor más cercano a su W calculado y obtenga su correspondiente Valor p en la parte superior

El numerador representa la suma al cuadrado de los valores de la muestra ordenada ponderada.

El denominador es la suma de las desviaciones al cuadrado de la media muestral (es decir, la varianza muestral, escalada por (n-1)).

\(x_{(i)}\) = the i-th order statistic (i.e., the i-th smallest value in the sample)

\(x_i\) = the i-th observed value

\(\bar{x}\) = the sample mean

\(a_i\) = constants (weights) calculated from the mean, variances, and covariances of the order statistics of a sample from a standard normal distribution ((N(0,1))), and depend only on n (sample size).

n = tamaño de la muestra

3. Resultado: if the p-value is greater than the chosen alpha-level (example 0.05), there is statistical evidence that the data tested are normally distributed.

Para comprobar la normalidad, a menudo se aconseja combinar un método numérico con un método gráfico como la línea de Henry, los gráficos Q-Q o los histogramas :

Cuidado con las distribuciones no normales

Aunque la distribución normal/gaussiana es el caso más frecuente, no debe asumirse automáticamente. Entre los contraejemplos cotidianos se encuentran:

Distribución de la riqueza y la renta entre los individuos. Sigue una distribución de Pareto (ley de la potencia), sesgada con una "larga cola" de individuos muy ricos.
El tamaño de la población de un país sigue la Ley de Zipf (ley de potencias), con unas pocas ciudades muy grandes y muchos pueblos pequeños.
Las magnitudes y la frecuencia de los terremotos siguen una distribución de ley de potencia/Gutenberg-Richter: los terremotos pequeños son frecuentes, los grandes son raros.
Variaciones diarias de precios o rendimientos en los mercados financieros: distribuciones de cola gruesa/alta, no gaussianas; las grandes desviaciones se producen con más frecuencia de lo previsto por una distribución normal.
Las frecuencias de palabras en el lenguaje, como la población de la ciudad anterior, sigue una Ley de Zipf (ley de potencia): Pocas palabras se usan a menudo, la mayoría son raras.
Tráfico en Internet/popularidad de los sitios web: ley de potencia/cola larga: Algunos sitios tienen millones de visitas, la mayoría muy pocas.
Tamaño de los archivos en los sistemas informáticos: log-normal o ley de potencia, con unos pocos archivos muy grandes y muchos pequeños.
Esperanza de vida/longevidad humana: asimétrica a la derecha (puede modelarse con Weibull o Gompertz), no normales; muere más gente a edades más avanzadas.
Las conexiones de las redes sociales siguen una ley de potencia: pocos usuarios tienen muchas conexiones; la mayoría, pocas.

La mayoría de ellas se caracterizan por "pocos grandes, muchos pequeños", una firma de leyes de potencia, colas pesadas, distribuciones exponenciales o log-normales, y no la forma simétrica de la gaussiana.

La prueba t (prueba t de Student)

La prueba t (también conocida como "t de Student"), desarrollada por William Sealy Gosset bajo el seudónimo de "Student" en 1908, es una prueba estadística utilizada para comparar medias cuando el tamaño de las muestras es pequeño y se desconoce la varianza de la población. Centrada en la comparación de las medias de dos poblaciones, es una de las pruebas más utilizadas en la industria manufacturera.

Un laboratorio meticulosamente diseñado, con una serie de instrumentos científicos y equipos de prueba dispuestos sobre un banco de trabajo moderno y elegante. Los vasos de precipitados, los tubos de ensayo y las pantallas digitales proyectan un suave resplandor ambiental, iluminado por una precisa luz direccional desde arriba. En primer plano, un programa de análisis estadístico está abierto en la pantalla de un ordenador y muestra gráficos y diagramas complejos. En el centro, un ingeniero con bata blanca registra cuidadosamente los datos, mientras que el fondo muestra una pared de diagramas técnicos y esquemas de ingeniería. El ambiente general transmite una sensación de rigor analítico, experiencia técnica y compromiso con el control de calidad. — Un laboratorio con una serie de instrumentos científicos que realizan pruebas estadísticas.

Propósito: La prueba t ayuda a los ingenieros y profesionales de la calidad a determinar si existe una diferencia estadísticamente significativa entre las medias de dos grupos o entre la media de una muestra y una norma conocida. Se suele utilizar en las pruebas de hipótesis para evaluar si los cambios en los procesos o las modificaciones de los productos han condujo a mejoras o diferencias reales, más allá de lo que cabría esperar por azar.

Ejemplos prácticos en la industria:

En la fabricación de automóviles, puede utilizarse una prueba t para comparar la resistencia a la tracción del acero de dos proveedores distintos y garantizar así una calidad uniforme.
En el sector farmacéutico, la prueba t se utiliza para analizar si un nuevo proceso de producción produce comprimidos con un peso medio significativamente diferente del estándar.
In electronics, engineers may use the t-Test to verify if a cambio de diseño in a circuito impreso results in a measurable improvement in electrical resistance.

Cómo realizar la prueba t de Student

Existen muchas variantes de la prueba t; el ejemplo aquí se centrará en la llamada "prueba t de dos muestras" en su versión "no apareada", que compara los muestreos de 2 lotes de producción diferentes.

Plantee sus hipótesis nula y alternativa; en este ejemplo, "no hay diferencia entre las medias" frente a "hay diferencias".
Recopile los datos de los 2 lotes de producción comparados y calcule
- the 2 sample means \(\bar{X} = \frac{1}{n_1} \sum_{i=1}^{n_1} X_i\) and \(\bar{Y} = \frac{1}{n_2} \sum_{j=1}^{n_2} Y_j\)
- Calculate the 2 sample variances: \(S_X^2 = \frac{1}{n_1-1} \sum_{i=1}^{n_1} (X_i – \bar{X})^2\) and \(S_Y^2 = \frac{1}{n_2-1} \sum_{j=1}^{n_2} (Y_j – \bar{Y})^2\)
- tamaño de las muestras.
Calcule el estadístico de la prueba. Aunque el método supone que ambas muestras son independientes y que ambas muestras proceden de poblaciones con distribución normal, todavía hay dos casos:
- si se suponen varianzas iguales (“pooled” t-test;): Pooled variance: \(S_p^2 = \frac{ (n_1-1)S_X^2 + (n_2-1)S_Y^2 }{ n_1 + n_2 – 2 }\)
  Test statistic: \(t = \frac{ \bar{X} – \bar{Y} }{ S_p \sqrt{ \frac{1}{n_1} + \frac{1}{n_2} } }\)
- si las varianzas son desiguales (Welch’s t-test): Test statistic: \(t = \frac{ \bar{X} – \bar{Y} }{ \sqrt{ \frac{S_X^2}{n_1} + \frac{S_Y^2}{n_2} } }\) Degrees of freedom (approximate, Welch-Satterthwaite): \(df = \frac{\left( \frac{S_X^2}{n_1} + \frac{S_Y^2}{n_2} \right)^2}{ \frac{ (S_X^2 / n_1)^2 }{ n_1 – 1 } + \frac{ (S_Y^2 / n_2)^2 }{ n_2 – 1 } }\)
Use the calculated ( t ) and degrees of freedom (\(n_1+n_2-2\) for equal variances, or the Welch formula) to look up or compute the p-value from the t-distribution (depending on whether it’s a one-tailed or two-tailed test).
Resultado: compare el valor t calculado con el valor t crítico de las tablas estadísticas basadas en el nivel de confianza y los grados de libertad que haya elegido; alternativamente, utilice un programa informático para obtener el valor p. Si el estadístico t supera el valor crítico o el valor p está por debajo de su umbral (normalmente 0,05), rechace la hipótesis nula.

Enlace la tabla de valores críticos de la prueba t

🔒

The rest of this article is reserved for members

To limit scraping bots (currently 40,000 hits per day!),
we had to restrict access to full articles and tools to registered members only.

Log in → or Register (100% free) →

to access all the rest.

Temas tratados: statistical tests, quality management, manufacturing processes, objective evidence, decision-making, normality tests, Shapiro-Wilk test, non-parametric tests, p-value, Type I error, Type II error, data-driven, regression analysis, correlation analysis, Total Quality Management (TQM), ANOVA, reliability, ISO 9001, ISO 25010, ISO 31000, ISO 9000, and ISO 17025..

Contexto histórico

Ingeniero de redes analizando la arquitectura por capas TCP/IP en un entorno de oficina moderno.

Arquitectura en capas TCP/IP

La arquitectura del conjunto de protocolos de Internet es un modelo conceptual que divide las funciones de comunicación en cuatro capas de abstracción: la capa de enlace, la capa de Internet, la capa de transporte y la capa de aplicación. Este enfoque en capas simplifica el diseño y el desarrollo de protocolos, ya que cada capa gestiona tareas específicas e interactúa únicamente con las capas inmediatamente superiores e inferiores.

Centro de operaciones de red que muestra la gestión del Protocolo de Internet y el encaminamiento de datos.

Protocolo de Internet (IP)

El Protocolo de Internet (IP) es el principal protocolo de comunicaciones en la capa de Internet para la retransmisión de datagramas a través de los límites de la red. Su función principal es entregar paquetes desde un host de origen a un host de destino según sus direcciones IP. IP es un protocolo sin conexión que ofrece un servicio de entrega de máximo esfuerzo, lo que significa que no garantiza la entrega, el orden ni la integridad de los datos.

Caverna de sal subterránea para el almacenamiento de energía por aire comprimido en aplicaciones termodinámicas.

Almacenamiento de energía de aire comprimido (CAES)

El almacenamiento de energía por aire comprimido (CAES) es un método para almacenar energía generada en un momento dado para su uso posterior. A escala de servicio público, la energía se almacena comprimiendo el aire y almacenándolo en un depósito subterráneo, como una caverna de sal. Cuando se necesita electricidad, el aire presurizado se calienta y se expande en una turbina, impulsando un generador.

Colaboración en equipo en una reunión de Gestión de la Calidad Total centrada en la mejora de los procesos.

Gestión de calidad total (TQM)

La Gestión de Calidad Total (GCT) es una filosofía de gestión donde todos los miembros de una organización participan en la mejora de procesos, productos, servicios y la cultura en la que trabajan. Busca el éxito a largo plazo mediante la satisfacción del cliente. La GCT integra la disciplina de la calidad en la cultura y las actividades de una empresa, yendo más allá de la simple inspección de productos hacia un enfoque holístico que abarca toda la organización.

Línea de producción industrial con ingenieros que gestionan los retos del Takt time en la fabricación.

Desafíos de la implementación del Takt Time

La implementación exitosa del tiempo Takt requiere un entorno de producción altamente estable. Entre los desafíos comunes se incluyen la gestión del tiempo de inactividad de las máquinas, garantizar una calidad constante para evitar la repetición de trabajos y equilibrar las líneas que producen múltiples productos con diferentes contenidos de trabajo (líneas de modelo mixto). Si no se abordan estas fuentes de variabilidad, un sistema basado en el tiempo Takt puede ser frágil y no satisfacer la demanda de forma consistente.

Proceso de soldadura por transmisión láser de componentes termoplásticos en la tecnología de polímeros.

Soldadura de plásticos por transmisión láser

La soldadura por transmisión láser une dos piezas termoplásticas superpuestas mediante el paso de un haz láser a través de una parte superior transmisora de láser hasta una parte inferior absorbente de láser. La energía láser absorbida calienta y funde la interfaz. La presión de sujeción fusiona las capas fundidas y, al enfriarse, se forma una soldadura fuerte y limpia. Este método es preciso, sin contacto y minimiza la tensión térmica y la contaminación por partículas.

Máquina CNC con sistema de control de bucle cerrado y dispositivos de realimentación en automatización.

Control de lazo cerrado en sistemas CNC

Las máquinas CNC de alta precisión emplean un sistema de control de bucle cerrado para garantizar la precisión. Este sistema utiliza dispositivos de retroalimentación, como codificadores rotatorios en servomotores o escalas lineales en los ejes de la máquina, para monitorizar continuamente la posición real de la máquina. El controlador compara esta retroalimentación en tiempo real con la posición ordenada por el programa y realiza correcciones inmediatas, compensando los errores.

1974

1974

1978

1980

1980

1980

1980

1972

1974

1975-06-01

1980

1980

1980

1980

1980

Reunión de toma de decisiones B2B con diversas funciones en un entorno de oficina moderno.

El modelo del centro de compras en la toma de decisiones B2B

La central de compras es un modelo que representa a todas las personas y grupos de una organización que participan en una decisión de compra. No es una unidad fija, sino un conjunto de funciones asumidas por diferentes personas para diferentes compras. Estas funciones incluyen iniciadores, usuarios, personas influyentes, decisores, aprobadores, compradores y guardianes, cada uno de los cuales influye en la decisión final a través de su función y autoridad específicas.

Estación de trabajo informática que analiza el Protocolo de Control de Transmisión en un entorno profesional.

Protocolo de control de transmisión (TCP)

TCP es un protocolo fundamental de la capa de transporte, que proporciona una entrega fiable, ordenada y sin errores de un flujo de bytes entre aplicaciones que se ejecutan en hosts. Es un protocolo orientado a la conexión, lo que significa que establece una conexión mediante un protocolo de enlace de tres vías antes de que comience la transferencia de datos. Esto garantiza la integridad de los datos a costa de una mayor sobrecarga en comparación con UDP.

Dispositivo electrónico con la marca FCC de certificación de compatibilidad electromagnética.

La marca FCC para compatibilidad EMC

La marca FCC es una marca de certificación que se utiliza en productos electrónicos fabricados o vendidos en Estados Unidos. Significa que la interferencia electromagnética (EMI) del dispositivo se encuentra dentro de los límites aprobados por la Comisión Federal de Comunicaciones (FCC). Esta regulación garantiza que los dispositivos electrónicos no interfieran con las comunicaciones por radio ni con otros equipos, preservando así la integridad del espectro radioeléctrico.

Oficina de diseño de tecnología industrial con ingenieros que optimizan muebles planos para su montaje.

Diseño para X (DFX)

Una metodología de diseño donde «X» representa un objetivo específico del ciclo de vida del producto. DFX abarca un conjunto de directrices y técnicas destinadas a optimizar el diseño de un producto para un objetivo específico, como la manufacturabilidad (DFM), el ensamblaje (DFA), la confiabilidad (DFR) o la sostenibilidad (DfS). Este enfoque proactivo aborda posibles problemas desde el principio de la fase de diseño, reduciendo costos y mejorando la calidad.

Oficina de ingeniería con ingenieros que colaboran en el intercambio de datos CAD mediante formatos IGES y STEP.

Intercambio de datos CAD: IGES y STEP

Para abordar la incapacidad de los diferentes sistemas CAD para compartir datos, se crearon formatos de archivo neutrales. La Especificación Inicial de Intercambio de Gráficos (IGES), desarrollada a finales de la década de 1970, fue un primer intento. Posteriormente, fue reemplazada por la norma STEP (Estándar para el Intercambio de Datos de Modelos de Producto, ISO 10303), más robusta y completa, que puede representar modelos 3D completos, la estructura del ensamblaje y metadatos.

Sistema ecológico de tratamiento de aguas residuales con diversos ecosistemas para la depuración del agua.

Máquina viviente

Un sistema patentado de tratamiento ecológico de aguas residuales y recuperación de agua, desarrollado por el Dr. John Todd. Utiliza diversos ecosistemas, como bacterias, algas, plantas, caracoles y peces, en entornos controlados como tanques o invernaderos, para purificar el agua. El sistema imita los procesos naturales de purificación de los humedales y otros ecosistemas acuáticos, pero en un entorno intensificado y diseñado.

Técnico realizando pruebas de ultrasonidos phased array en un componente metálico en una fábrica.

Prueba ultrasónica de matriz en fase (PAUT)

Las pruebas ultrasónicas de matriz en fase (PAUT) emplean un transductor multielemento donde cada elemento se pulsa de forma independiente con retardos precisos calculados por computadora. Al controlar esta fase, el haz ultrasónico resultante puede dirigirse, enfocarse y escanearse electrónicamente sin mover físicamente la sonda. Esto proporciona imágenes rápidas y detalladas de defectos, especialmente en geometrías complejas, superando las técnicas convencionales de un solo elemento.

Ingenieros colaboran en un laboratorio de redes informáticas en aplicaciones del Protocolo de Datagramas de Usuario.

Protocolo de datagramas de usuario (UDP)

El Protocolo de Datagramas de Usuario (UDP) es un protocolo de capa de transporte minimalista y sin conexión. Proporciona un servicio de datagramas sencillo sin la fiabilidad, el ordenamiento ni los mecanismos de control de flujo de TCP. Sus principales ventajas son la baja sobrecarga y la baja latencia, lo que lo hace ideal para aplicaciones con tiempos de respuesta limitados, como búsquedas de DNS, juegos en línea y streaming de vídeo en directo, donde la velocidad es más importante que la fiabilidad.

(Si la fecha es desconocida o no es relevante, por ejemplo "mecánica de fluidos", se proporciona una estimación redondeada de su aparición notable)

Publicaciones y artículos más populares

Mercado

La guía del dictador para la gestión del mercado (o el arte de ser jugador y árbitro)

Producto Mínimo Viable

Producto Mínimo Viable (MVP): Consejos profesionales

Errores de diseño de productos que se deben evitar

Los 10 “mejores” errores de diseño que debes evitar

Principios mecánicos

90 principios mecánicos para obtener soluciones de diseño inteligentes

techo geométrico

Las formas siguen a la función… especialmente en el diseño de productos

Menos es más. ¿Por qué conviene diseñar de forma sencilla?

Menos es más. ¿Por qué conviene diseñar de forma sencilla?

Herramientas originales de primera calidad

Lista de servidores proxy gratuitos

Lista de proxies gratuitos (actualizada continuamente)

$Editor de fórmulas LaTeX$

Editor de fórmulas LaTeX

Explorador de conceptos

Explorador de conceptos™ de Innovation.world

Árbol de Revisión de Diseño™ (DRT)

El Design Review Tree™ (DRT): Compruebe el Diseño de su Producto

Búsqueda de patentes más recientes

Búsqueda gratuita de las últimas patentes

Publicaciones científicas

Búsqueda gratuita de las últimas publicaciones científicas