Posts Tagged ‘Campana de Gauss’

Valores atípicos

Wednesday, September 23rd, 2015

Hola,

Cuando se analizan los datos de un proceso y encontramos valores atípicos, es muy tentador quitar estos valores para seguir con el análisis estadístico…

Si bien, desde un punto de vista estadístico, se puede hacer este tipo de acciones, nunca hay que olvidar que estos valores han surgido de un proceso, o sea que tienen una realidad, que son el síntoma de algo que ha pasado realmente.Gráfico de valores atípicos

Hay numerosas razones para que aparezcan valores anómalos: un fallo en lo que se está midiendo, en el sistema de medida, un error al pasar los datos al ordenador…

Pero en todo caso es síntoma de algo que está pasando y, como tal, se debería investigar para asegurarse de que no hay un problema grave detrás de estas medidas extrañas. Además, es importante guardar rastro de estos datos eliminados para poder realizar un análisis a largo plazo.

Detectar a tiempo y analizar los valores atípicos de nuestros procesos es importante. Técnicas gráficas sencillas permiten esas detecciones, y si queremos ir más allá a la hora de vigilar las características críticas de nuestros procesos, nos podemos plantear poner en marcha un control estadístico de procesos (SPC) con gráficos de control que, además de los valores anómalos, nos informaran de comportamientos no aleatorios.

Si quieres aprender más sobre las técnicas de análisis gráfica o los gráficos de control, puedes apuntarte a nuestro curso Minitab.

Hasta pronto,

Noël

Definición de capacidad de proceso

Friday, August 3rd, 2012

El concepto de capacidad, hablando de proceso, se refiere a la anchura de la campana de Gauss que lo caracteriza. En un estudio de capacidad (capability study), se compara la anchura de la distribución normal obtenida (lo que llamamos la Voz del Proceso) con los límites de tolerancias (la Voz del Cliente).

Tradicionalmente se define la capacidad de proceso como la distancia de 3 veces sigma de cada lado de la media. Por lo tanto, corresponde a un valor igual a 6 veces la desviación estándar. En algunos casos, se quiere abarcar más anchura de la campana por lo que se lleva a incluir hasta 6 veces la distancia sigma de cada lado (un total de 12 sigmas).

Concepto de capacidad

Concepto de capacidad

La formula del índice de capacidad Cp, como indicador de calidad, es la siguiente:

(Limite superior de tolerancia – Limite inferior de tolerancia)/6 sigma

Queremos que nuestro proceso sea capaz de operar dentro de los limites de especificaciones (requerimientos del cliente) por lo que el valor obtenido con la formula debe ser grande (por lo menos superior a 1).

Claro está que un proceso capaz (Cp >>1) podría generar defectos en caso de que esté descentrado. Es la razón por la cual se asocia el índice Cpk al del Cp.

La formula de cálculo del Cpk es la siguiente:

  1. Se calcula un indicador del lado superior: (limite superior – media)/3 sigma
  2. Se calcula un indicador del lado inferior: (media – limite inferior)/3 sigma
  3. Se elige, como índice Cpk, el valor mínimo de estos dos indicadores calculados siendo este el caso más desfavorable (el caso en el cual la campana se acerca más del límite con el riesgo de provocar defectos)

Entendemos por las propias formulas que un proceso perfectamente centrado tendrá: Cp=Cpk.

Tenemos que tener en cuenta también que todas estas formulas funcionan en caso de tener unos datos que se ajustan a una distribución normal.

Os propongo aprender más sobre el concepto de capacidad y los índices Cp Cpk asistiendo al próximo curso monográfico sobre este tema.

Hasta Pronto

Sandrine

Histogramas y normalidad de los datos

Wednesday, July 11th, 2012

La mayoría de los datos que representan nuestros procesos se ajustan a una distribución normal. Cuando hacemos el histograma de nuestros datos, nos esperamos ver que esta distribución tiene una curva suave conocida como la campana de Gauss. Pero a veces los histogramas (o diagramas de frecuencia) presentan unas formas peculiares.

En el gráfico siguiente podéis apreciar 4 histogramas generados con 20 datos procedentes de una distribución normal estándar (media = 0, desviación estándar = 1)

Histograma de una distribución normal estándar con 20 datos

Histograma de una distribución normal estándar con 20 datos

A pesar de ser normales, estos histogramas podrían llevarnos a falsas conclusiones sobre la normalidad de los datos.

De hecho, con solo 20 datos, un diagrama de puntos podría ser más adecuado para ver la dispersión de los datos (con toda su granularidad).

Diagrama de puntos - 20 datos

Diagrama de puntos - 20 datos

En cambio si aumentamos el nº de datos, la forma del histograma se aproxima a la campana de Gauss. A continuación, se muestran 4 histogramas realizados con unos datos procedentes de un distribución normal estándar pero variando la cantidad de datos.

Histogramas de una distribución normal

Histogramas de una distribución normal

Los histogramas son una buena representación gráfica para ver la dispersión de los datos pero es preferible un diagrama de puntos cuando la cantidad de datos no sobrepasa los 20.

Aprovecho este post para recordar que la única manera de saber si unos datos se ajustan a una distribución normal es hacer un test de normalidad. El diagrama de probabilidad de Minitab nos proporciona la representación de los datos con una recta de Henry y nos da el p-valor. De esta forma, con un p-valor > 0.05, podemos afirmar con un 95% de confianza que nuestros datos se ajustan a una distribución normal.

Sandrine

Estadística con Minitab: Aplicaciones para el control y la mejora de la calidad de Pere Grima, Lluís Marco y Xavier Tort-Martorell

Friday, July 6th, 2012

Libro Estadística con Minitab

Estadística con Minitab es un libro que permite aprender como utilizar el programa Minitab para los análisis estadísticos de datos enfocados a la mejora de calidad y optimización de procesos. Me parece un libro eminentemente práctico y lo recomiendo a todas las personas que quieren empezar a sacarles provecho a sus datos gracias a este Software.

Utilizo este programa en todos los cursos 6 sigma (Green Belt, Black Belt, Champion) y de estadística ya que me parece muy adaptado a las necesidades de las empresas en aprender como funcionan sus procesos y en resolver problemas basando sus decisiones en datos.

En primer lugar explica el funcionamiento básico de Minitab y como obtener la estadística descriptiva de los datos (media, mediana, rango, desviación estándar, percentiles,…) y realizar unas representaciones gráficas muy útiles tales como:

  • Gráfico cronológico para entender la evolución de los datos en el tiempo (tendencias, ciclos, variabilidad…)
  • Histogramas para apreciar la forma y la dispersión de los datos
  • Diagrama de probabilidad (recta de Henry) para comprobar si unos datos se ajustan a una distribución normal (campana de Gauss)
  • Box-plot o diagrama de caja y bigotes
  • Diagramas de correlación para ver la relación entre dos variables continuas,…

Pero por otra parte, también explica, con numerosos ejemplos, como utilizar el software Minitab para:

  • Estudios de capacidad (índices Cp, Cpk)
  • MSA – Validar los sistemas de medida (estudios R&R)
  • El análisis de regresión
  • Los diseños de experimentos (DOE)
  • Control estadístico de proceso (SPC)

Una buena manera de empezar a ver como utilizar los datos y lo que nos pueden aportar.

Si os interesa, podéis adquirir este libro en la tienda online de Caletec enfocada a la optimización de procesos.

Origen de la distribución normal (su historia)

Sunday, May 8th, 2011

La distribución normal se conoce como la curva de Gauss o campana de Gauss, famoso matemático alemán del siglo 19.

Realmente, fue un trabajo de más de 200 años para descubrirla y establecer su ecuación. En este post, explico la historia de la distribución más conocida de la estadística: la ley normal.

Su origen viene de la observación de un estadístico francés del siglo 18, Abraham de Moivre, que, entre otras cosas, actuaba como consultor para temas de juegos. Observó, que al lanzar una moneda, la probabilidad de obtener “cara” (o “cruz”) en N tirada tenía una representación gráfica con una curva suave a medida que N se hacía grande. En el gráfico presentado a continuación, la altura de cada barra representa la probabilidad de que ocurra el evento (sale “cara” al lanzar una moneda) de N veces que lanzamos la moneda (hemos cogido, N=2; N=4; N=12). Si la moneda no está trucada, la probabilidad de que salga “cara” al lanzarla es del 50% (p=0,5). Este fenómeno sigue una distribución conocida como la Binomial.

Distribución Binomial hacia la Distribución Normal

De Moivre explicó que si pudiéramos encontrar una ecuación para esta curva, solucionaríamos más fácilmente el cálculo de probabilidades de que aparezca “x” o más “cara” a lanzar N veces una moneda. Y eso fue uno de sus trabajos.

Distribución Normal

La gracia reside en que esta peculiar forma de campana también se detectó, en el siglo 17, por Galileo en el análisis de errores de medición de observaciones astronómicas; errores atribuibles a la instrumentación y a los observadores. Notó que estos errores eran simétricos y que los pequeños errores eran más frecuentes que los errores grandes. De ahí, se plantearon varias hipótesis sobre la distribución de los errores de medición.

Fue solo a principio del siglo 19th que se descubrió que estos errores seguían una distribución normal. Dos matemáticos establecieron de manera independiente su fórmula: Adrian en 1808 y Gauss en 1809 que al final dio su nombre a la más famosa de las distribuciones estadísticas ya que numerosos fenómenos naturales se ajustan a ella y que presenta unas  propiedades sumamente interesantes.

Gauss y la distribución normal en un billete de 10 marcos alemanes

Sandrine