Posts Tagged ‘Recta de Henry’

Información y Datos

Wednesday, November 16th, 2011

En toda empresa, se recogen y archivan una gran cantidad de datos y, sin embargo, cuando se quiere solucionar problemas, necesitamos sacar una información en “forma de números” y nos damos cuenta de que:

  • No disponemos de los datos para realizar un diagnóstico seguro
  • Los datos son incompletos
  • Los datos no son fiables

Joseph M. Juran, reconocido como uno de los grandes gurú de la calidad,  aclara esta aparente paradoja explicando que los datos representan la concreción numérica de hechos o realidades, mientras que la  información debe entenderse como la respuesta a preguntas previamente planteadas.

Datos  =  Hechos, realidades
Información = Respuestas a preguntas

La resolución de problemas exige disponer de una cierta información (respuestas a preguntas del tipo, ¿Con qué frecuencia se presenta el problema?, ¿En qué circunstancias se presenta?, ¿Cuánto tiempo se tarda en hacer el trabajo?, etc…). Pero, mientras que la buena información siempre está basada en datos, un determinado volumen de datos, por grande que sea, no necesariamente aporta la información que se precisa para resolver el problema.

La “información” incluye “datos”.
Los “datos” no necesariamente incluyen “información”.

Datos e Información

Así pues, la clave no está en cómo recoger datos, sino en cómo obtener información que resulte útil.

El proceso de generar información puede resumirse en las siguientes etapas:

  1. Formular claramente las preguntas que se desea contestar para evitar recoger unos datos totalmente correctos pero que no permiten contestar nuestras preguntas.
  2. Recopilar datos relativos a la cuestión planteada teniendo el análisis de datos en mente. Esto significa que todos los elementos de estratificación posibles deben aparecer en la hoja de recogida de datos (turnos, agencias, región, lote, familia de producto, etc…)
  3. Presentar los datos de forma adecuada para poner claramente de manifiesto cuál es la respuesta a la pregunta. En este sentido las representaciones gráficas de los datos individuales suelen ser de gran utilidad (gráfico de serie de tiempo, histograma, diagrama de probabilidad; Box Plot;…)

Hasta Pronto

Sandrine

Monográfico Índices de Capacidad Cp Cpk

Wednesday, February 17th, 2010

El pasado 12 de febrero, tuvo lugar el curso monográfico sobre los estudios de capacidad y el cálculo de los índices Cp Cpk.

En primer lugar, recordamos entre todos cuales son los parámetros que permiten caracterizar un conjunto de datos (media, mediana, moda, rango, desviación estándar, algunos datos de posición como los cuartiles, etc…).   Por otra parte, vimos como los gráficos cronológicos, los histogramas y la recta de Henry (diagrama de probabilidad) podían enseñarnos unos síntomas de comportamiento de los datos: tendencia ascendente, presencia de dos poblaciones (bimodal), aumento de la variabilidad, etc…

Todos estos trabajos permitieron llegar a la realización de los estudios de capacidad y al cálculo de los índices de capacidad Cp y Cpk pero teniendo en cuenta de que los dos pasos preliminares imprescindibles a estos estudios son:

  1. Comprobación de la normalidad de los datos
  2. Comprobación de la estabilidad de los datos

Los índices de capacidad comparan la voz del cliente (rango de tolerancias) con la voz del proceso (“ancho” de la campana de Gauss = 6*desviación estándar). Ita y Montse de una empresa farmacéutica, Nuria de un laboratorio de ensayos y Alberto del sector porcino realizaron una representación grafica y simularon distintos casos posibles: proceso capaz o no, descentramiento, etc…

Estudios de Capacidad

Explicamos la diferencia entre los estudios a corto y largo plazo (Cp, Cpk, Pp, Ppk) y la significación de unos números famosos para los índices de capacidad: 1,33; 1,67; 2…

Realizamos unos ejemplos prácticos con el software MINITAB y al final de la formación, los participantes presentaron sus propios datos a modo de ejemplos reales y prácticos. En el caso de Alberto, nos encontramos con un grafico cronológico con unos problemas de estabilidad. En efecto, se ve perfectamente la aparición de una causa especial: de repente, los valores aparecen más altos y la variabilidad es más importante.

Grafico Cronologico con problema de estabilidad

Agradezco la participación y el buen humor de Ita, Montse, Nuria y Alberto durante el curso.

Aprovecho también este post para desear lo mejor a Alberto, futuro Black Belt 6 Sigma y muy motivado en la utilización de la metodología DMAIC para la optimización de procesos basada en hechos y datos.

Hasta Pronto

Sandrine

“Mis datos no son normales”

Friday, November 20th, 2009

Cuando empezamos el análisis de un conjunto de datos, uno de los primeros pasos es la realización de un test de normalidad para saber si estamos en presencia de una distribución normal. En MINITAB, este test de normalidad se presenta mediante un diagrama de probabilidad (probability plot) en el cual se ve reflejada la recta de Henry y unos parámetros que nos ayudan a decidir si podemos aceptar, o no, la hipótesis de normalidad de los datos (el famoso p-valor o p-value superior a 0,05).

El hecho de encontrarse en presencia de una distribución normal nos ofrece un abanico de herramientas estadísticas de fácil comprensión y manejo.

¿Y si los datos no son normales????

Lo primero de todo es preguntarse porqué no lo son. Si estamos trabajando con unos datos que deberían seguir una distribución normal, lo primero de todo es investigar esta falta de normalidad. Me encuentro demasiadas veces con este comentario:

“Mis datos no son normales por lo que tendríamos que transformarlos mediante una transformación BOX COX o de Jonhson”.

Me gustaría que hagamos un juego. En cada uno de los diagramas de probabilidad presentados a continuación, la aparente “falta de normalidad” tiene su explicación.

Recta de Henry - Diagrama de probabilidad

Os propongo que vayáis juntando los puntos siguientes con cada uno de los gráficos:

  1. Caso Bimodal (2 turnos o 2 maquinas o 2…)
  2. Caso de un dato erróneo al entrar los datos en la base de datos.
  3. Caso de distintas cavidades de un molde de inyección
  4. Caso de falta de resolución del aparato de medición

Os dejo descubrir lo que esconden estas rectas de Henry y os invito a compartir vuestra respuesta poniendo un comentario en este post. ¡A ver si acertáis! :-)

Hasta Pronto

Sandrine

El histograma “engañososo”

Friday, August 7th, 2009

Esta semana, me encontré de nuevo con un tipo de histograma que llamo el “engañoso”. La razón por la cual le doy este calificativo es porqué proviene de unos datos recogidos de manera que todos tienen que cumplir con la especificación.

En el ejemplo que enseño a continuación, se trata de una longitud de una pieza de plástico inyectada. El límite de tolerancia inferior es de 33,08mm y se mide con un pie de rei. A priori, en la empresa, todos estaban de acuerdo por decir que esta característica no daba problemas pero mirando el histograma y la representación en papel probabilístico normal vimos que la realidad era otra.

Diagrama de probabilidad "engañoso"

En este gráfico (diagrama de probabilidad), todos los datos deberían encontrarse más o menos alineados en una recta (la famosa recta de Henry). Se observa una bifurcación en la parte inferior de la recta indicando que no existen (teóricamente) datos por debajo de un determinado valor. Este fenómeno se encuentra justo en el límite inferior de tolerancia.

En el histograma, se ve claramente que la barra de frecuencia de los datos situados en el límite inferior es anormalmente más alta. Tratándose de una longitud, los datos deberían seguir una distribución normal.

Histograma "engañoso"

Estas representaciones gráficas de los datos nos enseñan claramente que el problema proviene de la manera de registrar los datos. Se miden las piezas pero en caso de obtener una medición por debajo del límite inferior, se registra un dato correspondiente a la propia tolerancia.

Me imagino que existen seguramente muchas “buenas” razones por hacerlo (evitar el papeleo relacionado con las no-conformidades, enmascarar problemas del proceso, poder asegurar que cumplimos con las especificaciones del cliente…). Pero no olvidemos que los datos nos pueden ayudar a detectar donde se encuentran los problemas y mejorar nuestros procesos. Si registramos datos falsos, nos estamos engañando y la tarea de optimización de procesos es bastante más compleja.

Hasta Pronto

Sandrine