Enlace Local # 13
Capítulo 4
Control de Procesos por variables
En este capítulo supondremos que la variable que se representa es medida en una escala numérica: tiempo, longitud, peso, etc. Al control estadístico de esta variable le denominaremos control por variables.
4.1 Gráfico de control para la media
El gráfico de control de la media, también llamado Gráfico ¯x recoge la evolución de la media muestral, en muestras de tamaño n, de la característica de calidad de interés. Por ejemplo, el tiempo medio de atención a un cliente tomando muestras de 10 clientes, o el radio medio de un cilindro, tomando muestras de 20 cilindros. Supondremos en este capítulo que dicha media muestral ¯x sigue una distribución normal.
Si la variable X sigue una distribución normal, la media muestral ¯x será también normal. Si la variable original
no es normal, pero n es elevado, por el teorema central del límite ¯x será aproximadamente normal. Existen, además, transformaciones que permiten convertir una variable aleatoria continua asimétrica en una variable que se aproxime razonablemente a la normal. Por otra parte, si el proceso está en estado de control, es muy razonable esperar que la variable de interés sea
52 normal (¿por qué?). Por esta razón, la construcción de los gráficos ¯x se realiza suponiendo que la media muestral sigue una distribución normal.
Por tanto la distribución del estadístico media muestral ¯x es, ¯x _ N_µ, _ n_, donde µ y _ son la media y desviación típica, respectivamente, de la variable de interés X cuando la variabilidad procede solo de causas no asignables, es decir, cuando el proceso esta bajo control.Bajo esta hipótesis, un intervalo que comprenda al 99.7% de la probabilidad estará comprendido
en µ ± 3_/pn. El gráfico de control tendrá las siguientes características:
LCS = µ + 3
_
pn
Línea Central(LC) = µ
LCI = µ − 3
_
pn
(4.1)
En la práctica se ha de estimar, por tanto, los parámetros µ y _. Para estimarlos se toman muestras de la producción (o prestación del servicio) durante un periodo prolongado de tiempo en el que se sepa que el proceso está bajo control. Una vez que se ha construido el gráfico, éste se utilizará en primer lugar para comprobar que realmente el proceso estuvo bajo control mientras se recogía esta información inicial. En caso contrario, se ha de prescindir de aquellas muestras en las que el proceso no estuvo bajo control y se repetirá el cálculo del gráfico, tal y como se ha comentado en 3.7.4.
El periodo de tiempo en el que se tomen los datos iniciales para la etapa de construcción del gráfico debe ser lo suficientemente amplio para permitir que haya cambios de turno, variabilidad en la materia prima, horas punta del servicio y horas valle, etc. La estimación de los parámetros será, además, una tarea que ha de someterse a revisión periódica. Veamos a continuación
como ha de hacerse la estimación de µ y _. 53
4.1.1 Estimación de los parámetros del gráfico ¯x
Sea X la variable que mide la calidad de los artículos producidos, o uno de los aspectos de la calidad que nos interese. Supongamos que se recogen un total de k muestras a intervalos regulares de tiempo y en cada muestra hay n elementos. Sea xij el valor del elemento j-ésimo (j = 1, .., n) de la muestra i-ésima (i = 1, ..., k). El conjunto total de datos será:
(x11, x12, ..., x1j , ..., x1n)
| {z } muestra 1
(x21, x22, ..., x2j , ..., x2n)
| {z } muestra 2
(xi1, xi2, ..., xij , ..., xin)
| {z } muestra i
. . .
(xk1, xk2, ..., xkj , ..., xkn)
| {z } muestra k
Si el proceso estuviese bajo control durante toda la recogida de estos nk datos, estos constituirían unamuestra aleatoria simple (de tamaño nk) de una población normal N(µ, _). El gráfico se construye, entonces, de la siguiente manera:
1. Se calcula la media y varianza de cada muestra. Por ejemplo, para los
n datos de la primera muestra:
¯x1 = Pn
j=1 x1j
n
s21
= Pn
j=1(x1j − ¯x1)2
n
varianza muestral
s2
n−1,1 = Pn
j=1(x1j − ¯x1)2
n − 1
cuasivarianza muestral
Se tendrán, por tanto, k medias y k varianzas.
2. Se calcula la media total. La media total será:
¯¯
x = Pk
i=1 ¯xi
k
54
Este estimador será centrado si la media µ del proceso ha sido constante durante la recogida de la información. Sin embargo, puede demostrase que los estimadores s1 y sn−1,1 no son estimadores insesgados de _ aun estando el proceso bajo control (E(s1) 6= _;E(sn−1,1) 6= _). El sesgo depende, además, del tamaño de la muestra n. No obstante, el sesgo para poblaciones normales está tabulado. La desviación típicamuestral S es una variable aleatoria que verifica
E(S) = c2_ (4.2)
Var(S) = c23
_2 (4.3)
donde los valores de c2 y c3 están tabulados para distintos tamaños muestrales. Por tanto se tiene que _ =
E(S)
c2
y, entonces, si/c2 sí es un estimador insesgado de _. Podremos construir un estimador insesgado de _ promediando los estimadores insesgados si/c2 de las k muestras:
ˆ_ =
¯s
c2
(4.4)
¯s = Pk
i=1 si
k
. (4.5)
Otra posible opción sería partir de un estimador insesgado para la varianza de cada muestra, la cuasivarianza muestral. Por ejemplo, para la muestra 1:
sn−1,1 = sPn
j=1(x1j − ¯x1)2
n − 1
Este estimador verifica que
E(Sn−1) = c4_ (4.6)
Var(Sn−1) = (1 − c24
)_2 = c25
_2 (4.7)
55
donde c4 está tabulado en función de n. Por tanto se tiene que
_ =
E(Sn−1)
c4
y, entonces, sn−1,i/c2 también es un estimador insesgado de _. Resulta entonces:
ˆ_ =
¯sn−1
c4
(4.8)
¯sn−1 = Pk
i=1 sn−1,i
k
. (4.9)
Si utilizamos los valores sj para la estimación de la desviación típica, el gráfico de control teórico (4.1) ha de substituirse por el siguiente gráfico de control con los límites estimados (provisionalmente)
LCS = ¯¯x + 3
¯s
c2pn
= ¯¯x + A1¯s
LC = ¯¯x
LCI = ¯¯x − 3
¯s
c2pn
= ¯¯x − A1¯s
Si utilizamos los valores sn−1,j para la estimación de la desviación típica, el gráfico de control teórico (4.1) ha de substituirse por el siguiente gráfico de control con los límites estimados (provisionalmente)
LCS = ¯¯x + 3
¯sn−1
c4pn
= ¯¯x + A3¯sn−1
LC = ¯¯x
LCI = ¯¯x − 3
¯sn−1
c4pn
= ¯¯x − A3¯sn−1
En ningún caso es aconsejable la estimación de _ a partir de la cuasidesviación o la desviación típica de toda la muestra a la vez. Esto es debido a que si el proceso no se encuentra en estado de control, las estimaciones así obtenidas están recogiendo tanto la dispersión intra-muestral como entre muestras.
56
Como decíamos, recordemos que estamos aún en la etapa de construcción del gráfico de control, y que para ello estamos suponiendo que los datos que se poseen son representativos del proceso en estado de control. Esta suposición hemos de corroborarla con este gráfico inicial. Si algún punto saliese de los límites de este gráfico concluiremos que el proceso estaba fuera
de control y lo eliminaremos. A continuación se recalculará ¯¯x y ¯s (o ¯sn−1 ) con lasmuestras restantes, dibujaremos un nuevo gráfico y repetiremos el proceso hasta que todas las muestras estén dentro de los límites.
La estimación de _ no sólo se puede realizar en base a las desviaciones típicas muestrales, también es posible obtener un estimador de este parámetro basado en el rango muestral. El rango de una muestra es la diferencia entre los valores extremos. Por ejemplo, en la muestra 1:
R1 = max{x11, x12, ..., x1n} − min{x11, x12, ..., x1n}
El rango será, por tanto, proporcional a la variabilidad de la variable. En muchas
ocasiones se analiza la variabilidad a través del rango, en lugar de la
desviación típica muestral. La razón principal es su simplicidad de cálculo.
Además, en muestras pequeñas, es un estimador de la desviación típica casi
tan eficaz, desde el punto de vista matemático, como la desviación típica
muestral. Supongamos que x _ N(µ, _) y R es el rango de una muestra de
tamaño n de dicha variable aleatoria normal. El rango será también una variable
aleatoria. Esta variable aleatoria depende de _ y de n y fue tabulada
por primera vez por Pearson en 1932. La distribución que está tabulada es la
de la variable aleatoria
W =
R
_
para varios tamaños muestrales. Llamemos d2 := E(W) y d3 := Var(W), donde
d2 y d3 están tabulados. Entonces:
µR := E(R) = E(W)_ = d2_ (4.10)
_R := pVar(R) = d3_
57
De la expresión (4.10), se deduce que
_ =
E(R)
d2
por lo tanto, un estimador de _ será:
ˆ_ =
¯R
d2
donde
¯R
= Pk
i=1 Ri
k
.
El gráfico de control teórico (4.1) ha de substituirse por el siguiente gráfico
de control con los límites estimados (provisionalmente)
LCS = ¯¯x + 3
¯R
d2pn
= ¯¯x + A2 ¯R
LC = ¯¯x
LCI = ¯¯x − 3
¯R
d2pn
= ¯¯x − A2 ¯R
Las constantes d2 y d3 están tabuladas considerando que la distribución
de referencia es normal. Sin embargo Burr demostró en 1967 que estas constantes
varían muy poco para una amplia variedad de distribuciones, con tal
que n _ 10.
4.2 Gráfico de control para la dispersión
Estamos suponiendo que la variable x es normal. Por tanto su distribución
no depende solo de la media µ, sino de la varianza _2. Por consiguiente,
para comprobar que el proceso esté bajo control no basta con demostrar
que µ ha sido estable; es decir, que los puntos del gráfico de media están
entre sus límites. Hemos de comprobar también que la varianza _2 de la
variable de interés X permanece estable. Esto se puede llevar a cabo con
58
un gráfico de control para la desviación típica _. Veamos a continuación
gráficos para controlar que la dispersión de la variable es estable a lo largo
de la producción o la prestación del servicio. Veremos tres tipos de gráficos
según la dispersión se mida a través de la desviación típica, cuasidesviación
típica o del rango (muestral). Al igual que con el gráfico de las medias, si
no se conoce _, primero habrá que construir sus límites con un conjunto de
información inicial.
Si denotamos por ˆ_ un estimador de _, los límites de control teóricos, de
acuerdo con los comentarios realizados en la sección 3.7.1, para un gráfico
de control ’3-sigma’ para la dispersión serán:
LCS = E(ˆ_) + 3pVar(ˆ_)
Línea Central(LC) = E(ˆ_)
LCI = E(ˆ_) − 3pVar(ˆ_)
(4.11)
4.2.1 Gráficos de Control para _ con cuasidesviación típica
El gráfico de control de la cuasidesviación típica muestral (corregida por grados
de libertad) o Gráfico S (así es como se denomina en muchas aplicaciones
informáticas, pero no hay que confundirlo con la notación aquí utilizada)
se utiliza para controlar que la desviación típica es estable, y por tanto representativa
de la variabilidad debida a causas no asignables.
El cálculo de los límites teóricos del gráfico de control se realiza utilizando
el estadístico Sn−1 (cuasidesviación típica), cuya media y desviación típica se
dan en la expresión (4.6) y (4.7), por lo que substituyendo en (4.11)
• LCS = c4_ + 3c5_ = B6_
• LC = c4_
• LCI = c4_ − 3c5_ = B5_
59
donde B5 y B6 están tabuladas para diversos valores de n, en el caso de que
c4 − 3c5 < 0 el LCI se toma como 0.
Cuando _ es desconocido, se toma como estimador insesgado suyo
ˆ_ =
¯sn−1
c4
.
Por tanto, los límites de control (provisionales) del gráfico resultan:
LCS = B6
¯sn−1
c4
= B4¯sn−1
LC = c4
¯sn−1
c4
= ¯sn−1
LCI = B5
¯sn−1
c4
= B3¯sn−1
(4.12)
donde B3 y B4 están tabulados. La estimación ¯sn−1 es la obtenida en la sección
anterior con las muestras iniciales. Si algún dato cae fuera de los límites
se considerará que el proceso ha estado fuera de control en ese momento,
por lo que ese datos no puede emplearse para la construcción de ningún
gráfico de control. Por tanto, la muestra hay que eliminarla tanto para el
cálculo del gráfico de medias como de desviaciones típicas. Hay que recalcular,
por tanto, ambos gráficos.
4.2.2 Gráficos de Control para _ con desviación típica
El uso del estadístico S para construir gráficos de control para _ está algo
menos extendido que el uso de la cuasidesviación, aún así resulta casi equivalentes
ambos gráficos y su construcción es también muy simple.
Los correspondientes límites teóricos, a partir de las expresiones dadas en
(4.2) y (4.3) son:
• LCS = c2_ + 3c3_ = B2_
• LC = c2_
60
• LCI = c2_ − 3c3_ = B1_
donde B1 y B2 están tabulados para diferentes tamaños de los subgrupos.
La estimación insesgada de _ es ahora
ˆ_ =
¯s
c2
.
Por tanto, los límites de control (provisionales) del gráfico resultan:
LCS = B2
¯s
c2
= B4¯s
LC = c2
¯s
c2
= ¯s
LCI = B1
¯s
c2
= B3¯s
(4.13)
Los mismos comentarios que hemos indicado para el gráfico de control
dado en (4.12) son válidos para este caso.
4.2.3 Gráficos de Control para _ con rangos
El tercer estadístico que se emplea para elaborar gráficos de control sobre
la variabilidad es el rango muestral. La media y desviación típica del rango
están dadas en (4.10) y (4.11), por lo que los límites de control teóricos son:
• LCS= d2_ + 3d3_ = D2_
• LC = d2_
• LCI = d2_ − 3d3_ = D1_
donde D2 y D1 están tabulados para diversos tamaños n (D1 = 0 si d2−3d3 < 0).
La estimación insesgada de _ se obtiene mediante
ˆ_ =
¯R
d2
,
61
por lo que los límites (provisionales) estimados resultan ser:
LCS = D2
¯R
d2
= D4 ¯R
LC = d2
¯R
d2
= ¯R
LCI = D1
¯R
d2
= D3 ¯R
(4.14)
La interpretación de este gráfico es como en los casos anteriores. Si el proceso
ha estado bajo control todos los puntos estarán dentro de los límites de
control. En caso contrario no podremos usar ese dato para la construcción
de gráfico y habrá que eliminar dicha muestra y recalcular tanto este gráfico
como el de las medias.
El uso de los rangos está justificado para el caso de subgrupos de tamaño
n relativamente pequeño (n _ 5), tanto porque su eficiencia como estimadores
de _ es muy similar a la de las desviaciones o cuasidesviaciones típicas
como porque, además, el cálculo de rangos y su interpretación es mucho
más simple sobre todo para personas que no necesariamente tengan una
cultura estadística suficiente.
Una vez que hemos construido el gráfico para la media y para la dispersión
con el conjunto de muestras iniciales, daremos por concluida la etapa
de diseño de los gráficos de control y los mantendremos ya fijos (límites de
control definitivos). Pasaremos entonces a utilizarlos en tiempo real, analizando
la estabilidad del proceso con nuevas muestras tomadas a intervalos
regulares de tiempo. Si una muestra cae entonces fuera de los límites de
control habrá que analizar rápidamente qué ocurrió para recuperar el control
del proceso. Cada cierto tiempo es conveniente actualizar los límites de
control con nuevas mediciones.
62
4.3 Tamaño de la muestra y frecuencia de muestreo
Cada punto de un gráfico de control corresponde al valor observado del
estadístico de interés (por ejemplo la media muestral, rango,..) evaluado en
una muestra de tamaño n en cierto instante.
Es necesario, por tanto, determinar dicho tamaño muestral así como la
frecuencia con que se computará para construir gráficos eficaces.
En la determinación del tamaño muestral intervienen factores económicos
y estadísticos, por lo que no se puede establecer un método universal.
En general, a mayor tamaño muestral, menor será la varianza del estadístico
y mas fácil será detectar desviaciones del estado de control. Por ejemplo,
la desviación típica de la media muestral es _/pn, por lo que si n es alto la
desviación típica es baja. Esto hará que los límites que contengan al 99.7%
de los valores en estado de control serán mas estrechos. Por tanto, si el proceso
sale fuera de control será más fácil que los puntos salgan de los límites
y detectemos el desajuste, sin que aumente la probabilidad de falsa alarma
que seguirá siendo del 0.3%.
Los principios subyacentes a la elección del tamaño y frecuencia demuestreo
son a menudo reagrupados bajo el nombre de: rational subgruping
Variación intra-subgrupos y entre subgrupos.
Una elección óptima de los subgrupos está basada en el objetivo perseguido
por cada tipo de gráfico:
• El gráfico de medias controla la tendencia central de la característica
de calidad. Por esta razón, las muestras deben ser seleccionadas con
objeto de maximizar la probabilidad de revelar cambios de tendencia
mediante el examen de las variaciones entre muestras.
• El gráfico de rangos o desviaciones tiene por objeto controlar la variabilidad
del proceso y verificar si la variable asociada a las causas normales
(o no específicas) de variación permanece constante.
63
Por estas razones, las muestras deben ser elegidas de manera que la varianza
dentro de cada muestra sea únicamente debida a causas normales
de variación y no a causas especiales que se supone que el gráfico de medias
debe detectar.
En otras palabras, el gráfico de la media controla la variabilidad entre
muestras (variabilidad del proceso en el tiempo, debida a las causas especiales)
y el gráfico de rangos o de desviaciones típicas mide la variabilidad
en el interior de la muestra (la variabilidad ‘instantánea’ del proceso en el
momento en el que la muestra es extraída).
Método de construir los subgrupos
Dos posibles aproximaciones a la hora de construir subgrupos:
La primera consiste en extraer todas las unidades de una muestra casi al
mismo tiempo. Esto tiene las siguientes consecuencias:
• Se obtiene una imagen casi instantánea del proceso en el momento de
extraer la muestra.
• Minimiza la probabilidad de observar una variación del proceso dentro
de la muestra y maximiza la probabilidad de capturar las causas especiales
de variación entre las muestras.
• Se obtiene una estimación de la variabilidad bastante precisa y unos
límites de confianza bastante estrechos. Esto puede ser preferible en
una fase de mejora del proceso.
• Su aplicación presupone que la varianza entre datos de un mismo grupo
es muy representativa de la varianza de la característica cuando el
proceso está bajo control. En particular, debe ser aplicada con prudencia
en procesos continuos donde la independencia corre peligro de no
verificarse entre los datos de un mismo sub-grupo.
• También es una estrategia peligrosa para procesos que pueden sufrir
variaciones bruscas y cortas en tiempo y que pueden suceder entre
dos extracciones.
64
La segunda aproximación consiste en extraer las unidades de un grupo
en intervalos regulares de tiempo o aleatoriamente dentro del lote que el
subgrupo representa. Para intentar minimizar la variabilidad en unmuestra, se
asociará un periodo de producción durante el que se puede esperar que el
proceso esté lo más estable posible. Un lote será por ejemplo, la producción
durante 1 hora, o un día, o un turno del operador, o un cargamento,. . . . Esta
aproximación da una vista más global de la producción. Dará en general,
límites de control más amplios que la anterior.
Tamaño de la muestra y frecuencia de muestreo
Algunos criterios a la hora de fijar el tamaño y la frecuencia de muestreo
son:
• La sensibilidad y la capacidad de reaccionar que se desea para el grá-
fico de control (ambos objetivos están enfrentados).
– Si el proceso evoluciona lentamente, se buscará un gráfico sensible
a pequeñas variaciones de la característica. Esto requiere muestras
de tamaño grande y no tan frecuentes.
– Si, por el contrario, el proceso evoluciona rápido, cambios bruscos
y rápidos, se buscará un gráfico que ‘reaccione’ adecuadamente.
Esto requiere muestras de menor tamaño y tomadas de modo más
frecuente.
• Las curvas de eficacia del tipo ARL pueden indicar el tamaño n de los
subgrupos en función de las variaciones esperadas por parte del proceso.
• Si la distribución de la característica de calidad es marcadamente no
normal, es recomendable aumentar el tamaño n de los subgrupos.
• La frecuencia de muestreo debe adaptarse a la lógica del proceso. Así,
por ejemplo, 3 muestras al día una en cada turno de 8 horas y con una
medida cada 2 horas (n = 4).
65
4.4 Curva Característica y tiempo medio de detección
Entre los elementos que determinan la elección de una gráfica de control
frente a otra o la propia elaboración de un gráfico de control, pueden considerarse
la curva característica y el tiempo medio de detección. Aplicamos
los principios básicos desarrollados en la sección 3.8. Veamos en este caso el
cálculo de la curva característica y del tiempo medio de detección cuando
la media varía de µ0 a µ = µ0 + c_ en un gráfico de control 3-sigma para la
media.
Curva Característica
La probabilidad de que una media de un subgrupo caiga dentro de los
límites de control viene dada por la fórmula:
OC(c) = P(LCI < ¯Xi < LCS|µi = µ0 + c_)
= P(µ0 − k_/pn < ¯Xi < µ0 + k_/pn|µi = µ0 + c_)
= P _µ0 − k_ − (µ0 + c_)
_/pn
< Z <
µ0 + k_ − (µ0 + c_)
_/pn _
= P(−k − cpn < Z < k − cpn) (4.15)
con Z la variable normal estándar.
Podemos encontrar ( o programar nosotros) gráficos de OC(c) para k = 3 y
diferentes valores de n.
Tiempo medio de detección
Razonando de modo análogo al de la sección 3.8, el tiempo medio (número
medio demuestras extraídas del proceso) de detección de una desplazamiento
de c_ unidades de la media viene dado (para k=3) por la siguiente
fórmula:
ARL(c) =
1
1 − OC(c)
=
1
P(−3 − cpn < Z < 3 − cpn)
(4.16)
66
5 4 3 2 1 0
1,0
0,5
0,0
C
probabilidad
Curva característica para gráficos x-bar con límites 3-sigma
Variación de la media (en desviaciones típicas)
n=1
n=2
n=5
n=10
Figura 4.1: Curva característica para gráficos ¯X y tamaños de subgrupo
diferentes
y se corresponde con el número medio de subgrupos que debemos representar
antes de una señal de alarma por un cambio de c_ unidades en la
media del proceso.
En ocasiones, al hablar del ARL, este valor se expresa en términos del número
de unidades observadas en lugar del número de muestras extraídas. La
conversión es fácil ya que I(c, n) = nARL(c, n).
En ambas formas de medir la eficacia de un gráfico de control se observa
que el aumentar el tamaño de los subgrupos acelera la detección de una
ARL(c, 1) ARL(c, 2) ARL(c, 5) ARL(c, 9)
c = 0 370 370 370 370
c = 1 44 18 5 2
c = 2 6 3 2 1
c = 3 2 1 1 1
Tabla 4.1: Diversos valores de Longitud Media de Racha en función de n y c
67
variación sin aumentar la probabilidad del error de tipo I, es decir, el peligro
de falsas alarmas. Se puede ver también que vale la pena la extracción
frecuente de pequeñas muestras pues el coste total en número de unidades
será netamente más interesante.
Existen gráficos que nos dan la probabilidad de alarma en la primera
muestra tras el cambio de media.
Por ejemplo, si queremos detectar una variación de 2_, un gráfico de medias
con n = 9 va a necesitar (en términos medios) 1 muestra de 9 unidades
para detectar la variación, mientras que con n = 2, son suficientes en media
3 muestras de 2 unidades.
Es igualmente posible estudiar la sensibilidad de los gráficos de control
basados en desviaciones típicas o en rangos. En estos casos las ’unidades
naturales’ de medir la eficacia son _ = _1/_0 donde _1 representa el nuevo
valor de la variabilidad y _0 el valor que teníamos bajo control. En los gráficos
se representa la probabilidad de detectar una variación dada por _ para
diferentes valores de n.
Estas curvas muestran en general, que los tiempos medios necesarios para
detectar una variación _ son muy largos y necesitan mayores muestras.
En general, la elección de la muestra de los subgrupos y de la frecuencia
de muestreo se hará especialmente en base a la media pues son las causas
asignables de variación las que tienen una influencia sobre el valor medio
del proceso. Si aparece un punto fuera de control sobre un gráfico de rangos,
por ejemplo, será muy frecuentemente debido a un dato ’aberrante’ o
atípico en el subgrupo y no a un cambio en la variabilidad del proceso. La
varianza del proceso se estudia, tal y como veremos, de forma más global
mediante un análisis de capacidad del proceso.
68
4.5 Efecto de la no normalidad de la característica
Gran parte del modo de proceder y de las propiedades de los gráficos de
control radica en la hipótesis de normalidad de la característica estudiada.
En la práctica no siempre se verifica esta hipótesis.
Si la distribución no es normal, podemos optar por alguna de estas dos
posibilidades:
• Transformar los datos (logaritmo, raíz cuadrada, . . . ) para obtener una
muestra normal.
• Si conocemos la distribución de la característica X (basada en conocimiento
histórico del proceso), podemos utilizar la distribución para determinar
los límites de control de forma adecuada.
• Podemos apelar al uso del teorema central límite que nos dice que si
una muestra Xij (j = 1, 2, . . . , n) está formada por datos i.i.d., entonces
su media ¯xi sigue aproximadamente una distribución normal si n es su-
ficientemente grande. Se ha estudiado bastante esta cuestión y se ha
llegado a saber que con tamaños de muestra de 4 o 5 datos se tiene
una razonable robustez frente a la no normalidad, sobre todo en los grá-
ficos de control de la media del proceso. Esta robustez es menor en el
control de la dispersión , tendiendo a dar gráficos con unos límites que
hacen que el riesgo _ de falsa alarma aumente bastante cuanto mayor
sea el alejamiento respecto a la distribución normal.
4.6 Ejemplo
Tomamos de nuevo los datos utilizados en la sección 3.10, ahora suponiendo
grupos o lotes de tamaño 4. Calculamos los límites de control basados en las
69
40 primeras observaciones o lo que es lo mismo en los 10 primeros grupos. Ya
sabíamos que estas observaciones provenían del proceso bajo control.
La siguiente tabla nos da las medias, desviaciones estándar y rango de
cada uno de los 20 lotes o subgrupos.
grupo ¯xi sn−1,i Ri grupo ¯xi sn−1,i Ri
1 12,0669 1,74056 3,92161 11 13,0604 1,03691 2,33581
2 14,5775 1,46474 3,30334 12 14,0978 1,61344 3,78833
3 13,1232 0,96847 2,28433 13 15,1747 1,48982 3,35571
4 14,1743 1,33864 3,12966 14 15,1370 1,93966 4,09942
5 13,3415 1,91272 4,43768 15 15,4627 1,69407 3,87455
6 11,9851 0,98792 2,15300 16 14,8638 1,08101 2,44430
7 11,7575 1,55131 3,25506 17 16,2614 2,06749 5,01735
8 12,1234 1,55809 3,81461 18 15,0305 2,26778 5,25479
9 11,5489 1,77561 3,61346 19 15,4126 0,85691 1,96958
10 14,3515 2,57474 5,48719 20 13,6994 0,86443 1,93295
Tenemos para los 10 primeros subgrupos,
¯¯x
=
12, 905 ¯
sn−1
=
1, 5873 ¯R
= 3, 54
Resulta entonces que los límites de un gráfico de control para la media
serían,
LCS = ¯¯x + A2 ¯R= 15, 49
LC = ¯¯x = 12, 91
LCI = ¯¯x − A2 ¯R = 10, 33
(4.17)
con A2 = 0, 729. Para el cálculo de lo límites de control asociados al rango,
tenemos
LCS = D4 ¯R = 8, 076
LC = ¯R = 3, 54
LCI = D3 ¯R = 0, 00
(4.18)
donde D4 = 2, 282 y D3 = 0, 000.
El gráfico 4.2 recoge los datos de los 20 subgrupos y los límites de control
calculados con los 10 primeros.
70
20 10 Subgroup 0
17
16
15
14
13
12
11
10
Sample Mean
1
X=12,90
3,0SL=15,48
-3,0SL=10,33
9876543210
Sample Range
R=3,540
3,0SL=8,076
-3,0SL=0,000
Xbar/R Chart para datos simulados (subgrupos de tamaño 4)
Figura 4.2: Gráfico de control x-barra/R para datos simulados agrupados.
Límites basados en los 10 primeros subgrupos
Podemos ver que la variabilidad del proceso parece estar bajo control
a lo largo de todo el periodo. Sin embargo, vemos que el subgrupo sale
de control indicando la existencia de una causa específica (en este caso
la variación en la media del proceso de generación de los datos). Con el
gráfico actual detectamos el cambio en media antes de la observación 68
(grupo 17) a diferencia del gráfico ?? en el que debíamos esperar hasta la
observación 67. Observemos que el grupo 15 está situado sobre el límite de
control, si lo hubiera sobrepasado hubiéramos detectado la alarma en la
observación 60. Por otro lado observemos que todos los subgrupos desde el
11 están al mismo lado de la LC. Si empleamos los test de inestabilidad, se
dan los patrones 5 y 6 en el subgrupo 14 y siguientes, por lo que desde la
observación 56 (16 tras el cambio real) ya se nos pone sobreaviso de que el
proceso parece comportarse de forma extraña. En general, los gráficos de
control basados en subgrupos suelen dar señales de alerta o de alarma más
rápidas que los gráficos basados en observaciones individuales.
71
4.7 Capacidad de un proceso. Índice de capacidad
Se define capacidad de un proceso en el que la calidad se mide a través de
una variable cuantitativa X con Var(X) = _2 como:
Capacidad = 6_,
donde _ es la desviación típica de la variable cuando el proceso esta bajo
control. La capacidad del proceso es una medida de la calidad del proceso
muy utilizada en la práctica. La capacidad es una cualidad negativa. A
mayor capacidad mayor variabilidad. Estimar la capacidad se resume en
estimar _. Esta estimación se hace a partir de los gráficos elaborados anteriormente.
Los pasos para estimar la capacidad se pueden resumir de la
siguiente forma:
1. Se seleccionan n muestras de tamaño k recogidas durante un intervalo
amplio de tiempo.
2. Se construye, con los datos obtenidos de dichas muestras, un gráfico de
control para ¯x y otro para la dispersión (el de rangos o el de cuasidesviaciones
típicas).
3. Si alguna muestra está fuera de los límites, se elimina y se recalculan
ambos gráficos (media y dispersión), repitiéndose este proceso hasta
que todas las muestras estén entre los límites de control.
4. Una vez asegurado que los datos proceden de un proceso en estado
de control se ha de verificar la hipótesis de normalidad de los datos mediante
algún procedimiento estadístico (contraste de normalidad, grá-
fico en papel probabilístico-normal, etc).
5. La estimación de la capacidad será, si se utiliza la desviación típica de
cada muestra sin corregir por grados de libertad:
Capacidad estimada = 6ˆ_ = 6
¯s
c2
.
72
Si se utiliza la desviación típica corregida:
Capacidad estimada = 6ˆ_ = 6
¯sn−1
c4
.
Si se utiliza el rango para medir la variabilidad, se tendrá la siguiente
estimación de la capacidad
Capacidad estimada = 6ˆ_ = 6
¯R
d2
.
No debe confundirse la capacidad de un proceso (o máquina o tarea
concreta) con las tolerancias técnicas del producto. Las tolerancias son los
requerimientos técnicos para que el producto sea admisible para su uso,
mientras que la capacidad es una característica estadística del proceso que
elabora dicho producto. Para comparar ambas características se define el
índice de capacidad de un proceso Cp de la siguiente manera:
Cp =
Tolerancia
Capacidad
=
LTS − LTI
6_
donde LTS es el límite de tolerancia superior y LTI es el límite de tolerancia
inferior, ambas especificaciones están fijadas ’externamente’ (por una normativa
legal o por el conjunto de compradores). Si Cp > 1 se dice que el
proceso es capaz, pues prácticamente todos los artículos que produzca estarán
dentro de las tolerancias requeridas. Si Cp < 1 se dice que el proceso no
es capaz. Si Cp _ 1 habrá que vigilarmuy de cerca el proceso, pues cualquier
pequeño desajuste provocará que los artículos no sean aceptables.
Actualmente, sin embargo, un índice de capacidad cercano a uno se
considera insuficiente. Es frecuente utilizar el valor Cp = 4/3 _ 1, 33 como límite
inferior de la calidad que debe tenerse en la práctica. Esto implica que
LTS-LTI
6_
=
4
3 ) LTS-LTI = 8_,
por tanto serían defectuosos aquellos artículos que estén a más de 4_ de la
media; esto es, aproximadamente, 64 piezas por millón (bajo normalidad).
Por esta razón se dice que
73
• Si Cp < 1 el proceso no es capaz
• Si Cp > 1.33 el proceso es capaz
• Si 1 _ Cp _ 1.33 el proceso es capaz pero requiere un seguimiento muy
estricto
4.7.1 Índices de capacidad unilaterales CpL y CpU
Estos índices se utilizan cuando los límites de tolerancia son unilaterales. Por
ejemplo, el nivel de vibración de un motor, la tensión de rotura de un material,
temperatura máxima que admite un componente electrónico hasta que
falle, etc. En estos casos, la tolerancia se mide desde el valor nominal central
hasta el valor extremo indicado por las especificaciones. Esta cantidad se
compara con 3_. El índice CpL (o CpI ) se utiliza cuando existe una especifi-
cación mínima, pero no una máxima; mientras que el índice CpU (o CpS) se
usa cuando se debe cumplir con una especificación máxima. Estos índices
se definen de la siguiente manera:
CpL =
¯¯
x − LTI
3_
CpU =
LTS − ¯¯x
3_
(4.19)
Cuando cualquiera de estos dos índices es menor que 1, el proceso no
cumplirá las especificaciones. Por tanto, son también útiles cuando existen
ambas especificaciones, mínima y máxima. Por ejemplo, el proceso podría
estar descentrado (la media ¯¯x no coincidirá con el centro del intervalo de
especificaciones (LTS+LTI)/2). Es fácil comprobar que
Cp =
LTS − LTI
6_
=
1
2
(LTS − ¯¯x) + (¯¯x − LTI)
3_
=
CpL + CpU
2
.
74
Por tanto uno de los coeficientes podría ser menor que uno y compensarse
con el otro y dar un coeficiente Cp > 1, produciendo la falsa impresión de que
el proceso es capaz. Por esta razón es siempre útil calcular estos dos índices.
Existen procesos en los que se conoce el valor nominal que debe cumplir
la característica de calidad. Por ejemplo, la resistencia nominal de un componente
eléctrico, o el radio de un cilindro, etc. En esos casos, en lugar de
la media muestral ¯¯x habrá que usar dicho valor nominal µN. En ese caso, la
definición de los índices sería:
CpL =
µN − LTI
3_
CpU =
LTS − µN
3_
(4.20)
4.7.2 Índice de capacidad unilateral mínimo Cpk
Este índice es el mínimo de los dos índices unilaterales, es decir:
Cpk = min(CpL,CpU ),
y su interpretación es similar a los anteriores índices.
4.7.3 Índice de capacidad recíproco Cr
Este índice es el inverso de Cp, es decir, Cr = 1/Cp. Su interpretación es la
siguiente:
• Si Cr > 1, el proceso no es capaz
• Si Cr < 0, 75, el proceso es capaz
• Si 0, 75 _ Cr _ 1, el proceso es capaz pero precisa de un control estricto
75
4.7.4 Índice de capacidad modificado Cpm
Este índice es similar al Cp, salvo que utiliza el valor nominal µN en lugar de la
mediamuestral ¯¯x en el cálculo de la desviación típica. Por tanto, su definición
es (estimando _ con k muestras de tamaño n):
Este índice es más conservador que Cp (es decir, suele salir más bajo). Suele
ser más recomendable cuando se poseen pocos datos.
4.7.5 Coeficiente K
Este coeficiente es una medida de la descentralización del proceso. Se de-
fine como: K =
¯¯
x − µN
1
2 (LTS-LTI)
. Si K > 0, el proceso tiene un sesgo hacia valores
superiores al nominal (sesgo positivo), mientras que si K < 0, el sesgo es hacia
valores inferiores al nominal (sesgo negativo). Este índice no está relacionado
con la capacidad, por lo que un proceso puede ser no capaz y tener un
valor de K bajo.
4.7.6 Coeficiente n-sigma
Este coeficiente consiste en la expresión de los límites de tolerancia en función
de la desviación típica del proceso de la forma LTS − LTI = 2n_. Esta
definición de las tolerancias equivale a LTS = µ + n_ y LTI = µ − n_. Por tanto,
un índice de capacidad Cp = 1 equivale a 3-sigma y Cp = 2 equivale a
un nivel de calidad 6-sigma (en inglés six sigma). Actualmente se considera
que una organización ha alcanzado un cota muy alta de calidad si su
nivel es 6-sigma. Por esta razón a los programas de formación en técnicas
estadísticas para la calidad se les suele denominar ‘six-sigma training’, y muchas
organizaciones y empresas relacionadas con la calidad y la estadística
suelen ponerse la etiqueta ‘six-sigma’ en sus nombres.
Es frecuente interpretar el nivel de calidad n-sigma en términos de número
de artículos defectuosos por millón. Para ello hay dos posibles alternativas
76
que suelen producir confusión. La primera alternativa consiste en emplear
estrictamente su significado (siempre se supone normalidad). Por ejemplo,
si el proceso está en estado de control y el nivel de calidad es 3-sigma, el
0.0027% de los artículos son defectuosos. También puede decirse en este
caso que 2700 artículos por millón serán defectuosos.
Una segunda interpretación, popularizada por la empresa Motorola, consiste
en calcular el número de defectos por millón cuando se produce un
desajuste en la media de ±1, 5_, considerándose que cualquier causa asignable
puede fácilmente provocar este nivel de desajuste. Es útil, por tanto,
comparar los límites de tolerancias con la dispersión total del proceso en esta
situación de desajuste.
En esta nueva situación, el 99,7% de la producción no estará entre ±3_,
sino entre ±4, 5_. La proporción (tantos por millón) de artículos defectuosos
que se producen con y sin el desajuste de 1.5_ es, en función de los límites de
tolerancia (LTS − LTI) y suponiendo normalidad, la siguiente:
LTS-LTI En estado de control desajuste de ±1.5_
±1_ 317300 697700
±2_ 45500 308700
±3_ 2700 66810
±4_ 63 6210
±5_ 0.57 233
±6_ 0.002 3.4
Por ejemplo, un artículo defectuoso de entre 160 artículos equivale a una
proporción de
1
160
= 0, 00625 = 6250 × 10−6 ) 6250 por millón,
que es, aproximadamente, un nivel de calidad de 4-sigma y equivale a un
índice de capacidad de
Cp =
8_
6_
=
4
3
= 1, 33,
77
que es considerado, como se mencionó anteriormente, el nivel mínimo de
calidad que se debe tener. De esta forma, un sistema con nivel de calidad
6-sigma (six sigma) producirá, por término medio, 3,4 artículos defectuosos
por millón.
4.8 Gráficos de observaciones individuales y rangos
móviles x-RM
En algunos casos es necesario controlar un proceso basándose en lecturas
de observaciones individuales, en lugar de grupos de ellas. Este es el caso
de artículos en los que las mediciones son caras (por ejemplo en ensayos
destructivos, o ensayos que requieren condiciones especiales) o cuando la
producción en un momento dado es homogénea respecto a la variable de
interés (por ejemplo, el PH de una disolución química). Este tipo de control es,
sin embargo, menos sensible que los anteriores. Por eso, a veces resulta más
adecuado un gráfico ¯x − R convencional con un tamaño muestral pequeño
que este tipo de gráfico, incluso si el intervalo necesario para conseguir las
muestras es grande.
En la sección 3.10 desarrollamos un ejemplo de gráfico de control para
observaciones individuales en el que estimábamos tanto la media como la
desviación típica de la característica de calidad. La estimación de la desviación
típica utilizando toda la muestra no era la más correcta. El motivo
era que había variaciones en la media a lo largo del periodo observado, y el
estimador así utilizado tiende a sobre-estimar la desviación real del proceso.
Por este motivo, se prefiere la estimación de la dispersión basada en rangos
móviles; generalmente de pares de observaciones consecutivas.
Los pasos a seguir para realizar el gráfico son los siguientes:
1. Conseguir lecturas de un conjunto de k observaciones: x1, . . . , xk.
78
2. . Calcular la media global: ¯x = Pk
i=1 xi
k . Si el proceso ha estado bajo
control durante la recogida de estos datos, este valor será un buen
estimador de la media global y se utilizará como línea central.
3. Calcular rangos móviles entre pares de individuos. Estos rangos móviles
se obtienen de la siguiente manera: el primer rango consiste en
R1 = max(x2, x1) − min(x2, x1) _ |x2 − x1|.
En el segundo rango se añade la tercera observación, pero se prescinde
de la primera:
R2 = max(x3, x2) − min(x3, x2) _ |x3 − x2|,
y así sucesivamente. El último rango será:
Rk−1 = max(xk, xk−1) − min(xk, xk−1) _ |xk − xk−1|.
En circunstancias excepcionales podría calcularse rangos móviles con
más de dos observaciones (tres o cuatro). Por ejemplo, con cuatro observaciones
se tendría:
R1 = max(x4, x3, x2, x1) − min(x4, x3, x2, x1)
R2 = max(x5, x4, x3, x2) − min(x5, x4, x3, x2)
...
Rk−3 = max(xk−3, xk−2, xk−1, xk) − min(xk−3, xk−2, xk−1, xk)
4. Obtener el rango móvil medio. En el caso de rango móvil de pares de
observaciones se tendrá:
¯R
= Pk−1
i=1 Ri
k − 1
.
5. Calcular los límites de control para la media a distancia de tres desviaciones
típicas respecto a la línea central marcada por ¯x:
LCS = ¯x + 3
¯R
d2
LCI = ¯x − 3
¯R
d2
79
6. Análogamente para el gráfico de rangos se tiene que:
LCS = D4 ¯R
LCI = D3 ¯R
4.8.1 Ejemplo
De nuevo consideramos los datos de la sección 3.10 para ilustrar la construcción
de este tipo de gráficos. Utilizaremos las 40 primeras observaciones para
estimar los límites de control, de donde se obtiene que
ˆµ = ¯x = 12, 90 y ¯R = 1, 841
por lo que los límites de control para la media resultan ser:
LCS = ¯x + 2, 66 ¯R = 17, 80
LC = ¯x = 12, 90
LCI = ¯x − 2, 66 ¯R = 8, 008
y para el gráfico de control de la dispersión,
LCS = 3, 267 ¯R = 6, 016
LC = ¯R = 1, 841
LCI = 0 ¯R
Podemos ver en la figura 4.3 los gráficos de control tanto de las observaciones
individuales como de los rangos móviles. Se aprecia, al igual que
sucedía en la sección 3.10, que la dispersión parece permanecer estable pero
que se produce una salida de control en la media en el mismo punto que
ya se había obtenido antes. Los límites de control para las observaciones individuales
son muy parecidos a los que se disponía con la estimación basada
en la cuasidesviación típica de los datos.
80
80 70 60 50 40 30 20 10 Subgroup 0
20
15
10
Individual Value
1
X=12,90
3,0SL=17,80
-3,0SL=8,008
7
6
5
4
3
2
1
0
Moving Range
R=1,841
3,0SL=6,016
-3,0SL=0,000
I and MR Chart for C3
Figura 4.3: Ejemplo de gráfico de control X-RM para datos individuales y
rangos móviles de longitud 2. Límites calculados sólamente con los 40 primeros
datos
4.9 Interpretación de los gráficos de control
La interpretación de los gráficos de control se basa en la siguiente idea general:
si el proceso está en estado de control, los gráficos deben mostrar un
comportamiento aleatorio dentro de los límites de control; por tanto una evolución
de los gráficos que tenga un patrón no aleatorio o/y fuera de los límites
será indicio de existencia de causas asignables.
Se suele interpretar en primer lugar los gráficos de la variabilidad (rango
o desviación típica), pues un aumento de la variabilidad puede provocar un
aumento de la media muestral, mientras que el fenómeno inverso no ocurre.
Los aspectos a analizar son: puntos fuera de los límites, tendencias o rachas,
patrones no aleatorios.
81
40 30 20 10 0
18
13
8
Observation Number
Individual Value
Gráfico de Control (Zonas de Aviso)
X=12,90
1,0SL=14,54
2,0SL=16,17
3,0SL=17,80
-1,0SL=11,27
-2,0SL=9,641
-3,0SL=8,008
Zona A
Zona A
Zona B
Zona B
Zona C
Figura 4.4: gráfico de control con las zonas de aviso marcadas
4.9.1 Puntos fuera de los límites de control
Si uno o más puntos de un gráfico de control está fuera de los límites es indicio
de que el proceso se ha desajustado y conviene analizar el proceso para
encontrar la causa. Un punto fuera de los límites puede ser debido a alguno
de los siguientes motivos:
• El punto ha sido mal calculado.
• Los límites han sido mal calculados o el gráfico mal dibujado.
• Hay variaciones en el sistema de medición del dato (nuevos calibres,
distinto aparato de medida).
• Una variación de la media pero no en la variabilidad puede venir provocada
por un desajuste en la maquinaria o desgaste de alguno de sus
elementos.
82
• Un aumento de la variabilidad pero no de la media puede venir provocada
por envejecimiento de alguno de los componentes del proceso o
por variaciones en la calidad de la materia prima.
• Una disminución de la variabilidad (puntos por debajo del límite inferior)
implica una mejora del sistema, por lo que debe investigarse la causa.
4.9.2 Tendencias, rachas y patrones de no aleatoriedad
Ya hemos comentado en la sección 3.9, las ventajas e inconvenientes de
introducir test de inestabilidad que ayuden a aumentar la sensibilidad del
gráfico ante pequeñas variaciones de la característica de calidad. Además
de estos avisos, hay también otros criterios basados en las mismas ideas.
Cuando un conjunto de puntos consecutivos presentan una tendencia
creciente o decreciente durante 7 puntos (‘regla del 7Š) es indicio de que
algo está ocurriendo en el proceso, pues la probabilidad de que muchos
puntos formen una tendencia sólo por azar es prácticamente nula. Por tanto
ha de investigarse la presencia de una causa asignable incluso si dichos puntos
están dentro de los límites. Por ejemplo, un desajuste paulatino de una
herramienta provocará un desajuste paulatino en la media del proceso. Es
necesario detectar ese desajuste y no esperar a que produzcan valores fuera
de los límites de control. Un desgaste en la sujeción de una herramienta
de corte irá aumentando gradualmente la variabilidad en la longitud de corte.
Ese desgaste puede detectarse sin necesidad de llegar a que el sistema
produzca piezas defectuosas.
Cuando un conjunto de 7 puntos sucesivos se encuentran consistentemente
a un lado de la línea central del gráfico (racha) es indicio de anomalía
incluso si se encuentran dentro de las líneas de control. De nuevo, la probabilidad
de que sólo por azar más de 7 puntos se encuentren en un lado del
gráfico es prácticamente nula, por lo que habrá que investigar la presencia
de causas asignables.
83
Además de tendencias o rachas, pueden aparecer otros patrones (patrones
de no aleatoriedad) en los datos que deben llevar al análisis del sistema incluso
si los datos evolucionan dentro de los límites de control. Por ejemplo:
• Periodicidades en forma de ciclos, con sucesiones regulares de picos y
valles.
• Inestabilidad: grandes fluctuaciones de la media, producidos, posiblemente
por sobreajustes del proceso, falta de entrenamiento de los operarios
o heterogeneidad en la materia prima.
• Sobrestabilidad: Ocurre este fenómeno cuando la variabilidad observada
es consistentemente menor que la esperada. Esto puede ser debido
tanto a un cálculo erróneo de los límites como a causas asignables
que afecten positivamente al proceso. Para detectar la sobreestabilidad
conviene trazar dos líneas paralelas en el gráfico de la variabilidad
(rangos o desviaciones típicas) a ambos lados de la línea central que
dividan el gráfico en seis partes iguales. (gráfico ) En condiciones normales,
el 68% de los puntos debería estar entre las dos zonas centrales,
mientras que el 32% debería estar fuera.
Los tests de inestabilidad consisten en la detección de patrones en los grá-
ficos que sean muy poco probables si el proceso está bajo control. La mayoría
de los programas informáticos los incluye. Para detectarlos se dividen
las dos áreas alrededor del límite central en tres zonas iguales: A, B, C (ver
gráfico 4.4). Cada línea corresponderá, entonces, a una desviación típica.
Existen un total de ocho patrones. Si se detecta la presencia de alguno de
ellos se ha de considerar la posibilidad de que sea debido a alguna causa
asignable. (ver sección 3.9)
84