Enlace Local # 13

Capítulo 4

Control de Procesos por variables

En este capítulo supondremos que la variable que se representa es medida en una escala numérica: tiempo, longitud, peso, etc. Al control estadístico de esta variable le denominaremos control por variables.

 

4.1 Gráfico de control para la media

El gráfico de control de la media, también llamado Gráfico ¯x recoge la evolución de la media muestral, en muestras de tamaño n, de la característica de calidad de interés. Por ejemplo, el tiempo medio de atención a un cliente tomando muestras de 10 clientes, o el radio medio de un cilindro, tomando muestras de 20 cilindros. Supondremos en este capítulo que dicha media muestral ¯x sigue una distribución normal.

 

Si la variable X sigue una distribución normal, la media muestral ¯x será también normal. Si la variable original

no es normal, pero n es elevado, por el teorema central del límite ¯x será aproximadamente normal. Existen, además, transformaciones que permiten convertir una variable aleatoria continua asimétrica en una variable que se aproxime razonablemente a la normal. Por otra parte, si el proceso está en estado de control, es muy razonable esperar que la variable de interés sea

52 normal (¿por qué?). Por esta razón, la construcción de los gráficos ¯x se realiza suponiendo que la media muestral sigue una distribución normal.

 

Por tanto la distribución del estadístico media muestral ¯x es, ¯x _ N_µ, _ n_, donde µ y _ son la media y desviación típica, respectivamente, de la variable de interés X cuando la variabilidad procede solo de causas no asignables, es decir, cuando el proceso esta bajo control.Bajo esta hipótesis, un intervalo que comprenda al 99.7% de la probabilidad estará comprendido

en µ ± 3_/pn. El gráfico de control tendrá las siguientes características:

 

LCS = µ + 3

_

pn

Línea Central(LC) = µ

LCI = µ − 3

_

pn

 

(4.1)

 

En la práctica se ha de estimar, por tanto, los parámetros µ y _. Para estimarlos se toman muestras de la producción (o prestación del servicio) durante un periodo prolongado de tiempo en el que se sepa que el proceso está bajo control. Una vez que se ha construido el gráfico, éste se utilizará en primer lugar para comprobar que realmente el proceso estuvo bajo control mientras se recogía esta información inicial. En caso contrario, se ha de prescindir de aquellas muestras en las que el proceso no estuvo bajo control y se repetirá el cálculo del gráfico, tal y como se ha comentado en 3.7.4.

 

El periodo de tiempo en el que se tomen los datos iniciales para la etapa de construcción del gráfico debe ser lo suficientemente amplio para permitir que haya cambios de turno, variabilidad en la materia prima, horas punta del servicio y horas valle, etc. La estimación de los parámetros será, además, una tarea que ha de someterse a revisión periódica. Veamos a continuación

como ha de hacerse la estimación de µ y _. 53

 

4.1.1 Estimación de los parámetros del gráfico ¯x

 

Sea X la variable que mide la calidad de los artículos producidos, o uno de los aspectos de la calidad que nos interese. Supongamos que se recogen un total de k muestras a intervalos regulares de tiempo y en cada muestra hay n elementos. Sea xij el valor del elemento j-ésimo (j = 1, .., n) de la muestra i-ésima (i = 1, ..., k). El conjunto total de datos será:

(x11, x12, ..., x1j , ..., x1n)

| {z } muestra 1

(x21, x22, ..., x2j , ..., x2n)

| {z } muestra 2

(xi1, xi2, ..., xij , ..., xin)

| {z } muestra i

. . .

(xk1, xk2, ..., xkj , ..., xkn)

| {z } muestra k

 

Si el proceso estuviese bajo control durante toda la recogida de estos nk  datos, estos constituirían unamuestra aleatoria simple (de tamaño nk) de una población normal N(µ, _). El gráfico se construye, entonces, de la siguiente manera:

 

1. Se calcula la media y varianza de cada muestra. Por ejemplo, para los

n datos de la primera muestra:

¯x1 = Pn

j=1 x1j

n

s21

= Pn

j=1(x1j − ¯x1)2

n

varianza muestral

s2

n−1,1 = Pn

j=1(x1j − ¯x1)2

n − 1

cuasivarianza muestral

 

Se tendrán, por tanto, k medias y k varianzas.

 

2. Se calcula la media total. La media total será:

¯¯

x = Pk

i=1 ¯xi

k

54

 

Este estimador será centrado si la media µ del proceso ha sido constante durante la recogida de la información. Sin embargo, puede demostrase que los estimadores s1 y sn−1,1 no son estimadores insesgados de _ aun estando el proceso bajo control (E(s1) 6= _;E(sn−1,1) 6= _). El sesgo depende, además, del tamaño de la muestra n. No obstante, el sesgo para poblaciones normales está tabulado. La desviación típicamuestral S es una variable aleatoria que verifica

 

E(S) = c2_ (4.2)

Var(S) = c23

_2 (4.3)

 

donde los valores de c2 y c3 están tabulados para distintos tamaños muestrales. Por tanto se tiene que _ =

E(S)

c2

y, entonces, si/c2 sí es un estimador insesgado de _. Podremos construir un estimador insesgado de _ promediando los estimadores insesgados si/c2 de las k muestras:

ˆ_ =

¯s

c2

(4.4)

¯s = Pk

i=1 si

k

. (4.5)

Otra posible opción sería partir de un estimador insesgado para la varianza de cada muestra, la cuasivarianza muestral. Por ejemplo, para la muestra 1:

sn−1,1 = sPn

j=1(x1j − ¯x1)2

n − 1

Este estimador verifica que

E(Sn−1) = c4_ (4.6)

Var(Sn−1) = (1 − c24

)_2 = c25

_2 (4.7)

55

donde c4 está tabulado en función de n. Por tanto se tiene que

_ =

E(Sn−1)

c4

y, entonces, sn−1,i/c2 también es un estimador insesgado de _. Resulta entonces:

ˆ_ =

¯sn−1

c4

(4.8)

¯sn−1 = Pk

i=1 sn−1,i

k

. (4.9)

Si utilizamos los valores sj para la estimación de la desviación típica, el gráfico de control teórico (4.1) ha de substituirse por el siguiente gráfico de control con los límites estimados (provisionalmente)

LCS = ¯¯x + 3

¯s

c2pn

= ¯¯x + A1¯s

LC = ¯¯x

LCI = ¯¯x − 3

¯s

c2pn

= ¯¯x − A1¯s

Si utilizamos los valores sn−1,j para la estimación de la desviación típica, el gráfico de control teórico (4.1) ha de substituirse por el siguiente gráfico de control con los límites estimados (provisionalmente)

LCS = ¯¯x + 3

¯sn−1

c4pn

= ¯¯x + A3¯sn−1

LC = ¯¯x

LCI = ¯¯x − 3

¯sn−1

c4pn

= ¯¯x − A3¯sn−1

En ningún caso es aconsejable la estimación de _ a partir de la cuasidesviación o la desviación típica de toda la muestra a la vez. Esto es debido a que si el proceso no se encuentra en estado de control, las estimaciones así obtenidas están recogiendo tanto la dispersión intra-muestral como entre muestras.

56

Como decíamos, recordemos que estamos aún en la etapa de construcción del gráfico de control, y que para ello estamos suponiendo que los datos que se poseen son representativos del proceso en estado de control. Esta suposición hemos de corroborarla con este gráfico inicial. Si algún punto saliese de los límites de este gráfico concluiremos que el proceso estaba fuera

de control y lo eliminaremos. A continuación se recalculará ¯¯x y ¯s (o ¯sn−1 ) con lasmuestras restantes, dibujaremos un nuevo gráfico y repetiremos el proceso hasta que todas las muestras estén dentro de los límites.

 

La estimación de _ no sólo se puede realizar en base a las desviaciones típicas muestrales, también es posible obtener un estimador de este parámetro basado en el rango muestral. El rango de una muestra es la diferencia entre los valores extremos. Por ejemplo, en la muestra 1:

R1 = max{x11, x12, ..., x1n} − min{x11, x12, ..., x1n}

El rango será, por tanto, proporcional a la variabilidad de la variable. En muchas

ocasiones se analiza la variabilidad a través del rango, en lugar de la

desviación típica muestral. La razón principal es su simplicidad de cálculo.

Además, en muestras pequeñas, es un estimador de la desviación típica casi

tan eficaz, desde el punto de vista matemático, como la desviación típica

muestral. Supongamos que x _ N(µ, _) y R es el rango de una muestra de

tamaño n de dicha variable aleatoria normal. El rango será también una variable

aleatoria. Esta variable aleatoria depende de _ y de n y fue tabulada

por primera vez por Pearson en 1932. La distribución que está tabulada es la

de la variable aleatoria

W =

R

_

para varios tamaños muestrales. Llamemos d2 := E(W) y d3 := Var(W), donde

d2 y d3 están tabulados. Entonces:

µR := E(R) = E(W)_ = d2_ (4.10)

_R := pVar(R) = d3_

57

De la expresión (4.10), se deduce que

_ =

E(R)

d2

por lo tanto, un estimador de _ será:

ˆ_ =

¯R

d2

donde

¯R

= Pk

i=1 Ri

k

.

El gráfico de control teórico (4.1) ha de substituirse por el siguiente gráfico

de control con los límites estimados (provisionalmente)

LCS = ¯¯x + 3

¯R

d2pn

= ¯¯x + A2 ¯R

LC = ¯¯x

LCI = ¯¯x − 3

¯R

d2pn

= ¯¯x − A2 ¯R

Las constantes d2 y d3 están tabuladas considerando que la distribución

de referencia es normal. Sin embargo Burr demostró en 1967 que estas constantes

varían muy poco para una amplia variedad de distribuciones, con tal

que n _ 10.

4.2 Gráfico de control para la dispersión

Estamos suponiendo que la variable x es normal. Por tanto su distribución

no depende solo de la media µ, sino de la varianza _2. Por consiguiente,

para comprobar que el proceso esté bajo control no basta con demostrar

que µ ha sido estable; es decir, que los puntos del gráfico de media están

entre sus límites. Hemos de comprobar también que la varianza _2 de la

variable de interés X permanece estable. Esto se puede llevar a cabo con

58

un gráfico de control para la desviación típica _. Veamos a continuación

gráficos para controlar que la dispersión de la variable es estable a lo largo

de la producción o la prestación del servicio. Veremos tres tipos de gráficos

según la dispersión se mida a través de la desviación típica, cuasidesviación

típica o del rango (muestral). Al igual que con el gráfico de las medias, si

no se conoce _, primero habrá que construir sus límites con un conjunto de

información inicial.

Si denotamos por ˆ_ un estimador de _, los límites de control teóricos, de

acuerdo con los comentarios realizados en la sección 3.7.1, para un gráfico

de control ’3-sigma’ para la dispersión serán:

LCS = E(ˆ_) + 3pVar(ˆ_)

Línea Central(LC) = E(ˆ_)

LCI = E(ˆ_) − 3pVar(ˆ_)

(4.11)

4.2.1 Gráficos de Control para _ con cuasidesviación típica

El gráfico de control de la cuasidesviación típica muestral (corregida por grados

de libertad) o Gráfico S (así es como se denomina en muchas aplicaciones

informáticas, pero no hay que confundirlo con la notación aquí utilizada)

se utiliza para controlar que la desviación típica es estable, y por tanto representativa

de la variabilidad debida a causas no asignables.

El cálculo de los límites teóricos del gráfico de control se realiza utilizando

el estadístico Sn−1 (cuasidesviación típica), cuya media y desviación típica se

dan en la expresión (4.6) y (4.7), por lo que substituyendo en (4.11)

• LCS = c4_ + 3c5_ = B6_

• LC = c4_

• LCI = c4_ − 3c5_ = B5_

59

donde B5 y B6 están tabuladas para diversos valores de n, en el caso de que

c4 − 3c5 < 0 el LCI se toma como 0.

Cuando _ es desconocido, se toma como estimador insesgado suyo

ˆ_ =

¯sn−1

c4

.

Por tanto, los límites de control (provisionales) del gráfico resultan:

LCS = B6

¯sn−1

c4

= B4¯sn−1

LC = c4

¯sn−1

c4

= ¯sn−1

LCI = B5

¯sn−1

c4

= B3¯sn−1

(4.12)

donde B3 y B4 están tabulados. La estimación ¯sn−1 es la obtenida en la sección

anterior con las muestras iniciales. Si algún dato cae fuera de los límites

se considerará que el proceso ha estado fuera de control en ese momento,

por lo que ese datos no puede emplearse para la construcción de ningún

gráfico de control. Por tanto, la muestra hay que eliminarla tanto para el

cálculo del gráfico de medias como de desviaciones típicas. Hay que recalcular,

por tanto, ambos gráficos.

4.2.2 Gráficos de Control para _ con desviación típica

El uso del estadístico S para construir gráficos de control para _ está algo

menos extendido que el uso de la cuasidesviación, aún así resulta casi equivalentes

ambos gráficos y su construcción es también muy simple.

Los correspondientes límites teóricos, a partir de las expresiones dadas en

(4.2) y (4.3) son:

• LCS = c2_ + 3c3_ = B2_

• LC = c2_

60

• LCI = c2_ − 3c3_ = B1_

donde B1 y B2 están tabulados para diferentes tamaños de los subgrupos.

La estimación insesgada de _ es ahora

ˆ_ =

¯s

c2

.

Por tanto, los límites de control (provisionales) del gráfico resultan:

LCS = B2

¯s

c2

= B4¯s

LC = c2

¯s

c2

= ¯s

LCI = B1

¯s

c2

= B3¯s

(4.13)

Los mismos comentarios que hemos indicado para el gráfico de control

dado en (4.12) son válidos para este caso.

4.2.3 Gráficos de Control para _ con rangos

El tercer estadístico que se emplea para elaborar gráficos de control sobre

la variabilidad es el rango muestral. La media y desviación típica del rango

están dadas en (4.10) y (4.11), por lo que los límites de control teóricos son:

• LCS= d2_ + 3d3_ = D2_

• LC = d2_

• LCI = d2_ − 3d3_ = D1_

donde D2 y D1 están tabulados para diversos tamaños n (D1 = 0 si d2−3d3 < 0).

La estimación insesgada de _ se obtiene mediante

ˆ_ =

¯R

d2

,

61

por lo que los límites (provisionales) estimados resultan ser:

LCS = D2

¯R

d2

= D4 ¯R

LC = d2

¯R

d2

= ¯R

LCI = D1

¯R

d2

= D3 ¯R

(4.14)

La interpretación de este gráfico es como en los casos anteriores. Si el proceso

ha estado bajo control todos los puntos estarán dentro de los límites de

control. En caso contrario no podremos usar ese dato para la construcción

de gráfico y habrá que eliminar dicha muestra y recalcular tanto este gráfico

como el de las medias.

El uso de los rangos está justificado para el caso de subgrupos de tamaño

n relativamente pequeño (n _ 5), tanto porque su eficiencia como estimadores

de _ es muy similar a la de las desviaciones o cuasidesviaciones típicas

como porque, además, el cálculo de rangos y su interpretación es mucho

más simple sobre todo para personas que no necesariamente tengan una

cultura estadística suficiente.

Una vez que hemos construido el gráfico para la media y para la dispersión

con el conjunto de muestras iniciales, daremos por concluida la etapa

de diseño de los gráficos de control y los mantendremos ya fijos (límites de

control definitivos). Pasaremos entonces a utilizarlos en tiempo real, analizando

la estabilidad del proceso con nuevas muestras tomadas a intervalos

regulares de tiempo. Si una muestra cae entonces fuera de los límites de

control habrá que analizar rápidamente qué ocurrió para recuperar el control

del proceso. Cada cierto tiempo es conveniente actualizar los límites de

control con nuevas mediciones.

62

4.3 Tamaño de la muestra y frecuencia de muestreo

Cada punto de un gráfico de control corresponde al valor observado del

estadístico de interés (por ejemplo la media muestral, rango,..) evaluado en

una muestra de tamaño n en cierto instante.

Es necesario, por tanto, determinar dicho tamaño muestral así como la

frecuencia con que se computará para construir gráficos eficaces.

En la determinación del tamaño muestral intervienen factores económicos

y estadísticos, por lo que no se puede establecer un método universal.

En general, a mayor tamaño muestral, menor será la varianza del estadístico

y mas fácil será detectar desviaciones del estado de control. Por ejemplo,

la desviación típica de la media muestral es _/pn, por lo que si n es alto la

desviación típica es baja. Esto hará que los límites que contengan al 99.7%

de los valores en estado de control serán mas estrechos. Por tanto, si el proceso

sale fuera de control será más fácil que los puntos salgan de los límites

y detectemos el desajuste, sin que aumente la probabilidad de falsa alarma

que seguirá siendo del 0.3%.

Los principios subyacentes a la elección del tamaño y frecuencia demuestreo

son a menudo reagrupados bajo el nombre de: rational subgruping

Variación intra-subgrupos y entre subgrupos.

Una elección óptima de los subgrupos está basada en el objetivo perseguido

por cada tipo de gráfico:

• El gráfico de medias controla la tendencia central de la característica

de calidad. Por esta razón, las muestras deben ser seleccionadas con

objeto de maximizar la probabilidad de revelar cambios de tendencia

mediante el examen de las variaciones entre muestras.

• El gráfico de rangos o desviaciones tiene por objeto controlar la variabilidad

del proceso y verificar si la variable asociada a las causas normales

(o no específicas) de variación permanece constante.

63

Por estas razones, las muestras deben ser elegidas de manera que la varianza

dentro de cada muestra sea únicamente debida a causas normales

de variación y no a causas especiales que se supone que el gráfico de medias

debe detectar.

En otras palabras, el gráfico de la media controla la variabilidad entre

muestras (variabilidad del proceso en el tiempo, debida a las causas especiales)

y el gráfico de rangos o de desviaciones típicas mide la variabilidad

en el interior de la muestra (la variabilidad ‘instantánea’ del proceso en el

momento en el que la muestra es extraída).

Método de construir los subgrupos

Dos posibles aproximaciones a la hora de construir subgrupos:

La primera consiste en extraer todas las unidades de una muestra casi al

mismo tiempo. Esto tiene las siguientes consecuencias:

• Se obtiene una imagen casi instantánea del proceso en el momento de

extraer la muestra.

• Minimiza la probabilidad de observar una variación del proceso dentro

de la muestra y maximiza la probabilidad de capturar las causas especiales

de variación entre las muestras.

• Se obtiene una estimación de la variabilidad bastante precisa y unos

límites de confianza bastante estrechos. Esto puede ser preferible en

una fase de mejora del proceso.

• Su aplicación presupone que la varianza entre datos de un mismo grupo

es muy representativa de la varianza de la característica cuando el

proceso está bajo control. En particular, debe ser aplicada con prudencia

en procesos continuos donde la independencia corre peligro de no

verificarse entre los datos de un mismo sub-grupo.

• También es una estrategia peligrosa para procesos que pueden sufrir

variaciones bruscas y cortas en tiempo y que pueden suceder entre

dos extracciones.

64

La segunda aproximación consiste en extraer las unidades de un grupo

en intervalos regulares de tiempo o aleatoriamente dentro del lote que el

subgrupo representa. Para intentar minimizar la variabilidad en unmuestra, se

asociará un periodo de producción durante el que se puede esperar que el

proceso esté lo más estable posible. Un lote será por ejemplo, la producción

durante 1 hora, o un día, o un turno del operador, o un cargamento,. . . . Esta

aproximación da una vista más global de la producción. Dará en general,

límites de control más amplios que la anterior.

Tamaño de la muestra y frecuencia de muestreo

Algunos criterios a la hora de fijar el tamaño y la frecuencia de muestreo

son:

• La sensibilidad y la capacidad de reaccionar que se desea para el grá-

fico de control (ambos objetivos están enfrentados).

Si el proceso evoluciona lentamente, se buscará un gráfico sensible

a pequeñas variaciones de la característica. Esto requiere muestras

de tamaño grande y no tan frecuentes.

Si, por el contrario, el proceso evoluciona rápido, cambios bruscos

y rápidos, se buscará un gráfico que ‘reaccione’ adecuadamente.

Esto requiere muestras de menor tamaño y tomadas de modo más

frecuente.

• Las curvas de eficacia del tipo ARL pueden indicar el tamaño n de los

subgrupos en función de las variaciones esperadas por parte del proceso.

• Si la distribución de la característica de calidad es marcadamente no

normal, es recomendable aumentar el tamaño n de los subgrupos.

• La frecuencia de muestreo debe adaptarse a la lógica del proceso. Así,

por ejemplo, 3 muestras al día una en cada turno de 8 horas y con una

medida cada 2 horas (n = 4).

65

4.4 Curva Característica y tiempo medio de detección

Entre los elementos que determinan la elección de una gráfica de control

frente a otra o la propia elaboración de un gráfico de control, pueden considerarse

la curva característica y el tiempo medio de detección. Aplicamos

los principios básicos desarrollados en la sección 3.8. Veamos en este caso el

cálculo de la curva característica y del tiempo medio de detección cuando

la media varía de µ0 a µ = µ0 + c_ en un gráfico de control 3-sigma para la

media.

Curva Característica

La probabilidad de que una media de un subgrupo caiga dentro de los

límites de control viene dada por la fórmula:

OC(c) = P(LCI < ¯Xi < LCS|µi = µ0 + c_)

= P(µ0 − k_/pn < ¯Xi < µ0 + k_/pn|µi = µ0 + c_)

= P _µ0 − k_ − (µ0 + c_)

_/pn

< Z <

µ0 + k_ − (µ0 + c_)

_/pn _

= P(−k − cpn < Z < k − cpn) (4.15)

con Z la variable normal estándar.

Podemos encontrar ( o programar nosotros) gráficos de OC(c) para k = 3 y

diferentes valores de n.

Tiempo medio de detección

Razonando de modo análogo al de la sección 3.8, el tiempo medio (número

medio demuestras extraídas del proceso) de detección de una desplazamiento

de c_ unidades de la media viene dado (para k=3) por la siguiente

fórmula:

ARL(c) =

1

1 − OC(c)

=

1

P(−3 − cpn < Z < 3 − cpn)

(4.16)

66

5 4 3 2 1 0

1,0

0,5

0,0

C

probabilidad

Curva característica para gráficos x-bar con límites 3-sigma

Variación de la media (en desviaciones típicas)

n=1

n=2

n=5

n=10

Figura 4.1: Curva característica para gráficos ¯X y tamaños de subgrupo

diferentes

y se corresponde con el número medio de subgrupos que debemos representar

antes de una señal de alarma por un cambio de c_ unidades en la

media del proceso.

En ocasiones, al hablar del ARL, este valor se expresa en términos del número

de unidades observadas en lugar del número de muestras extraídas. La

conversión es fácil ya que I(c, n) = nARL(c, n).

En ambas formas de medir la eficacia de un gráfico de control se observa

que el aumentar el tamaño de los subgrupos acelera la detección de una

ARL(c, 1) ARL(c, 2) ARL(c, 5) ARL(c, 9)

c = 0 370 370 370 370

c = 1 44 18 5 2

c = 2 6 3 2 1

c = 3 2 1 1 1

Tabla 4.1: Diversos valores de Longitud Media de Racha en función de n y c

67

variación sin aumentar la probabilidad del error de tipo I, es decir, el peligro

de falsas alarmas. Se puede ver también que vale la pena la extracción

frecuente de pequeñas muestras pues el coste total en número de unidades

será netamente más interesante.

Existen gráficos que nos dan la probabilidad de alarma en la primera

muestra tras el cambio de media.

Por ejemplo, si queremos detectar una variación de 2_, un gráfico de medias

con n = 9 va a necesitar (en términos medios) 1 muestra de 9 unidades

para detectar la variación, mientras que con n = 2, son suficientes en media

3 muestras de 2 unidades.

Es igualmente posible estudiar la sensibilidad de los gráficos de control

basados en desviaciones típicas o en rangos. En estos casos las ’unidades

naturales’ de medir la eficacia son _ = _1/_0 donde _1 representa el nuevo

valor de la variabilidad y _0 el valor que teníamos bajo control. En los gráficos

se representa la probabilidad de detectar una variación dada por _ para

diferentes valores de n.

Estas curvas muestran en general, que los tiempos medios necesarios para

detectar una variación _ son muy largos y necesitan mayores muestras.

En general, la elección de la muestra de los subgrupos y de la frecuencia

de muestreo se hará especialmente en base a la media pues son las causas

asignables de variación las que tienen una influencia sobre el valor medio

del proceso. Si aparece un punto fuera de control sobre un gráfico de rangos,

por ejemplo, será muy frecuentemente debido a un dato ’aberrante’ o

atípico en el subgrupo y no a un cambio en la variabilidad del proceso. La

varianza del proceso se estudia, tal y como veremos, de forma más global

mediante un análisis de capacidad del proceso.

68

4.5 Efecto de la no normalidad de la característica

Gran parte del modo de proceder y de las propiedades de los gráficos de

control radica en la hipótesis de normalidad de la característica estudiada.

En la práctica no siempre se verifica esta hipótesis.

Si la distribución no es normal, podemos optar por alguna de estas dos

posibilidades:

• Transformar los datos (logaritmo, raíz cuadrada, . . . ) para obtener una

muestra normal.

• Si conocemos la distribución de la característica X (basada en conocimiento

histórico del proceso), podemos utilizar la distribución para determinar

los límites de control de forma adecuada.

• Podemos apelar al uso del teorema central límite que nos dice que si

una muestra Xij (j = 1, 2, . . . , n) está formada por datos i.i.d., entonces

su media ¯xi sigue aproximadamente una distribución normal si n es su-

ficientemente grande. Se ha estudiado bastante esta cuestión y se ha

llegado a saber que con tamaños de muestra de 4 o 5 datos se tiene

una razonable robustez frente a la no normalidad, sobre todo en los grá-

ficos de control de la media del proceso. Esta robustez es menor en el

control de la dispersión , tendiendo a dar gráficos con unos límites que

hacen que el riesgo _ de falsa alarma aumente bastante cuanto mayor

sea el alejamiento respecto a la distribución normal.

4.6 Ejemplo

Tomamos de nuevo los datos utilizados en la sección 3.10, ahora suponiendo

grupos o lotes de tamaño 4. Calculamos los límites de control basados en las

69

40 primeras observaciones o lo que es lo mismo en los 10 primeros grupos. Ya

sabíamos que estas observaciones provenían del proceso bajo control.

La siguiente tabla nos da las medias, desviaciones estándar y rango de

cada uno de los 20 lotes o subgrupos.

grupo ¯xi sn−1,i Ri grupo ¯xi sn−1,i Ri

1 12,0669 1,74056 3,92161 11 13,0604 1,03691 2,33581

2 14,5775 1,46474 3,30334 12 14,0978 1,61344 3,78833

3 13,1232 0,96847 2,28433 13 15,1747 1,48982 3,35571

4 14,1743 1,33864 3,12966 14 15,1370 1,93966 4,09942

5 13,3415 1,91272 4,43768 15 15,4627 1,69407 3,87455

6 11,9851 0,98792 2,15300 16 14,8638 1,08101 2,44430

7 11,7575 1,55131 3,25506 17 16,2614 2,06749 5,01735

8 12,1234 1,55809 3,81461 18 15,0305 2,26778 5,25479

9 11,5489 1,77561 3,61346 19 15,4126 0,85691 1,96958

10 14,3515 2,57474 5,48719 20 13,6994 0,86443 1,93295

Tenemos para los 10 primeros subgrupos,

¯¯x

=

12, 905 ¯

sn−1

=

1, 5873 ¯R

= 3, 54

Resulta entonces que los límites de un gráfico de control para la media

serían,

LCS = ¯¯x + A2 ¯R= 15, 49

LC = ¯¯x = 12, 91

LCI = ¯¯x − A2 ¯R = 10, 33

(4.17)

con A2 = 0, 729. Para el cálculo de lo límites de control asociados al rango,

tenemos

LCS = D4 ¯R = 8, 076

LC = ¯R = 3, 54

LCI = D3 ¯R = 0, 00

(4.18)

donde D4 = 2, 282 y D3 = 0, 000.

El gráfico 4.2 recoge los datos de los 20 subgrupos y los límites de control

calculados con los 10 primeros.

70

20 10 Subgroup 0

17

16

15

14

13

12

11

10

Sample Mean

1

X=12,90

3,0SL=15,48

-3,0SL=10,33

9876543210

Sample Range

R=3,540

3,0SL=8,076

-3,0SL=0,000

Xbar/R Chart para datos simulados (subgrupos de tamaño 4)

Figura 4.2: Gráfico de control x-barra/R para datos simulados agrupados.

Límites basados en los 10 primeros subgrupos

Podemos ver que la variabilidad del proceso parece estar bajo control

a lo largo de todo el periodo. Sin embargo, vemos que el subgrupo sale

de control indicando la existencia de una causa específica (en este caso

la variación en la media del proceso de generación de los datos). Con el

gráfico actual detectamos el cambio en media antes de la observación 68

(grupo 17) a diferencia del gráfico ?? en el que debíamos esperar hasta la

observación 67. Observemos que el grupo 15 está situado sobre el límite de

control, si lo hubiera sobrepasado hubiéramos detectado la alarma en la

observación 60. Por otro lado observemos que todos los subgrupos desde el

11 están al mismo lado de la LC. Si empleamos los test de inestabilidad, se

dan los patrones 5 y 6 en el subgrupo 14 y siguientes, por lo que desde la

observación 56 (16 tras el cambio real) ya se nos pone sobreaviso de que el

proceso parece comportarse de forma extraña. En general, los gráficos de

control basados en subgrupos suelen dar señales de alerta o de alarma más

rápidas que los gráficos basados en observaciones individuales.

71

4.7 Capacidad de un proceso. Índice de capacidad

Se define capacidad de un proceso en el que la calidad se mide a través de

una variable cuantitativa X con Var(X) = _2 como:

Capacidad = 6_,

donde _ es la desviación típica de la variable cuando el proceso esta bajo

control. La capacidad del proceso es una medida de la calidad del proceso

muy utilizada en la práctica. La capacidad es una cualidad negativa. A

mayor capacidad mayor variabilidad. Estimar la capacidad se resume en

estimar _. Esta estimación se hace a partir de los gráficos elaborados anteriormente.

Los pasos para estimar la capacidad se pueden resumir de la

siguiente forma:

1. Se seleccionan n muestras de tamaño k recogidas durante un intervalo

amplio de tiempo.

2. Se construye, con los datos obtenidos de dichas muestras, un gráfico de

control para ¯x y otro para la dispersión (el de rangos o el de cuasidesviaciones

típicas).

3. Si alguna muestra está fuera de los límites, se elimina y se recalculan

ambos gráficos (media y dispersión), repitiéndose este proceso hasta

que todas las muestras estén entre los límites de control.

4. Una vez asegurado que los datos proceden de un proceso en estado

de control se ha de verificar la hipótesis de normalidad de los datos mediante

algún procedimiento estadístico (contraste de normalidad, grá-

fico en papel probabilístico-normal, etc).

5. La estimación de la capacidad será, si se utiliza la desviación típica de

cada muestra sin corregir por grados de libertad:

Capacidad estimada = 6ˆ_ = 6

¯s

c2

.

72

Si se utiliza la desviación típica corregida:

Capacidad estimada = 6ˆ_ = 6

¯sn−1

c4

.

Si se utiliza el rango para medir la variabilidad, se tendrá la siguiente

estimación de la capacidad

Capacidad estimada = 6ˆ_ = 6

¯R

d2

.

No debe confundirse la capacidad de un proceso (o máquina o tarea

concreta) con las tolerancias técnicas del producto. Las tolerancias son los

requerimientos técnicos para que el producto sea admisible para su uso,

mientras que la capacidad es una característica estadística del proceso que

elabora dicho producto. Para comparar ambas características se define el

índice de capacidad de un proceso Cp de la siguiente manera:

Cp =

Tolerancia

Capacidad

=

LTS − LTI

6_

donde LTS es el límite de tolerancia superior y LTI es el límite de tolerancia

inferior, ambas especificaciones están fijadas ’externamente’ (por una normativa

legal o por el conjunto de compradores). Si Cp > 1 se dice que el

proceso es capaz, pues prácticamente todos los artículos que produzca estarán

dentro de las tolerancias requeridas. Si Cp < 1 se dice que el proceso no

es capaz. Si Cp _ 1 habrá que vigilarmuy de cerca el proceso, pues cualquier

pequeño desajuste provocará que los artículos no sean aceptables.

Actualmente, sin embargo, un índice de capacidad cercano a uno se

considera insuficiente. Es frecuente utilizar el valor Cp = 4/3 _ 1, 33 como límite

inferior de la calidad que debe tenerse en la práctica. Esto implica que

LTS-LTI

6_

=

4

3 ) LTS-LTI = 8_,

por tanto serían defectuosos aquellos artículos que estén a más de 4_ de la

media; esto es, aproximadamente, 64 piezas por millón (bajo normalidad).

Por esta razón se dice que

73

• Si Cp < 1 el proceso no es capaz

• Si Cp > 1.33 el proceso es capaz

• Si 1 _ Cp _ 1.33 el proceso es capaz pero requiere un seguimiento muy

estricto

4.7.1 Índices de capacidad unilaterales CpL y CpU

Estos índices se utilizan cuando los límites de tolerancia son unilaterales. Por

ejemplo, el nivel de vibración de un motor, la tensión de rotura de un material,

temperatura máxima que admite un componente electrónico hasta que

falle, etc. En estos casos, la tolerancia se mide desde el valor nominal central

hasta el valor extremo indicado por las especificaciones. Esta cantidad se

compara con 3_. El índice CpL (o CpI ) se utiliza cuando existe una especifi-

cación mínima, pero no una máxima; mientras que el índice CpU (o CpS) se

usa cuando se debe cumplir con una especificación máxima. Estos índices

se definen de la siguiente manera:

CpL =

¯¯

x − LTI

3_

CpU =

LTS − ¯¯x

3_

(4.19)

Cuando cualquiera de estos dos índices es menor que 1, el proceso no

cumplirá las especificaciones. Por tanto, son también útiles cuando existen

ambas especificaciones, mínima y máxima. Por ejemplo, el proceso podría

estar descentrado (la media ¯¯x no coincidirá con el centro del intervalo de

especificaciones (LTS+LTI)/2). Es fácil comprobar que

Cp =

LTS − LTI

6_

=

1

2

(LTS − ¯¯x) + (¯¯x − LTI)

3_

=

CpL + CpU

2

.

74

Por tanto uno de los coeficientes podría ser menor que uno y compensarse

con el otro y dar un coeficiente Cp > 1, produciendo la falsa impresión de que

el proceso es capaz. Por esta razón es siempre útil calcular estos dos índices.

Existen procesos en los que se conoce el valor nominal que debe cumplir

la característica de calidad. Por ejemplo, la resistencia nominal de un componente

eléctrico, o el radio de un cilindro, etc. En esos casos, en lugar de

la media muestral ¯¯x habrá que usar dicho valor nominal µN. En ese caso, la

definición de los índices sería:

CpL =

µN − LTI

3_

CpU =

LTS − µN

3_

(4.20)

4.7.2 Índice de capacidad unilateral mínimo Cpk

Este índice es el mínimo de los dos índices unilaterales, es decir:

Cpk = min(CpL,CpU ),

y su interpretación es similar a los anteriores índices.

4.7.3 Índice de capacidad recíproco Cr

Este índice es el inverso de Cp, es decir, Cr = 1/Cp. Su interpretación es la

siguiente:

• Si Cr > 1, el proceso no es capaz

• Si Cr < 0, 75, el proceso es capaz

• Si 0, 75 _ Cr _ 1, el proceso es capaz pero precisa de un control estricto

75

4.7.4 Índice de capacidad modificado Cpm

Este índice es similar al Cp, salvo que utiliza el valor nominal µN en lugar de la

mediamuestral ¯¯x en el cálculo de la desviación típica. Por tanto, su definición

es (estimando _ con k muestras de tamaño n):

Este índice es más conservador que Cp (es decir, suele salir más bajo). Suele

ser más recomendable cuando se poseen pocos datos.

4.7.5 Coeficiente K

Este coeficiente es una medida de la descentralización del proceso. Se de-

fine como: K =

¯¯

x − µN

1

2 (LTS-LTI)

. Si K > 0, el proceso tiene un sesgo hacia valores

superiores al nominal (sesgo positivo), mientras que si K < 0, el sesgo es hacia

valores inferiores al nominal (sesgo negativo). Este índice no está relacionado

con la capacidad, por lo que un proceso puede ser no capaz y tener un

valor de K bajo.

4.7.6 Coeficiente n-sigma

Este coeficiente consiste en la expresión de los límites de tolerancia en función

de la desviación típica del proceso de la forma LTS − LTI = 2n_. Esta

definición de las tolerancias equivale a LTS = µ + n_ y LTI = µ − n_. Por tanto,

un índice de capacidad Cp = 1 equivale a 3-sigma y Cp = 2 equivale a

un nivel de calidad 6-sigma (en inglés six sigma). Actualmente se considera

que una organización ha alcanzado un cota muy alta de calidad si su

nivel es 6-sigma. Por esta razón a los programas de formación en técnicas

estadísticas para la calidad se les suele denominar ‘six-sigma training’, y muchas

organizaciones y empresas relacionadas con la calidad y la estadística

suelen ponerse la etiqueta ‘six-sigma’ en sus nombres.

Es frecuente interpretar el nivel de calidad n-sigma en términos de número

de artículos defectuosos por millón. Para ello hay dos posibles alternativas

76

que suelen producir confusión. La primera alternativa consiste en emplear

estrictamente su significado (siempre se supone normalidad). Por ejemplo,

si el proceso está en estado de control y el nivel de calidad es 3-sigma, el

0.0027% de los artículos son defectuosos. También puede decirse en este

caso que 2700 artículos por millón serán defectuosos.

Una segunda interpretación, popularizada por la empresa Motorola, consiste

en calcular el número de defectos por millón cuando se produce un

desajuste en la media de ±1, 5_, considerándose que cualquier causa asignable

puede fácilmente provocar este nivel de desajuste. Es útil, por tanto,

comparar los límites de tolerancias con la dispersión total del proceso en esta

situación de desajuste.

En esta nueva situación, el 99,7% de la producción no estará entre ±3_,

sino entre ±4, 5_. La proporción (tantos por millón) de artículos defectuosos

que se producen con y sin el desajuste de 1.5_ es, en función de los límites de

tolerancia (LTS − LTI) y suponiendo normalidad, la siguiente:

LTS-LTI En estado de control desajuste de ±1.5_

±1_ 317300 697700

±2_ 45500 308700

±3_ 2700 66810

±4_ 63 6210

±5_ 0.57 233

±6_ 0.002 3.4

Por ejemplo, un artículo defectuoso de entre 160 artículos equivale a una

proporción de

1

160

= 0, 00625 = 6250 × 10−6 ) 6250 por millón,

que es, aproximadamente, un nivel de calidad de 4-sigma y equivale a un

índice de capacidad de

Cp =

8_

6_

=

4

3

= 1, 33,

77

que es considerado, como se mencionó anteriormente, el nivel mínimo de

calidad que se debe tener. De esta forma, un sistema con nivel de calidad

6-sigma (six sigma) producirá, por término medio, 3,4 artículos defectuosos

por millón.

4.8 Gráficos de observaciones individuales y rangos

móviles x-RM

En algunos casos es necesario controlar un proceso basándose en lecturas

de observaciones individuales, en lugar de grupos de ellas. Este es el caso

de artículos en los que las mediciones son caras (por ejemplo en ensayos

destructivos, o ensayos que requieren condiciones especiales) o cuando la

producción en un momento dado es homogénea respecto a la variable de

interés (por ejemplo, el PH de una disolución química). Este tipo de control es,

sin embargo, menos sensible que los anteriores. Por eso, a veces resulta más

adecuado un gráfico ¯x − R convencional con un tamaño muestral pequeño

que este tipo de gráfico, incluso si el intervalo necesario para conseguir las

muestras es grande.

En la sección 3.10 desarrollamos un ejemplo de gráfico de control para

observaciones individuales en el que estimábamos tanto la media como la

desviación típica de la característica de calidad. La estimación de la desviación

típica utilizando toda la muestra no era la más correcta. El motivo

era que había variaciones en la media a lo largo del periodo observado, y el

estimador así utilizado tiende a sobre-estimar la desviación real del proceso.

Por este motivo, se prefiere la estimación de la dispersión basada en rangos

móviles; generalmente de pares de observaciones consecutivas.

Los pasos a seguir para realizar el gráfico son los siguientes:

1. Conseguir lecturas de un conjunto de k observaciones: x1, . . . , xk.

78

2. . Calcular la media global: ¯x = Pk

i=1 xi

k . Si el proceso ha estado bajo

control durante la recogida de estos datos, este valor será un buen

estimador de la media global y se utilizará como línea central.

3. Calcular rangos móviles entre pares de individuos. Estos rangos móviles

se obtienen de la siguiente manera: el primer rango consiste en

R1 = max(x2, x1) − min(x2, x1) _ |x2 − x1|.

En el segundo rango se añade la tercera observación, pero se prescinde

de la primera:

R2 = max(x3, x2) − min(x3, x2) _ |x3 − x2|,

y así sucesivamente. El último rango será:

Rk−1 = max(xk, xk−1) − min(xk, xk−1) _ |xk − xk−1|.

En circunstancias excepcionales podría calcularse rangos móviles con

más de dos observaciones (tres o cuatro). Por ejemplo, con cuatro observaciones

se tendría:

R1 = max(x4, x3, x2, x1) − min(x4, x3, x2, x1)

R2 = max(x5, x4, x3, x2) − min(x5, x4, x3, x2)

...

Rk−3 = max(xk−3, xk−2, xk−1, xk) − min(xk−3, xk−2, xk−1, xk)

4. Obtener el rango móvil medio. En el caso de rango móvil de pares de

observaciones se tendrá:

¯R

= Pk−1

i=1 Ri

k − 1

.

5. Calcular los límites de control para la media a distancia de tres desviaciones

típicas respecto a la línea central marcada por ¯x:

LCS = ¯x + 3

¯R

d2

LCI = ¯x − 3

¯R

d2

79

6. Análogamente para el gráfico de rangos se tiene que:

LCS = D4 ¯R

LCI = D3 ¯R

4.8.1 Ejemplo

De nuevo consideramos los datos de la sección 3.10 para ilustrar la construcción

de este tipo de gráficos. Utilizaremos las 40 primeras observaciones para

estimar los límites de control, de donde se obtiene que

ˆµ = ¯x = 12, 90 y ¯R = 1, 841

por lo que los límites de control para la media resultan ser:

LCS = ¯x + 2, 66 ¯R = 17, 80

LC = ¯x = 12, 90

LCI = ¯x − 2, 66 ¯R = 8, 008

y para el gráfico de control de la dispersión,

LCS = 3, 267 ¯R = 6, 016

LC = ¯R = 1, 841

LCI = 0 ¯R

Podemos ver en la figura 4.3 los gráficos de control tanto de las observaciones

individuales como de los rangos móviles. Se aprecia, al igual que

sucedía en la sección 3.10, que la dispersión parece permanecer estable pero

que se produce una salida de control en la media en el mismo punto que

ya se había obtenido antes. Los límites de control para las observaciones individuales

son muy parecidos a los que se disponía con la estimación basada

en la cuasidesviación típica de los datos.

80

80 70 60 50 40 30 20 10 Subgroup 0

20

15

10

Individual Value

1

X=12,90

3,0SL=17,80

-3,0SL=8,008

7

6

5

4

3

2

1

0

Moving Range

R=1,841

3,0SL=6,016

-3,0SL=0,000

I and MR Chart for C3

Figura 4.3: Ejemplo de gráfico de control X-RM para datos individuales y

rangos móviles de longitud 2. Límites calculados sólamente con los 40 primeros

datos

4.9 Interpretación de los gráficos de control

La interpretación de los gráficos de control se basa en la siguiente idea general:

si el proceso está en estado de control, los gráficos deben mostrar un

comportamiento aleatorio dentro de los límites de control; por tanto una evolución

de los gráficos que tenga un patrón no aleatorio o/y fuera de los límites

será indicio de existencia de causas asignables.

Se suele interpretar en primer lugar los gráficos de la variabilidad (rango

o desviación típica), pues un aumento de la variabilidad puede provocar un

aumento de la media muestral, mientras que el fenómeno inverso no ocurre.

Los aspectos a analizar son: puntos fuera de los límites, tendencias o rachas,

patrones no aleatorios.

81

40 30 20 10 0

18

13

8

Observation Number

Individual Value

Gráfico de Control (Zonas de Aviso)

X=12,90

1,0SL=14,54

2,0SL=16,17

3,0SL=17,80

-1,0SL=11,27

-2,0SL=9,641

-3,0SL=8,008

Zona A

Zona A

Zona B

Zona B

Zona C

Figura 4.4: gráfico de control con las zonas de aviso marcadas

4.9.1 Puntos fuera de los límites de control

Si uno o más puntos de un gráfico de control está fuera de los límites es indicio

de que el proceso se ha desajustado y conviene analizar el proceso para

encontrar la causa. Un punto fuera de los límites puede ser debido a alguno

de los siguientes motivos:

• El punto ha sido mal calculado.

• Los límites han sido mal calculados o el gráfico mal dibujado.

• Hay variaciones en el sistema de medición del dato (nuevos calibres,

distinto aparato de medida).

• Una variación de la media pero no en la variabilidad puede venir provocada

por un desajuste en la maquinaria o desgaste de alguno de sus

elementos.

82

• Un aumento de la variabilidad pero no de la media puede venir provocada

por envejecimiento de alguno de los componentes del proceso o

por variaciones en la calidad de la materia prima.

• Una disminución de la variabilidad (puntos por debajo del límite inferior)

implica una mejora del sistema, por lo que debe investigarse la causa.

4.9.2 Tendencias, rachas y patrones de no aleatoriedad

Ya hemos comentado en la sección 3.9, las ventajas e inconvenientes de

introducir test de inestabilidad que ayuden a aumentar la sensibilidad del

gráfico ante pequeñas variaciones de la característica de calidad. Además

de estos avisos, hay también otros criterios basados en las mismas ideas.

Cuando un conjunto de puntos consecutivos presentan una tendencia

creciente o decreciente durante 7 puntos (‘regla del 7Š) es indicio de que

algo está ocurriendo en el proceso, pues la probabilidad de que muchos

puntos formen una tendencia sólo por azar es prácticamente nula. Por tanto

ha de investigarse la presencia de una causa asignable incluso si dichos puntos

están dentro de los límites. Por ejemplo, un desajuste paulatino de una

herramienta provocará un desajuste paulatino en la media del proceso. Es

necesario detectar ese desajuste y no esperar a que produzcan valores fuera

de los límites de control. Un desgaste en la sujeción de una herramienta

de corte irá aumentando gradualmente la variabilidad en la longitud de corte.

Ese desgaste puede detectarse sin necesidad de llegar a que el sistema

produzca piezas defectuosas.

Cuando un conjunto de 7 puntos sucesivos se encuentran consistentemente

a un lado de la línea central del gráfico (racha) es indicio de anomalía

incluso si se encuentran dentro de las líneas de control. De nuevo, la probabilidad

de que sólo por azar más de 7 puntos se encuentren en un lado del

gráfico es prácticamente nula, por lo que habrá que investigar la presencia

de causas asignables.

83

Además de tendencias o rachas, pueden aparecer otros patrones (patrones

de no aleatoriedad) en los datos que deben llevar al análisis del sistema incluso

si los datos evolucionan dentro de los límites de control. Por ejemplo:

• Periodicidades en forma de ciclos, con sucesiones regulares de picos y

valles.

• Inestabilidad: grandes fluctuaciones de la media, producidos, posiblemente

por sobreajustes del proceso, falta de entrenamiento de los operarios

o heterogeneidad en la materia prima.

• Sobrestabilidad: Ocurre este fenómeno cuando la variabilidad observada

es consistentemente menor que la esperada. Esto puede ser debido

tanto a un cálculo erróneo de los límites como a causas asignables

que afecten positivamente al proceso. Para detectar la sobreestabilidad

conviene trazar dos líneas paralelas en el gráfico de la variabilidad

(rangos o desviaciones típicas) a ambos lados de la línea central que

dividan el gráfico en seis partes iguales. (gráfico ) En condiciones normales,

el 68% de los puntos debería estar entre las dos zonas centrales,

mientras que el 32% debería estar fuera.

Los tests de inestabilidad consisten en la detección de patrones en los grá-

ficos que sean muy poco probables si el proceso está bajo control. La mayoría

de los programas informáticos los incluye. Para detectarlos se dividen

las dos áreas alrededor del límite central en tres zonas iguales: A, B, C (ver

gráfico 4.4). Cada línea corresponderá, entonces, a una desviación típica.

Existen un total de ocho patrones. Si se detecta la presencia de alguno de

ellos se ha de considerar la posibilidad de que sea debido a alguna causa

asignable. (ver sección 3.9)

84

 

 

Pagina_principal_ii

Hosted by www.Geocities.ws

1