EstadisticaComputarizada5405.html (Capítulo 5)

MEDIDAS DE POSICION

 

OBJETIVO: Aplicar las caracteristicas y propiedades de la media aritmetica, la mediana, la moda, los cuartiles, percentiles como principales medida de tendencia central de una distribucion de frecuencia de clase.

CONTENIDOS: Describir las propiedades de la media aritmetica, la mediana, la moda, los cuartiles y los percentiles. Resolucion de problemas aplicando el Spss13.0.

 

MEDIDAS DE POSICIÓN

(Hamlet Mata Mata Prof. Del TECNOLÓGICO de EL TIGRE – VENEZUELA)

www.mipagina.cantv.net/hamletmatamata

 

El análisis estadístico de una serie de datos se elabora mediante el cálculo  de diferentes parámetros y / o estadísticos.  Después que los datos han sido reunidos y tabulados,  se inicia el análisis con el fin de calcular un número único, que represente o resuma todos los datos. Por lo general, las frecuencias de los intervalos centrales de una serie de datos son mayores que el resto, ese número se le  denomina  medida de posición.

Las medidas de posición forman parte del conjunto de medidas descriptivas numéricas, entre las que se encuentran los parámetros y los estadígrafos. Una  medida de posición es un número que se escoge como orientación para hacer mención a un grupo de datos.

Uno de los problemas fundamentales que presenta un análisis estadística, es el de buscar el valor más representativo de una serie de valores. El primer paso que hay que realizar para que se entienda una larga serie de valores u observaciones, es el de resumir los datos en una distribución de frecuencia; esto no es suficiente para fines practico, puesto que a menudo es necesario una sola medida descriptiva, y en especial cuando se requiere comparar dos o más serie estadísticas. Es necesario continuar el proceso de reducción hasta sustituir todos los valores observados por uno solo que sea representativo, de tal forma que permita una interpretación global del fenómeno en estudio; para que ese valor sea representativo debe reflejar la tendencia de los datos individuales de la serie de valores. Un valor o dato de la serie  con estas características recibe el nombre de  promediomedia o medida de posición, esto es debido a su ubicación en la zona central de la distribución. Las medidas de posición son de gran importancia en el resumen estadístico, ya que representan un gran número de valores individuales por uno solo.

El valor más representativo de un conjunto de datos por lo general no es el valor más pequeño ni el más grande,  es un número cuyo valor se encuentra en un punto intermedio de la serie de datos. Por lo tanto un promedio es con frecuencia  un valor referido que representará la medida de posición de la serie de valores. Las medidas de posición se emplean con frecuencia como mecanismo para resumir un gran número de datos o cantidades con la finalidad de obtener un valor que sea representativo de la serie.

Las Principales Medidas de Posición son:

 

a)                  La  Media Aritmética, b) La Mediana, c) La Moda, d) Los cuartiles, e) Los Deciles y f) Los Percentiles.

 

CARACTERÍSTICAS  DE  LAS  MEDIDAS  DE POSICIÓN

 

1.                – Deben ser definidas  rigurosamente y no ser susceptibles de diversas interpretaciones.

2.                – Deben depender de todas las observaciones de la serie, de lo contrario no seria una característica de la distribución.

3.                – No deben  tener un carácter matemático demasiado abstracto.

4.                – Deben ser susceptibles de cálculo algebraico, rápido y  fácil.

 

SUMATORIA

 

En esta unidad y en las siguientes se utilizaran sumas de muchos términos, por lo cual es necesario introducir una notación denominada sumatoria, para facilitar las sumas. La notación sumatoria implica el uso del  símboloå, que no es otra cosa que la letra sigma mayúscula del alfabeto griego y que corresponde a la letra  S de nuestro alfabeto. Siempre  que se utilice el signo å  se leerá “suma de  o  sumatoria de “.

Según, Leithold  sumatoria se define así:

 

La ecuación de definición consiste de la suma de (n-m + 1) términos, donde el primer  término se obtiene sustituyendo i  por m en  Fi, el segundo se obtiene remplazando i  por (m+1) en Fi, y así sucesivamente, hasta alcanzar el último término al sustituir i  por   n  en  Fi.  En la ecuación   de sumatoria la letra  se le denomina límite inferior de la sumatoria y n se le llama límite superior de la sumatoria. El símbolo  i  se le denomina índice de la sumatoria.  Ejemplos:

 

 . Observe que las notaciones colocadas arriba y abajo del

signo   sumatoria indican que solo deben ser sumados sucesivamente las primeras cuatro observaciones. También puede darse el siguiente caso:

 

. Se puede observar que las notaciones colocadas arriba y abajo del signo sumatoria indican que solo deben ser sumados sucesivamente desde la tercera hasta la séptima observación.

Generalmente, con el objeto de simplificar más aun las formulas que permiten utilizar el símbolo sigma, se pueden suprimir los subíndices, quedando el símbolo de sumatoria expresado de la siguiente manera:  å X. Esto se puede hacer cuando no hay ambigüedad al referirse a los diferentes valores que toma la variable X.

PROPIEDADES DE LA SUMATORIA

 

1.      – La sumatoria de la suma de dos o más términos, es igual a La suma de las sumatorias  separadas de los términos.

 

.

 

2.      – L a sumatoria de la diferencia de  dos o más términos,  es igual a la diferencia de las sumatorias separadas de los términos.

 

 

3         – La sumatoria de una constante multiplicada por una variable, es igual a la constante multiplicada por la sumatoria de la variable.

 

 

4. – La  sumatoria de una constante es igual a la constante multiplicada por el número de casos   que indique el  límite superior de la sumatoria.

 

Cuando se trabaja con el término sumatoria es   bueno recomendar lo siguiente:

 

 Ejemplos:

 1.-  Resolver las siguientes sumatorias, tomando en cuenta que:

 

   ,   c)    

a)         

 

b)         

c)     

2. – Exprese las siguientes operaciones utilizando la notación sumatoria: a) X1+ X2 + X3 +X4.

b)    

Estos problemas se resuelven así:  .           b)    .

 

ASIGNACIÓN: Elabore con sus propias palabras un concepto de medidas de posición  y de ejemplos.

 

 MEDIA ARITMÉTICA

 

La media aritmética () o simplemente la media  es el parámetro de posición de más importancia en las aplicaciones estadísticas. Se trata del valor medio de todos los  valores que toma la variable estadística de una serie de datos. Por lo tanto,  la medida posicional más utilizada en los estudios estadísticos viene a ser la media. Por su fácil cálculo  e interpretación, es la medida  de posición más conocida y más utilizada en los cálculos estadísticos. La media es el valor más representativo de la serie de valores, es el punto de equilibrio, es el centro de gravedad de la serie de datos. La media aritmética  por lo general se le designa con   .

La media aritmética de una serie  de N   valores de una variable X1, X2, X3;  X4,.........Xn, es el cociente  de dividir la sumatoria de todos los valores que toma la variable Xi, entre el número total de ellos. La formula se puede expresar así: 

  .

Desviaciones o desvíos.-  Son diferencias algebraicas entre cada valor de la serie o cada punto medio y la media aritmética de dicha serie, o un valor cualquiera tomado arbitrariamente. Los desvíos o desviación  se designan con la letra di.

Dado una serie de valores  X1, X2, X3, .......Xn , se llama desvío a la diferencia entre un valor cualquiera   Xi  de la serie y un valor indicado k de esa  misma serie.  Si el valor indicado k de la serie corresponde precisamente a la media aritmética  de esos valores dados, se dice  entonces que los desvíos son con respecto a la media aritmética. En símbolo: 

PROPIEDADES DE LA MEDIA ARITMÉTICA

1.      – La suma de las desviaciones con respecto a la media aritmética es igual a cero. 

2.      – La  suma de las desviaciones al cuadrado de los diversos valores con respecto a la media aritmética es menor que la suma de las desviaciones al cuadrado de los diversos valores con respecto a cualquier punto  K, que no sea la media aritmética.

 

3.        <  .

 

4.      – La media aritmética total o conjunta de dos o más serie de datos, se puede calcular en función de las medias aritméticas parciales y del número de datos de cada una de ellas, mediante la siguiente fórmula:

 

   Donde:

  en esta  n1, n2, n3  y  nk  es   el número de datos de cada serie.

Además,   las medias de cada una de las series.

4        – La media del producto de una constante por una variable, es igual al producto de la constante por la media de la  variable.

 

   

5        – La media de la suma de una constante más una variable, es igual a la media de la variable más la constante.   

 

6         ., de la misma forma se cumple         esta propiedad  para la resta.

 

CARACTERÍSTICAS   PRINCIPALES DE  LA  MEDIA  ARITMÉTICA

 

1.      – El valor de la media depende de cada una de las medidas que forman la serie de datos, y se halla afectada excesivamente por los valores extremos de la serie de datos.

2.      – La media se calcula con facilidad y es única para  cada caso  y permite representar mediante un solo valor la posición de la serie de valores.

3.      – La media es una medida de posición que se calcula con todos los datos de la serie de valores y es susceptible de operaciones algebraicas.

 

CÁLCULO DE  LA  MEDIA  PARA DATOS  NO  AGRUPADOS

 

Para calcular  la media de datos no agrupados en clases se aplica la siguiente fórmula:

  .  En donde N es el número total de datos   y      son los valores de la variable.

Ejemplo:

1.      – Calcule la media aritmética de los siguientes valores: 

 Por lo tanto la media es  9.

 

CÁLCULO DE LA  MEDIA PARA DATOS  AGRUPADOS 

 

Cuando se construye una distribución de frecuencia, los datos se agrupan en clases definidas por unos límites.  Cuando se trabaja con la distribución de frecuencia se parte del supuesto de que todos los datos comprendidos en un intervalo de clase se distribuyen uniformemente a lo largo de este, entonces se puede tomar la marca de clase o punto medio () del intervalo como adecuada representación de los valores que conforman el mencionado intervalo. El punto  medio se designa con  la letra   . Para calcular la media en estas condiciones se pueden  utilizar  tres métodos: El método  directo o largo y dos métodos abreviados.

 

MÉTODO DIRECTO

 

Este método se le conoce también como método largo; el mismo resulta demasiado engorroso cuando las magnitudes de los puntos medios   o de las frecuencias de clase son muy grandes, debido a   que los cálculos son demasiados extensos. Los pasos a seguir para calcular la media con este método son los siguientes:

1.      – Se agrupan los datos en clases  y se llevan a una  columna, se  calculan los puntos medios de cada clase y se colocan en sus respectivas columnas, se determinan las frecuencias de cada clase y se ubican en sus respectivas columnas.

2.      – Se multiplican los puntos medios de cada clase por sus respectivas frecuencias, luego se obtiene la sumatoria de las frecuencias (fi) multiplicadas por el punto medio 

 

() así: .

3.       – Luego se calcula la media aritmética  aplicando la formula:

 

 es igual al número total de datos. Ejemplo:

1.-Calcule la media de  la siguiente distribución de frecuencia correspondiente al peso en Kg de un grupo de obreros. Realice los cálculos respectivos para completar el siguiente cuadro.

 

CLASES

75-------79

20

80-------84

40

85-------89

60

90-------94

100

95 ------99

140

 

N =360

 

 

 

CLASES

75-------79

77

20

1540

80-------84

82

40

3280

85-------89

87

60

5220

90-------94

92

100

9200

95 ------99

97

140

13580

TOTAL

 

N =360

32820

 

Aplicando la formula se tiene:

 

 

MÉTODOS ABREVIADOS

 

Los métodos abreviados para calcular la media son preferibles en la mayoría de los casos, especialmente cuando el número de clases  de las distribuciones de frecuencias son grandes. Es un método fácil de aplicar. Existe un método abreviado que se utiliza para cualquier tipo de distribución de frecuencia sin importar si tiene o no  intervalos constantes de clase y  hay otro que se utiliza solamente cuando en la distribución el intervalo de clase es constante, en esta cátedra se analizará el primero.

 

Si se selecciona un punto medio  ()    de la distribución de frecuencia que sea diferente de la media aritmética de  esa, entonces la suma algebraica de las desviaciones () con respecto al valor seleccionado será diferente de cero. Si la suma algebraica de las desviaciones es dividida por el número de datos totales (N) de la serie y el cociente resultante es sumado al valor seleccionado, el resultado final será igual  al de la media aritmética de la serie. Este método permite ahorrar una considerable cantidad de tiempo cuando en una serie de valores el conjunto de datos es grande. La media seleccionada arbitrariamente o media imaginaria se le designará con la letra  A y los desvíos  di  vendrán a ser la desviación  de cada valor de la serie con respecto a la media imaginaria A. La fórmula para este caso será:

 

 

 

La fracción      se le denomina factor de corrección, A  es la media arbitraria o supuesta.

 El factor de corrección, será positivo o negativo según que  A  sea menor o mayor que la media aritmética de la serie de valores.

 

PASOS  PARA  APLICAR  EL   MÉTODO ABREVIADO

 

1. – Se organizan   los datos de la serie en clases con sus respectivas frecuencias  (fi), los mismos se colocan en columnas con sus respectivos puntos medios ().

1.      – Se escoge un punto medio cualquiera de  la distribución, el cual será una media imaginaria que se le denominara  A, esta deberá ser lo  más central posible  para que los cálculos se hagan más fácil, se calculan los  di  de los puntos medios de  la distribución con respecto  a esa media imaginaria, aplicando la formula:  , los mismo se colocan en su columna respectiva.

3        – Sé efectúan los productos   de cada clase  y  al final se calcula la sumatoria  de estos productos aplicando la formula:  .

4        – Finalmente se calcula la media  aplicando  la formula:   .

1.-Dada la siguiente distribución de frecuencia, correspondiente al peso en Kg de un grupo de obreros, calcule la media aritmética, aplicando el método abreviado.Realice los cálculos respectivos para completar el siguiente cuadro.

 En este caso se tomará como media arbitraria el punto medio,  A = 87.0.

 

CLASES

75------79

20

80------84

40

85------89

60

90------94

100

95------99

140

TOTAL

N = 360

 

CLASES

(di

75------79

77

20

87 – 77   = - 10

- 200

80------84

82

40

87 – 82   =   - 5

- 200

85------89

87

60

87 – 87   =     0

0

90------94

92

100

87 – 92   =     5

500

95------99

97

140

87 – 97    =    10

1400

 

 

N = 360

 

 

 

Ahora se aplica la formula así:   Como se puede observar la media  obtenida es idéntica a la obtenida por el método largo. El estudiante puede realizar este problema utilizando cualquier  punto medio de la distribución, se le deja como practica para que se ejercite con este método, siempre obtendrá el mismo resultado utilizando cualquiera media imaginaria diferente a la utilizada en la resolución de este problema.

 

2 – Calcule  la media aritmética de la siguiente distribución  aplicando el método abreviado. Realice los cálculos respectivos para completar el siguiente cuadro.

CLASES

50------54

5

55-----59

10

60-----64

20

65-----69

40

70-----74

100

75-----79

38

80-----84

22

85-----89

9

90-----94

6

Totales

N = 250

 

Para calcular la media en este caso sé escogió como media imaginaria  A = 72, por ser este el punto medio más céntrico de la serie, se pudo haber tomado otro punto medio diferente de este y el resultado hubiese sido el mismo. Ahora se aplica la formula:

 

CLASES

(di

50------54

52

5

72 – 52 = - 20

- 100

55-----59

57

10

72 – 57 = -15

- 150

60-----64

62

20

72 – 62 = -10

- 200

65-----69

67

40

72 – 67 =   -5

- 200

70-----74

72

100

72 – 72 =    0

0

75-----79

77

38

72 – 77 =    5

190

80-----84

82

22

72 – 82 = 10

220

85-----89

87

9

72 – 87 = 15

135

90-----94

92

6

72 – 92 = 20

120

TOTALES

 

N = 250

 

.

 

.  El  estudiante hará como ejercicio el cálculo de la media con los restantes  puntos medios de la distribución de frecuencia.

 

ASIGNACIÓN: Describa brevemente lo referente a la medida de posición LA MEDIA ARITMÉTICA, los pasos para su cálculo y de por lo menos un ejemplo.

 

LA  MEDIANA

 

La mediana  (Md) es una medida de posición que divide a la serie de valores en dos partes iguales, un cincuenta por ciento que es mayor o igual a esta y otro cincuenta por ciento que es menor o igual  que ella. Es por lo tanto,  un parámetro que está en el medio del ordenamiento o arreglo de los datos organizados, entonces, la mediana divide la distribución en una forma tal que a cada lado  de la misma  queda un número  igual de datos.

Para encontrar la mediana en una serie de datos  no agrupados, lo primero que se hace es ordenar los datos en  una forma creciente o decreciente y luego se ubica la posición que esta ocupa en esa serie de datos; para ello hay que determinar si la serie de datos es par o impar. Si el número  N de datos  es impar, entonces  la posición de la mediana se determina por la formula: , luego el número que se obtiene indica el lugar o posición que ocupa la mediana en la serie de valores, luego la mediana será  el número que ocupe el lugar de lo posición encontrada. Para obtener la posición de la mediana en una serie de datos no agrupados, en donde  el número  N  de datos  es par, se aplica  la formula     El  resultado obtenido,  es la posición que  ocupara la mediana, pero en este  caso se ubica la posición de la mediana por ambos extremos de la serie de valores y los dos valores que se obtengan se le saca la media y esta será la mediana buscada, por lo tanto la mediana, en este caso, es un número que no se encuentra dentro de la serie de datos dados. Ejemplos:  

1– Sean los siguientes  datos, 5, 12, 7, 8, 10, 6, y 9,  los años de servicios de un grupo de trabajadores. Determine la mediana. Lo primero que se hace es ordenar los datos en forma creciente o  decreciente;

 

luego se aplica la formula   , para  ubicar la posición de la mediana. Los datos ordenados quedaran así:    5, 6, 7, 8, 9, 10, 12. La posición 

Esto indica que la mediana ocupa la posición  4 en la serie de valores y por lo tanto esa posición corresponde a los números  8 y 9 que en este caso ocupan la posición por la izquierda y por la derecha, por lo tanto  la Md viene a ser la semisuma de ambas

 

posiciones en este caso 8.5 es la mediana   buscad, y  esto es así, ya  que el número  8.5  divide  la serie de valores en  dos partes iguales, una mitad que es mayor que la mediana y otra mitad que es menor que esta.

Cuando los valores de los datos brutos  de un conjunto de datos se agrupan en una distribución de frecuencia de clase, cada valor pierde su identidad, por tal motivo la mediana obtenida de una distribución de frecuencia de datos puede no ser la misma que la mediana obtenida de los datos sin arreglar en clases, pero el resultado será una aproximación. Cuando se obtiene la mediana para datos agrupados  se utiliza el método de interpolación. La interpolación  parte del supuesto de que los datos de cada intervalo de la distribución  están igualmente distribuidos.

 

PASOS  PARA DETERMINAR LA MEDIANA EN DATOS AGRUPADOS

 

1. – Se elabora la tabla de frecuencia de datos con sus diferentes intervalos de clases, se ubican las frecuencias  fi  y se calculan las frecuencias acumuladas   Fa    de esa distribución.

2. –  Se determina la ubicación  o posición   de la mediana en el intervalo de la distribución de frecuencia, mediante la fórmula   . El  resultado obtenido determinará la clase donde se  encuentra ubicada la mediana, lo cual se conseguirá en la clase donde la  frecuencia  acumulada  Fa  sea igual o superior a este resultado. Luego

 

se aplica la formula:  en esta fórmula  Md  es la mediana, Li  es el límite real inferior de la clase donde se encuentra ubicada la mediana, Faa  es  el valor de la frecuencia acumulada anterior a la clase donde se encuentra la mediana, fm es el valor  de la frecuencia  fi  de la clase donde se encuentra la mediana, Ic es el valor o longitud del intervalo de clase  y  N  es el número total de datos de la distribución en estudio.

 

1.- Dada  la siguiente distribución de frecuencia  referida  a las horas extras laboradas por    un grupo de obreros. Calcule la mediana. Realice los cálculos respectivos para completar el siguiente cuadro.

N°  de horas Extras

Obreros

CLASES

fi

55------59

6

60------64

20

65------69

18

70------74

50

75------79

17

80------84

16

85------89

5

 

N = 132

 

Cuadro con las frecuencias acumuladas:

 

N°  de horas Extras

Obreros

Obreros

CLASES

fi

fa

55------59

6

6

60------64

20

26

65------69

18

44

70------74

50

94

75------79

17

111

80------84

16

127

85------89

5

132

 

N = 132

 

 

Ahora se aplica la formula: 

 

N = 132,     luego la mediana se encuentra en la clase  70----74, por lo tanto el limite real inferior de esa clase es  69.5 = Li.  La frecuencia  fi  de esa clase es  50 = fm , Faa = 44  y el  Ic = 5. Aplicando la formula se tiene:

 

Luego la mediana de esa distribución es 71.70. Esto  quiere decir que un  50 % de los obreros trabajaron horas extras   por debajo de  71.70 horas     y el otro  50 % trabajaron horas extras por encima de  71.70 horas.

 

CARACTERÍSTICAS DE LA MEDIANA

 

* La mediana no es afectada por los valores extremos de una serie  de valores, puesto que la misma no es calculada con todos los valores de la serie.

* La mediana no está definida algebraicamente, ya que para su cálculo  no intervienen todos los valores de la serie.

* La mediana en algunos casos no se puede calcular exactamente y esto ocurre cuando en una serie de valores para datos no agrupados el número de datos es par, en este caso la mediana se calcula aproximadamente.

* La mediana se puede calcular en aquellas distribuciones de frecuencia de clases abierta, siempre y cuando los elementos centrales puedan ser determinados.

* La suma de los valores absolutos de las desviaciones de los datos individuales con respecto a la mediana siempre es mínima.

 

ASIGNACIÓN: Describa brevemente lo referente a la medida de posición LA MEDIANA, los pasos para su cálculo y de por lo menos un ejemplo.

 

LA  MODA

 

La moda es la medida de posición que indica la magnitud del valor que se presenta con más frecuencia en una serie de datos; es pues, el valor de la variable  que más se repite en un conjunto de datos. De las medias de posición la moda es la que se determina con mayor facilidad, ya que se puede obtener por una simple observación de los datos en estudio, puesto que la moda es el dato que se observa con mayor frecuencia. La moda se designa con las letras  Mo.

En las representaciones gráficas la moda es el punto más alto de la gráfica. La obtención de la moda para datos agrupados no es un  valor exacto, ya que varía con las diferentes formas de agrupar una distribución de frecuencia.

En algunas distribuciones de frecuencias  o serie de datos no agrupados o agrupados se presentan dos  o más modas, en estos casa se habla  de serie de datos  bimodales  o  multimodales, según sea el caso. Estos tipos de distribuciones o series de valores  se deben a la falta de homogeneidad de los datos.

Cuando una serie de valores es simétrica, la media, la mediana y el modo coinciden, y  si la asimetría de la serie es moderada, la mediana estará situada entre la media y el modo con una separación de un tercio entre ambas. Tomando en cuenta esta relación, cuando se tengan dos de esta medidas se puede determinar la tercera; sin embargo es conveniente utilizar esta relación para calcular solamente la moda ya que para calcular la media y la mediana existen formulas matemáticas que dan resultados más exactos; la fórmula matemática para calcular la moda  por medio de la relación antes mencionada es:

 

 .

Para calcular la moda en datos agrupados existen varios métodos; cada uno de los métodos puede dar un valor diferente de la moda: En este curso se dará un método el cual se puede considerar uno de los más precisos en el cálculo de esta. Es un método  matemático que consiste en la interpolación  mediante la siguiente fórmula:

 

 , en donde  Mo   es la moda,  Li   es el límite real de la clase

que presenta el mayor número de frecuencia; la clase que presenta el mayor número de frecuencias  fi   se le denomina clase modal y a las frecuencias de esa clases se les denomina frecuencia modal  fm es la diferencia  entre la frecuencia  de la clase modal  ( fm)  y la frecuencia  de la clase anterior  a la  modal, la cual se designa con  fa , entonces,   ;   es la diferencia entre la  frecuencia de la clase modal   (fm)  y   la frecuencia  de la clase siguiente a la modal, esta se designa con  fs  , entonces,  

 

1.      – Dada la siguiente distribución de frecuencia correspondiente al peso en Kg  de un grupo de trabajadores de una empresa, calcule la moda.

 

CLASES

fi

30-----39

2

40-----49

2

50-----59

7

60-----69

11

70-----79

12

80-----89

16

90-----99

2

TOTAL

 

 

La clase modal es 80----89, entonces   Li = 79.5  y  su  fm = 16,  fa = 12   y   fs = 2, , entonces:

 

 

Aplicando la formula se tiene:

 

 

Este resultado de la moda se interpreta así: La mayoría de los trabajadores tiene un peso  aproximadamente de  81.71  Kg.

 

CARACTERÍSTICAS  DE  LA  MODA

 

* El valor de la moda puede ser afectado grandemente por el método de elaboración de los intervalos de clases.

* El valor de la moda no se encuentra  afectado por la magnitud de los valores extremos de una serie de valores, como sucede en la media aritmética.

* La moda se puede obtener en una forma aproximada muy fácilmente, puesto que la obtención exacta es algo complicado.

* La moda tiene poca utilidad en una distribución de frecuencia que  no posea suficientes datos  y que no ofrezcan una marcada tendencia central.

* No es susceptible de operaciones algebraicas posteriores.

* La moda se utiliza cuando se trabaja con escalas nominales aunque se puede utilizar con las  otras escalas.

* La moda es útil  cuando se está interesado en tener una idea aproximada de la mayor concentración de una serie de datos.

 

ASIGNACIÓN: Describa brevemente lo referente a la medida de posición LA MODA, los pasos para su cálculo y de por lo menos un ejemplo.

 

OTRAS   MEDIDAS   POSICIÓNALES

 

Cuando se estudio la mediana  se pudo detectar que esta divide la serie de valores en dos partes iguales, una generalización  de esta medida  da origen a unas nuevas medidas de posición denominadas:

 

Cuartiles; Deciles y  Percentiles. Estas nuevas medidas de posición surgen por la necesidad  de requerir de otras medidas que expresen diferentes situaciones de orden, aparte de  las señaladas por la mediana. Por lo tanto es interesante ubicar otras medidas que fraccionen  una serie de datos en diferentes partes. Es bueno destacar que los cuarteles, los Deciles y los Percentiles son unas variantes de la mediana: De la misma forma los percentiles abarcan tanto a los cuarteles como a los Deciles.

 

LOS CUARTILES.- Son medidas posiciónales que dividen la distribución de frecuencia en cuatro partes iguales. Se designa por el símbolo  Qa  en la que  a  corresponde a los valores 1, 2  y 3., que viene a ser el número de Qa   que posee una distribución de frecuencia de clase.  El  Q1  divide la distribución de frecuencia en dos partes, una corresponde a 25 % que está por debajo de Q1 y el otro  75 % por encima de Q1. El  Q2  divide la distribución de frecuencia en dos partes iguales, un  50 %  que está por debajo de los valores de Q2 y otro  50 % que  está por encima del valor de   Q2. El  Q2  es igual a la  mediana.

CÁLCULO  DE  LOS  CUARTILES.- Para datos no agrupados no tiene ninguna utilidad práctica calcular los cuartiles.  Para el cálculo de los cuartiles en datos agrupados en una distribución de frecuencia existe un método por análisis gráfico  y otro por determinación numérica, por fines prácticos en esta cátedra se utilizara el último método.  Para calcular los cuartiles por el método numérico se procede de la siguiente manera:

 

1 – Se  localiza la posición del cuartil solicitado aplicando la formula de posición: , en donde  viene a ser el número del cuartil solicitado,  N   corresponde al número total de datos de la distribución  y  4  corresponde al número de cuartiles que presenta una distribución de frecuencia.

 2 – Luego se aplica la fórmula para determinar un cuartil determinado, así: 

 

 

En esta fórmula,  Qa = El cuartil solicitado, en esta  a  corresponde al  número del cuartil solicitado;  Li = Limite real inferior de la clase donde se encuentra ubicado el cuartil;  Faa = Frecuencia acumulada anterior a la clase donde se encuentra el cuartil;  fm = Frecuencia  fi  que posee el intervalo de clase donde se encuentra el cuartil;    =  Posición que ocupa el cuartil en la distribución de frecuencia, este resultado obtenido determinará la clase donde se encuentra ubicado el cuartil, el mismo se encontrará en la clase donde la frecuencia acumulada  Fa  sea igual o superior a este resultado.

DECILES. – Son medidas de posición que dividen la distribución de frecuencia en diez partes iguales y estas van desde el número uno hasta el número nueve. Los deciles se les designa con las letras  Da, siendo  a,  el número de los diferentes deciles, que  en este caso son nueve. El  D2  es el punto debajo del cual se encuentran ubicados el  20 % de los valores de la distribución o también el punto por sobre el cual se encuentra el  80 % de los valores de la serie de datos. La mediana es igual al   D5, puesto que este decil divide la distribución en dos partes iguale tal como lo hace la mediana, de la misma forma el decil cinco es igual al cuartil dos.

 

CÁLCULO  DE  LOS  DECILES – El cálculo de los deciles es similar al cálculo de los cuartiles, solo que en estos varía la posición, la misma se calcula con la formula:

 

, en esta  a  corresponde al número del decil que se desea calcular, N equivale al número de datos de la distribución y  10  corresponde a las diez partes en la que se divide la serie de valores de la distribución.

 

    

 La fórmula para su cálculo es:   . En este caso se aplica la formula de la  misma manera que se hizo para calcular los cuartiles, solo que en esta fórmula varia la posición de ubicación  de la clase donde se encuentra ubicado el decil.

LOS  PERCENTILES –  Son medidas posicióneles que dividen la distribución de frecuencia en 100 partes iguales. Con estos se puede calcular cualquier porcentaje de datos de la distribución de frecuencia. Los percentiles son las medidas más utilizadas para propósitos de ubicación de valor de una serie de datos ubicados en una distribución de frecuencia.  El número de percentiles de una distribución de frecuencia  es de  99. El percentil 50 es igual a la mediana, al decil 5 y al cuartil 2, es decir:  por encima y  50 % por debajo de los datos de la distribución.

El  cálculo de los percentiles es similar al cálculo de los cuartiles y los deciles con una  variante  en la posición de ubicación de estos, que viene expresada por la siguiente fórmula:

      . Con esta posición se aplica la formula: .

 

1. – Dada la siguiente distribución correspondiente al salario semanal en dólares de un grupo de obreros de una empresa petrolera trasnacional. Calcule:   a) Q1, b)  Q2,  c) Compare los resultados con la mediana D3,   d)  D5,  e)  P25,  f)  P50,  g)  P7

                                                                       

SALARIO EN  $

fi

Fa

200-----299

85

85

300-----399

90

175

400-----499

120

295

500-----599

70

365

600-----699

62

427

700-----799

36

463

Totales = N

463

 

 

a)                    Para calcular  Q1, se determina primero  la posición así: 

     PQ1 = 115.75. Con ese valor  de  la posición encontrado se busca en las frecuencias acumuladas para ver cuál de esas contiene ese valor. Observando las frecuencias acumuladas se puede  detectar  que  la  posición  115.75  se  encuentra  en la  clase  300------399,  por lo tanto el  Li = 299.5,    fm = 90, y la   Faa =  85  y  Ic = 100,  aplicando la formula se tiene:

 

 

Este valor de Q1 indica  que el  25 %  de los obreros en estudio, devengan un salario semanal por debajo de 333.67 $  y el  75 %  restante gana un salario por encima de 333.67 $.

 b)  Para calcular  Q2=Md  se determina primero la posición de este así.   , ahora se ubica esta posición en las frecuencias acumulados para determinar la posición de  Q2, se puede observar  en  la distribución  que  esta posición de  Q2   esta ubicada en la  clase  400----499, entonces,  Li = 399.5,  fm = 120,   Faa = 175  y  Ic = 100,  aplicando la formula se tiene:

 

 

Este resultado de  Q2  establece que el  50 % de los  obreros  de este estudio, devengan un salario semanal por debajo de 446.58 $ y el otro  50 %  devenga un sueldo por encima de  446.58 $.  Calcule la mediana y compárela con este resultado.

 c)  Para determinar  D3 = P30   hay primero que calcular la posición de este así: , ahora se ubica esta posición en las frecuencias acumuladas para determinar la posición de D3,  en la tabla de la distribución de frecuencia se observa que  D3  se encuentra  en  la clase 300----399, luego,   Li = 299.5,  fm = 90,   Faa = 85  y  Ic = 100,  aplicando la formula se tiene:

 

 .

Esto indica que un 30 % de  los obreros  ganan un  salario semanal  por debajo de 359.39 $ y el 70 % restante devenga un sueldo por encima de 359.39 $.

d)   Calcular,  D5 = Q2 = P50,  además    P25 = Q1,  la comprobación de estos resultados se le deja como practica al estudiante.

 

g)   Para calcular   P70  lo primero que se hace es determinar la posición,   . Ahora se ubica este resultado en la columna de  frecuencias acumuladas para encontrar  la   posición de P70 en la distribución de frecuencia. Como se puede observar en la tabla de distribución de frecuencia, P70 se encuentra  ubicado en la clase  500-------599,  entonces,  Li = 499.5,  fm = 70, Faa = 295   y     Ic = 100,  aplicando la formula se tiene:

 

 

      

 

Esto indica que el 70 % de los obreros devengan  un sueldo semanal que esta por debajo de 541.07 $  y  que el  30 % de los restantes   obreros,  ganan un salario por encima de 541.07 $.

PORCENTAJES DE VALORES QUE ESTÁN POR DEBAJO O POR ENCIMA DE UN VALOR DETERMINADO

Muchas veces necesitamos conocer el porcentaje de valores que están por debajo o por encima de un valor determinado; lo que representa un tipo de  problema contrario al estudiado anteriormente, esto es, dado un cierto valor en  el eje de  abscisa (X) del plano cartesiano, determinar en la ordenada (Y) el tanto por ciento de valores inferiores y superiores al valor dado. Operación que se resuelve utilizando la siguiente fórmula matemática:

 

, donde:

 

que se quiere buscar.

Valor dado en el eje de las X (valor que se ubica en las clases).

Frecuencia acumulada de la clase anterior a la clase donde se encuentra ubicado P.

Frecuencia de la clase donde se encuentra ubicada P.

Límite inferior de la clase donde se encuentra ubicada P.

Intervalo de clase.

N = Número total de datos o total de frecuencias.

EJEMPLO: Utilizando los datos de la distribución de frecuencia anterior,   Determine que porcentaje de obreros ganan un salario semanal inferior a 450 $.

Solución:

 

Datos:

450

 175

 400

100

N = 463

Ahora se aplica la formula:

 

 , Sustituyendo valores se tiene:

 

 

De acuerdo con el resultado se puede afirmar que el 50.75 % de los obreros devengan un salario inferior a 450 $ y el 49.25 % de los obreros ganan un salario superior a 450

 

ASIGNACIÓN: Describa brevemente lo referente a las medida de posición LOS CUARTILES, LOS DECILES Y LOS PERCENTILES, los pasos para su cálculo y de por lo menos un ejemplo de cada uno.

Hosted by www.Geocities.ws

1