EstadisticaComputarizada6405.html (Capítulo 6)
MEDIDAS DE DISPERSION
OBJETIVO: Aplicar las caractersticas y propiedades de la desviacion tipica y la varianza como principales medidas de dispersión de una distribucion de frecuencia.
CONTENIDOS: Descripcion de las caractersticas de la desviacion tipica, la varianza y los momentos estadisticos. Resolucion de problemas aplicando el Spss13.0.
MEDIDAS DE DISPERSIÓN
(Hamlet Mata Mata Prof. Del TECNOLÓGICO de EL TIGRE – VENEZUELA)
www.mipagina.cantv.net/hamletmatamata
Las medidas de posición central son los valores que de una manera condensada representan una serie de datos, pero realmente no son suficientes para caracterizar una distribución de frecuencia. Para describir una distribución de frecuencia o serie de datos es necesario, por lo menos otra medida que indique la dispersión o variabilidad de los datos, es decir, su alejamiento de las medidas de posición central. Estas medidas de posición central no tienen ningún valor si no se conoce como se acercan o se alejan esos valores con respecto al promedio, en otras palabras es conocer como se dispersan o varían esos valores con respecto al promedio de una distribución de frecuencia.
La dispersión o variabilidad se entiende como el hecho de que los valores de una serie difieran uno de otro, es decir, como se están dispersando o distribuyendo en la distribución. De acuerdo con esto es necesario encontrar una medida que indique hasta que punto los valores de una variable están dispersos en relación con el valor típico. Las medidas de variabilidad son números que expresan la forma en que los valores de una serie de datos cambian alrededor de una medida de posición central la cual por lo general es la media aritmética.
La dispersión puede ser mayor o menor, tomando en cuenta esas diferencias. La variabilidad es la esencia de la estadística, puesto que las variables y atributos se caracterizan siempre por diferencias de valores entre observaciones individuales. Casi siempre en una distribución de frecuencia el promedio obtenido difiere de los datos de la serie; por esto es importante determinar el grado de variación o dispersión de los datos de una serie de valores con respecto al promedio. Las medidas de dispersión se clasifican en dos grandes grupos: a).- Las Medidas de Dispersión Absolutas y las Relativas; las Relativas, vienen expresadas en las mismas medidas que se identifican la serie de datos, las mismas son: 1).- El Recorrido, 2) La Desviación cuartilica, 3) La Desviación Semicuartilica, 4) La desviación Media, 5) La Desviación Típica o Estándar 6) La varianza.
Las Medidas de Dispersión relativa. Son relaciones entre medidas de dispersión absolutas y medidas de tendencia central multiplicadas por 100, por lo tanto vienen expresadas en porcentaje, su función es la de encontrar entre varias distribuciones la dispersión existente entre ellas. La medida de dispersión relativa de mayor importancia es el Coeficiente de Variación.
Se llama Variación o Dispersión de los datos, el grado en que los valores de una distribución o serie numérica tiende a acercarse o alejarse alrededor de un promedio. Cuando la dispersión es baja indica que la serie de valores es relativamente homogénea mientras que una variabilidad alta indica una serie de valores heterogénea.
Cuando los valores observados de una serie están muy concentrados alrededor del promedio, se dice que ese promedio es o será muy representativo; pero si están muy dispersos con relación al promedio, es decir muy esparcidos con respecto al promedio, entonces ese promedio es poco representativo de la serie o distribución, puesto que no representan adecuadamente los datos individuales de esa distribución. Es importante obtener una medida que indique hasta qué punto las observaciones de una serie de valores están variando en relación con el valor típico de la serie.
RANGO O RECORRIDO(R) -. Es la primera medida de dispersión, no esta relacionada con ningún promedio en particular, ya que este se relaciona con los datos mismos, puesto que su cálculo se determina restándole al dato mayor de una serie el dato menor de la misma, más una unidad de medida (UM). El rango es el número de variables diferentes que posee una serie de valores. Su formula se calcula así:
Rango(R) = Dato mayor (XM)-Dato Menor (Xm) + Una unidad de medida (1UM):
R = XM - Xm + 1 UM. El rango es la medida de dispersión más sencilla e inexacta dentro de las medidas de dispersión absoluta. Esta medida tiene bastante uso en el control de calidad de los productos manufacturados.
DESVIACIÓN ÍNTERCUARTILICA (DC). - La desviación íntercuartilica es la diferencia que existe entre el cuartil tres(Q3) y el cuartil uno(Q1) de una distribución de frecuencia y se expresa así: DC = Q3 - Q1.
DESVIACIÓN SEMI-ÍNTERCUARTILICA (DSC). - La desviación semi-íntercuartilica es la diferencia entre el Q3 y el Q1 dividido entre dos:
.
Si los valores de la DC o DSC son pequeños indica una alta concentración de los datos de la distribución en los valores centrales de la serie de datos. Estas medidas se utilizan para comparar los grados de variación de los valores centrales en diferentes distribuciones de frecuencias. Los mismos no son afectados por los valores extremos, no se adaptan a la manipulación algebraica, por tal motivo son de poco utilidad.
DESVIACIÓN MEDIA.- La desviación media de un conjunto de N observaciones x1, x2, x3,.............xn, es el promedio de los valores absolutos de las desviaciones (di) con respecto a la media aritmética o la mediana. Si se denomina como DM a la desviación media, entonces su fórmula matemática será la siguiente:

Esta fórmula es para datos no agrupados. Se toma el valor absoluto en la ecuación, debido a que la primera propiedad de la media aritmética establece que los desvíos (di) de una serie con respecto a la media aritmética siempre son iguales a cero, es decir: di = 0.

En esta fórmula
es
el punto medio de cada clase y fi es la frecuencia de cada
clase. La Desviación Media a pesar de que para su cálculo se toman todas las
observaciones de la serie, por el motivo de no tomar en cuenta los signos de
las desviaciones (di), es de difícil manejo algebraico. Su
utilización en estadística es muy reducida o casi nula, su importancia es
meramente histórica, ya que de esta fórmula es la que da origen a la desviación
típica o estándar.
DESVIACIÓN TÍPICA O ESTÁNDAR
Es la medida de dispersión más utilizada en las investigaciones por ser la más estable de todas, ya que para su cálculo se utilizan todos los desvíos con respecto a la media aritmética de las observaciones, y además, se toman en cuenta los signos de esos desvíos. Se le designa con la letra castellana S cuando se trabaja con una muestra y con la letra griega minúscula s (Sigma) cuando se trabaja con una población. Es importante destacar que cuando se hace referencia a la población él número de datos se expresa con N y cuando se refiere a la muestra él número de datos se expresa con n. La desviación típica se define como:
“La raíz cuadrada positiva del promedio aritmético de los cuadrados de los desvíos de las observaciones con respecto a su media aritmética”. La desviación típica es una forma refinada de la desviación media”.
Características de la Desviación Típica:
* La desviación típica se calcula con cada uno de los valores de una serie de datos.
* La desviación típica se calcula con respecto a la media aritmética de las observaciones de una serie de datos, y mide la variación alrededor de la media.
* La desviación típica es susceptible de operaciones algebraicas, puesto que para su cálculo se utilizan los signos positivos y negativos de los desvíos de todas las observaciones de una serie de valores, por lo tanto es una medida completamente matemática.
* Es una medida de bastante precisión, que se encarga de medir el promedio de la dispersión de las observaciones de una muestra estadística. Las influencias de las fluctuaciones del azar, al momento de seleccionar la muestra la afectan muy poco. Le da gran significación a la media aritmética de la serie de valores.
* Es siempre una cantidad positiva.
INTERPRETACIÓN DE LA DESVIACIÓN TÍPICA
La desviación típica como medida absoluta de dispersión, es la que mejor nos proporciona la variación de los datos con respecto a la media aritmética, su valor se encuentra en relación directa con la dispersión de los datos, a mayor dispersión de ellos, mayor desviación típica, y a menor dispersión, menor desviación típica.
Su mayor utilidad se presenta en una
distribución normal, ya que en dicha distribución en el intervalo determinado
por
se
encuentra el 68. 27% de los datos de la serie; en el intervalo determinado por
la
se
encuentra el 95,45% de los datos y entre la
se
encuentra la casi totalidad de los datos, es decir, el 99,73% de los datos;
además, existe una regla general de gran utilidad para la comprobación de los
cálculos que dice: “una oscilación igual a seis veces la
,
centrada en la media comprende aproximadamente el 99% de los datos”. Ver
gráfica.
A la zona limitada por la
conoce
bajo el nombre de zona normal, ya que se considera a los datos que caen dentro
de esa zona, datos normales en relación con el grupo estudiado; los datos que
estén por encima o por debajo de dicho intervalo se consideran supranormales
e infranormales.
Una regla empírica indica que en cualquier distribución normal las probabilidades delimitadas entre 1 desviación típica, 2 desviaciones típicas y 3 desviaciones típicas son el 68%, 95% y 99% respectivamente. Ver las graficas siguientes.
|
|

Cálculo de la Desviación Típica.- La desviación típica para calcularla se procede de dos formas: A).- Para datos no agrupados en clases, B). - Para datos agrupados en clases.
A). - Para datos no Agrupados.- Las formulas para determinar la desviación típica de una S y de una s son:
![]()
![]()

![]()
Es importante recordar que cuando se trabaja con la formula para datos no agrupados y se trata de una muestra se utilizará como denominador n-1, para corregir el sesgo, pero si en la muestra n ³ 50 ,entonces se utilizará n, simplemente.
Para caular la desviacián tipica de una poblacián para datos no agrupados, se utilizan las siguientes formulas:


Método para calcular la Desviación Típica en datos no agrupados:
* Se calcula la media aritmética.
* Se calculan los desvíos (di) de la serie de valores Xi, con respecto a la media aritmética.
* Se elevan al cuadrado cada una de las desviaciones (di)2 , y se determina la sumatoria de esos. De la misma forma se elevan al cuadrado cada uno de los Xi y se calcula la sumatoria de estos; de igual manera se calcula la sumatoria de los Xi y se elevan al cuadrado. Despues de hacer todos estos cálculos se elabora un cuadro estadístico con estos cálculos.
* Finalmente se aplica la formula de la desviación típica para datos no agrupados de la muestra o de la población, según el caso.
Ej.1 – Los siguientes valores corresponden a la edad de ñiños de una muestra tomada de una población: Xi = í3, 4, 5, 6, 7ý. Determine la desviación típica.
![]()
|
Xi |
|
|
|
3 |
3 – 5 = - 2 |
4 |
|
4 |
4 – 5 = - 1 |
1 |
|
5 |
5 – 5 = 0 |
0 |
|
6 |
6 – 5 = 1 |
1 |
|
7 |
7 – 5 = 2 |
4 |
|
|
|
|
![]()
utilizarán las formulas 1 y 3.

Interpretación.- El resultado obtenido con las formulas 1 y 3 indican que en promedio, las edades de los ñiños de esa muestra se desvian o varian con respecto a la media aritméticaen una cantidad igual a 1.58 años.
Si este problema se resuelve ahora, considerando los datos como si fueran de una población y se aplica la formula 4 y 5, entonces se tiene:
![]()

![]()
En la solución del problema con las formula 4 y 5 de la población se observa que la s de la población es menor que la S de la muestra, esto es debido a que la S de la muestra utilizó n-1, para corregir el error producto del sesgo, y la s de la población no lo utilizó.
2 – Los años de sevicio de 6 obreros son 5, 5, 8, 7, 9, y 11, los mismos corresponde a una muestra tomada de una empresa. Cálcule la desviación típica (S y s).
Se calcula la media![]()
|
|
|
|
|
|
5 |
5 – 7.5 = - 2.5 |
6.25 |
25 |
|
5 |
5 – 7.5 = - 2.5 |
6.25 |
25 |
|
7 |
7 – 7.5 = - 0.5 |
0.25 |
49 |
|
8 |
8 – 7.5 = 0.5 |
0.25 |
64 |
|
9 |
9 – 7.5 = 1.5 |
2.25 |
81 |
|
11 |
11 – 7.5 = 3.5 |
12.25 |
121 |
|
å Xi = 45 |
|
|
|
Con esto datos se aplican las formulas 1, 4 y 5 para calcular la muestra, se deja la formula 3 para que sea aplicada por el participante, el resultado será igual al de la formula 1. Calculos:

Ahora se calculará la s para la población (considerado los datos como de una poblacián).


Interpretación.- El resultado obtenido al aplicar la formula 1, 2, 3, 4 y 5 indica que en promedio, los años de servicios de los trabajadores de la empresa se desvían o dispersan con respecto a su media aritmética en una cantidad igual a 2.35 año según la muestra y de 2.14 años en la poblacion.
B) – Para datos Agrupados en Clases.- Para calcular la desviación típica en datos agrupado existen varios criterios en relacion a la corrección del sesgo que se produce al tomar una muestra, en este estudio se considerará la formula que corrige el sesgo de aquellas muestras en estudio; sin embargo, cuando n sea mayor que 50, no es necesario tal corrección. . Existen muchas formulas matemáticas para calcular la desvición típica, queda a juicio del estudiante utilizar la formula que él considere más fácil, siempre y cuando su aplicación sea valedera.
B).- Formulas Para calcular la muestra y
la población de una desviación típica con datos agrupados en clases:



![]()
En la formula 3,
es
un valor arbitrario que se toma de los
de
la distribución, es recomrndable que se escoja el
lo
más central posible para así facilitar los calculos posteriores.
El término Ki ,
en esta formula, viene a ser un desvío arbitrario con respecto a una mdia
arbitraria
.Entonces,
.
Este método para calcular S en datos agrupados, se fundamenta en la
propiedad de la desviación típica que establece: “si a cada una de los valores
de una serie de datos se le suma una constante, la desviación típica no se
altera en sus resultados”.




Método para calcular la Desviación Típica en datos Agrupados:
*
Se calcula la ![]()
* Se calcula el
de
cada una de las clases que integran la distribución de frecuencia, se determinan
los desvíos di de los
con
respecto a la
,
luego se elevan al cuadrado los di y se
multiplican por fi, y se calcula la
.
*
Se calcula la
,
luego se determina la
[å
]2.
* Se elabora un cuadro estadístico y se llevan a este todas los datos calculados.
* Se aplica la formula necesaria para calcular la desviación típica.
Ejemplos: 3 – Los siguientes datos corresponden a las horas extras trabajadas por los obreros de la empresa RINACA, en un mes (se resolverá considerando los datos como de una S y s).
CLASES |
fi |
|
|
di =
|
|
|
40 — 44 |
1 |
42 |
42 |
- 15.26 |
232.87 |
1764 |
|
45 — 49 |
6 |
47 |
282 |
- 10.26 |
631.60 |
13254 |
|
50 — 54 |
21 |
52 |
1092 |
- 5.26 |
581.02 |
56784 |
|
55 — 59 |
75 |
57 |
4275 |
- 0.26 |
5.07 |
243675 |
|
60 — 64 |
23 |
62 |
1426 |
4.74 |
516.75 |
88412 |
|
65 — 69 |
7 |
67 |
469 |
9.74 |
664.07 |
31423 |
|
70 — 74 |
2 |
72 |
144 |
14.74 |
434.54 |
10368 |
|
|
135 |
|
|
|
|
|
Para resolver el problema lo primero que se debe hacer es calcular la media aritmética así:
![]()
Ahora se calculan los diferentes
,
para determinar los otro parámetros necesarios (es recomendable que el
estudiante realice todos los cálculos) para resolver el problema planteado, en
el cuadro de arriba se colocaron los cálculos realizados que son necesarios
para resolver el mismo; este se resolverá aplicando las formulas 1, 2, y 3 de
la S, considerando los datos como los de una muestra, ya que esta claro
que estos pertenecen a una población determinada, luego se calculará la
s
de la distribución aplicando:


![]()
Para aplicar la fórmula 3 se toma una
media arbitraria
que
en este caso la más céntrica es 57, luego se calculan los desvíos de los
puntos medios con respecto a la
así:
Ki = (
-
)
se elabora un cuadro
estadístico para resumir los datos y finalmente se procede a buscar la
desviación
|
fi |
|
(
|
fi . Ki |
fi (ki)2 |
|
1 |
42 |
- 15 |
- 15 |
225 |
|
6 |
47 |
- 10 |
- 60 |
600 |
|
21 |
52 |
- 5 |
- 105 |
525 |
|
75 |
57 |
0 |
0 |
0 |
|
23 |
62 |
5 |
115 |
575 |
|
7 |
67 |
10 |
70 |
700 |
|
2 |
72 |
15 |
30 |
450 |
|
|
|
|
|
|


Interpretación.- Los resultados obtenidos con las formulas 1, 2, y 3, indican que el promedio de las horas extras laboradas por los trabajadores se desvían o varían con respecto a su media aritmética en una cantidad igual a 4.78 y 4.76 respectivamente. La misma interpretación se obtiene con los resultados obtenidos con las formulas 4, 5 y 6.



La aplicación de la fórmula 7 se deja para que el participante la aplique y resuelva el mismo problema, el cual tendrá resultados idénticos a los anteriores.
1 – Los siguientes datos corresponden al número de panes consumidos por un grupo de familia de una urbanización de la ciudad, durante una semana determinada.
Para resolver el problema se calcula la media y se procede a llenar el cuadro estadístico siguiente (el estudiante debe realizar los cálculos):
|
Clases |
fi |
|
30—32 |
10 |
|
33—35 |
18 |
|
36—38 |
60 |
|
39—41 |
100 |
|
42—44 |
80 |
|
45—47 |
14 |
|
48—50 |
6 |
|
å |
288 |
![]()
|
Clases |
fi |
|
|
|
|
|
|
30—32 |
10 |
31 |
310 |
9610 |
-9 |
810 |
|
33—35 |
18 |
34 |
612 |
20808 |
-6 |
648 |
|
36—38 |
60 |
37 |
2220 |
82140 |
-3 |
540 |
|
39—41 |
100 |
40 |
4000 |
160000 |
0 |
0 |
|
42—44 |
80 |
43 |
3440 |
147920 |
3 |
720 |
|
45—47 |
14 |
46 |
644 |
29624 |
6 |
504 |
|
48—50 |
6 |
49 |
294 |
14404 |
9 |
486 |
|
å |
288 |
|
11520 |
464508 |
|
3708 |


![]()
Interpretación.- Los resultados obtenido con las formulas 1 y 6 indican que en promedio, el consumo de pan de trigo del grupo de familias de esa urbanización se dispersa con respecto a su media aritmética en una cantidad igual a 3.59.
La aplicación de las formulas 2, 3, 4, 5 y 7 quedan como ejercicios de práctica para el participante, los resultados tienen que ser idénticos a los obtenidos con las formulas 1 y 6. Es muy importante que observe el resultado obtenido con la formula 1 para él cálculo de S y el obtenido con la formula 6 para calcular la s, ambos resultados son idénticos, lo que indica que cuando la muestra es grande tanto la fórmula para calcular S como la utilizada para calcular la población produce al final el mismo resultado.
Es importante señalar que expertos en la materia consideran que cuando las muestras son superiores a 50 datos el error de sesgo ya no se produce o es insignificante y en consecuencia no es necesario utilizar la formula que se encarga de corregir el mismo, por tal razón es conveniente utilizar n y no, n-1.
ASIGNACIÓN: Describa brevemente lo referente a la medida de dispersión denominada DESVIACIÓN TÍPICA, los pasos para su cálculo, propiedades y de por lo menos dos ejemplos.




La mayor utilidad de la varianza se presenta en la estadística inferencial.
Propiedades de la Desviación Típica:
1 – La desviación típica de una constante k es cero. Si se parte de que la media aritmética de una constante es igual a la constante, esto es así, debida a que al ser todos los datos iguales no habrá dispersión en la serie de datos con respecto a la media aritmética, por lo tanto s(k) = 0.
![]()
2 – Si a cada uno de los valores de una serie de variables se le suma o se le resta una constante K, la desviación típica no se altera. Esta se apoya en la propiedad de la media aritmética que establece “si a cada valor de la serie se le suma una constante, la media de la nueva serie es igual a la media de la serie original más la constante”, igual sucede con la resta, la nueva media vendrá disminuida en el valor de dicha constante.
3 – Si a cada uno de los términos de la serie de valores se le multiplica por una constante K, la desviación típica de la serie quedará multiplicada por K, y la nueva desviación típica será igual a la constante K tomada en valor absoluto por la desviación típica original. Esta propiedad se apoya en la propiedad del producto de la media aritmética

![]()
2
![]()
68.27 % de los datos se encuentran en
el intervalo (
±
s).
95.45 % de los datos se encuentran en
el intervalo (
±
2s).
99.73 % de los datos se encuentran en
el intervalo (
±
3s).
Estos valores se cumplen con bastante aproximación, para distribuciones que son
Normales y para las que son ligeramente asimétricas
3 – Para dos series de valores, de tamaño n1 y n2, con variaciones S21 y S22, respectivamente, la varianza combinada S2T de ambas series será

ASIGNACIÓN: Describa brevemente lo referente a la medida de dispersión denominada VARIANZA, los pasos para su cálculo, propiedades y de por lo menos un ejemplos.
DISPERSIÓN RELATIVA
Las medidas de variabilidad, estudiadas hasta ahora, solo permitían medir las dispersiones absolutas de los términos de la muestra. Las medidas, tomadas en esas condiciones, serán de utilidad, solo cuando se trata de analizar una sola muestra; pero, cuando hay que establecer comparaciones entre distintas muestras, será necesario expresar tales medidas en valores relativos, que pueden ser proporciones o porcentajes.
Las medidas de dispersión relativas permiten comparar grupos de series distintas en cuanto a su variación, independientemente de las unidades en que se midan las diferentes características en consideración. Generalmente las medidas de dispersión relativas se expresan en porcentajes, facilitando así el estudio con medidas procedentes de otras series de valores La dispersión relativa viene a ser igual a la dispersión absoluta dividida entre el promedio.
Existen varias medidas de dispersión
relativa, pero, la más usada es el coeficiente de variación de Pearson,
este es un índice de variabilidad sin dimensiones, lo que permite la
comparación entre diferentes distribuciones de frecuencias, medidas en
diferentes unidades. El coeficiente de variación de Pearson se designa
con las letras CV. La fórmula matemática es:![]()
El CV pierde utilidad, cuando la x es muy cercana a cero. Una serie de valores será más dispersa que otra respecto a su x mientras que su CV sea mayor.
5 – La venta en el mercado de tres productos, varia de acuerdo al siguiente cuadro. Determine el CV de cada uno y diga cuál de ellos presenta mayor variación y cuál la menor.
|
Producto |
|
S |
Unidades |
CV |
|
1 |
45 |
5 |
Bs. |
11.11 % |
|
2 |
450 |
40 |
Bs. |
8.87 % |
|
3 |
4500 |
350 |
Bs. |
7.78 % |
Para resolver el problema se calcula el CV de cada producto y luego sé determina cuál presenta mayor o menor variación
CV = Sx100/
![]()
CV1 = 5x100/45 = 11.11 %.
CV2 = 40x100/450 = 8.87 %.
CV3 = 350x100/4500 = 7.78 %.
Se puede observar que la menor dispersión la presenta el producto 3, por lo tanto, de los 3 productos el que menos varia es ese; por otro lado el de mayor dispersión o variabilidad es el producto 1.
TEORÍA DE LOS MOMENTOS.- Los momentos son indicadores matemáticos de diversos valores. Los diversos valores, están es función del parámetro estadístico o valor que se tome, para ser fijado como punto de referencia.
Sean X1, X2,
X3, ..........Xn, los valores que toma la
variable Xi; se define entonces, momento mi
de orden r con respecto al promedio aritmético (
)
de los valores de la variable Xi elevados a la potencia r;
siendo r cualquier valor comprendido entre,1 , 2, 3,....,n.
Matemáticamente:

Los momentos se pueden definir también como las potencias de los desvíos di con respecto a un determinado valor, que puede ser la media aritmética, el origen cero o una media arbitraria. En estadística son importantes los momentos 1, 2, 3 y 4 con respecto a la media aritmética y el momento 1 con respecto al origen que viene a ser igual a la media aritmética
Formulas para determinar los momentos con respecto a la media aritmética
![]()


![]()
B) – Para datos agrupados
![]()
![]()
![]()
![]()
Descripción de los Momentos:
1. - El primer momento con respecto a la
es
siempre igual a cero, este momento es similar a la primera propiedad de la
.
2. – El segundo momento con respecto a
la
es
siempre igual a la varianza.
3 – El tercer momento con respecto a la media aritmética se utiliza para determinar el coeficiente de asimetría SKm.
3 – E l cuarto momento con respecto a la media aritmética es un valor que se utiliza para determinar el coeficiente de kurtosis, de una serie de valores.
Formula de los momentos con respecto al origen cero:
![]()
![]()
Procedimiento para Calcular los mi de una serie de datos:
1 – Se calcula la media aritmética.
2 – Se determinan los mi
de los Xi y de los
de
la serie de valores con respecto a la media aritmética.
3 – Se determinan las
ådi
con respecto
para
los datos no agrupados y la
åfidi
para los datos agrupados según el caso.
4 – Se elabora un cuadro estadístico con los datos calculados.
5 – Se aplican las formulas para calcular los momentos según el caso.
1 – Sean los siguientes datos los años de servicio de un grupo de trabajadores. Determine el m1, m2, m3 y m4 con respecto a la media aritmética.
Solución.- Lo primero que se hace es
calcular la
y
luego se procede a calcular los d1, d2, d3 y d4
con respecto a la
después
se aplica la fórmula para calcular los momentos de datos no agrupados.
|
Xi |
(Xi-
|
(Xi-
|
(Xi-
|
(Xi-
|
|
5 |
(5 – 8) = -3 |
9 |
-27 |
81 |
|
6 |
(6 – 8) = -2 |
4 |
-8 |
16 |
|
7 |
(7 – 8) = -1 |
1 |
-1 |
1 |
|
9 |
(9 – 8) = 1 |
1 |
1 |
1 |
|
13 |
(13 – 8) = 5 |
25 |
125 |
625 |
|
åXi =40 |
åd = 0 |
åd2 = 40 |
åd3 =90 |
åd4 = 724 |
![]()

![]()

![]()

2 – La siguiente distribución de frecuencia corresponde al consumo de azúcar trimestral de un grupo de familias. Determine el m1, m2, m3 y el m4 con respecto a la media aritmética.
|
CLASES |
fi |
|
5 —7 |
5 |
|
8 —10 |
10 |
|
11 —13 |
15 |
|
14 —16 |
30 |
|
17 —19 |
15 |
|
20 —22 |
10 |
|
23 —25 |
5 |
|
å |
90 |
Solución.-
Lo primero que se hace es elaborar un cuadro estadístico, luego se calcula la
y
posteriormente se determinan los desvíos d1, d2, d3
y d4 con respecto a la media y finalmente con los datos obtenidos en
el cuadro se aplica la fórmula para obtener los momentos en datos agrupados.
|
CLASES |
fi |
|
|
di |
fi .di |
fi .d2 |
fi .d3 |
fi .d4 |
|
5 —7 |
5 |
6 |
30 |
-9 |
-45 |
405 |
-3645 |
32805 |
|
8 —10 |
10 |
9 |
90 |
-6 |
-60 |
360 |
-2160 |
12960 |
|
11 —13 |
15 |
12 |
180 |
-3 |
-45 |
135 |
-405 |
1215 |
|
14 —16 |
30 |
15 |
450 |
0 |
0 |
0 |
0 |
0 |
|
17 —19 |
15 |
18 |
270 |
3 |
45 |
135 |
405 |
1215 |
|
20 —22 |
10 |
21 |
210 |
6 |
60 |
360 |
2160 |
12960 |
|
23 —25 |
5 |
24 |
120 |
9 |
45 |
405 |
3645 |
32805 |
|
å |
90 |
|
1350 |
0 |
0 |
1800 |
0 |
93960 |
![]()
![]()
![]()
![]()
![]()
4.- La siguiente distribución de frecuencia corresponde al consumo de azúcar de un grupo de familias. Determine el m1 con respecto al origen.
|
CLASES |
fi |
|
5—7 |
5 |
|
8—10 |
10 |
|
11—13 |
15 |
|
14—16 |
30 |
|
17—19 |
10 |
|
20—22 |
15 |
|
23—25 |
5 |
|
å |
90 |
Cuadro resumen
|
CLASES |
fi |
|
|
|
|
5—7 |
5 |
6 |
6-0 = 6 |
30 |
|
8—10 |
10 |
9 |
9-0 = 9 |
90 |
|
11—13 |
15 |
12 |
12-0 =12 |
1 80 |
|
14—16 |
30 |
15 |
15-0 = 15 |
450 |
|
17—19 |
15 |
18 |
18-0 = 18 |
270 |
|
20—22 |
10 |
21 |
21-0 = 21 |
210 |
|
23—25 |
5 |
24 |
24-0 = 24 |
120 |
|
å |
90 |
|
|
1350 |
![]()
El momento m1 con respecto al origen cero (0), siempre es igual a la media aritmética.
ASIGNACIÓN: Describa brevemente lo referente a los momentos 1, 2, 3 y 4 de una distribución de frecuencia, los pasos para su cálculo, propiedades y de por lo menos un ejemplo de cada momento.
Medidas de Asimetría y Kurtosis
Simetría.- Según el Diccionario de la Real Academia Española es la “Regularidad en la disposición de las partes o puntos de un cuerpo o figura, de modo que posea un centro, un eje o un plano de referencia”. Es por lo tanto la armonía de posición de las partes o puntos similares uno respecto de otros y con referencia a puntos, líneas o planos determinados. Se puede generalizar diciendo que es una proporción de las partes entre sí y con el todo.
En estadística se dice que una distribución de datos es simétrica si se le puede doblar a lo largo de un eje vertical de una manera tal que coincidan los dos lados de la distribución. Las distribuciones que no tienen simetría con respecto al eje vertical se les llama sesgada o asimétrica. Una distribución sesgada a la derecha tiene una cola prolongada del lado derecho de la distribución y una cola más corta del lado izquierdo de la misma; esta asimetría se le denomina positiva, cuando la cola de la distribución del lado izquierdo es más larga que la del lado derecho, entonces la asimetría es negativa.
En una distribución simétrica la media, la mediana y la moda son iguales. La simetría se mide por medio del coeficiente de asimetría. Una distribución simétrica tiene un coeficiente de asimetría igual a cero. Cuando una distribución de frecuencia es asimétrica, la media, la mediana y la moda se alejan una de otra, es decir, las tres medidas de posición son diferente; mientras más se separe la media de la moda, mayor es la asimetría. Si la distribución de frecuencia es asimétricamente negativa, la cola de la curva de distribución se encuentra hacia los valores más pequeños de la escala de las X y si la distribución es asimétricamente positiva la cola de la distribución se ubica hacia los valores más grandes de la escala de las X.
![]()
Esta fórmula se puede transformar por medio de la relación:
,
si ahora se sustituye 3(
-
Md) en el primer coeficiente de asimetría de Pearson, se tiene
otro coeficiente de asimetría utilizando la mediana que se le denomina
segundo coeficiente de asimetría de Pearson, este es más preciso que el
primero.
![]()
Arthur Bowley otro estudioso de la estadística determinó que el coeficiente de asimetría se podía calcular por medio de los cuartiles y utilizó el coeficiente de asimetría por medio de cuartiles (skq), y la formula es

En donde, Q1, Q2 y Q3 son los cuartiles 1, 2 y 3 respectivamente. El valor de SKq varía entre 1 y -1; según Bowley una distribución de frecuencia con un coeficiente de asimetría igual a 0.1, se considera como ligeramente asimétrica y con un valor mayor 0.3 se le considera marcadamente asimétrica.

En esta fórmula m3 es el momento tres con respecto a la media aritmética y S3 es la desviación típica elevada a la potencia tres. Este coeficiente es el más confiable de todos los antes descritos, asi que para cualquier cálculo se debería utilizar este, ya que es un parámetro que utiliza todos los datos de la serie de valores.
Si en una serie de valores la
>
Md >
Mo, entonces la distribución de frecuencia presenta una curva asimétrica
positiva; si la
=Md
= Mo = 0 , la curva de la distribución es simétrica y si la distribución
presenta una curva en la que el Mo
>
Md >
, entonces se dice que la curva de la distribución asimétrica negativa.
Sí la curva de una distribución de
frecuencia es sesgada, la media tratara de ubicarse hacia el extremo o lado
opuesto, de la serie de valores, donde se concentran los datos. Es bueno hacer
referencia que en una asimetría positiva la
>
Md y en una asimetría negativa la
<
Md.
Si en una distribución de frecuencia, los intervalos de las clases que la conforman presentan frecuencias balanceadas en cada uno de ellos y no presentan ninguna aglomeración especial en los extremos y, además, presenta una concentración de los datos en el centro de la distribución, entonces se dice que la distribución de frecuencia es simétrica. Cuando la curva de una distribución de datos es simétrica el SK = 0, esta es una de las características de la curva Normal o Campana de Gauss.
Si la mayoría de los datos de una serie de valores están ubicados en el centro de la distribución y, además existe una dispersión medianamente hacia los extremos mayores o menores de las variables, entonces se afirma que la curva de la distribución es Ligeramente Asimétrica. Ejemplo
|
CLASES 1 |
f1 |
CLASES 2 |
f2 |
|
3—5 |
5 |
3—5 |
8 |
|
6—8 |
10 |
6—8 |
12 |
|
9—11 |
25 |
9—11 |
20 |
|
12—14 |
40 |
12—14 |
40 |
|
15—17 |
20 |
15—17 |
25 |
|
18—20 |
12 |
18—20 |
10 |
|
21—23 |
8 |
21—23 |
5 |
|
TOTAL |
120 |
TOTAL |
120 |
En este ejemplo la distribución 1 es ligeramente asimétrica positiva y la distribución 2 es ligeramente asimétrica negativa. La mayoría de las distribuciones de casos reales por lo general son ligeramente asimétricas.
Una distribución de datos es marcadamente asimétrica si la mayoría de los datos de la misma se encuentran ubicados en los extremos mayores o menores de las variables que conforman la distribución. Si la mayoría de los de los datos de una serie de valores se encuentra situados en el extremo de las clases menores de la distribución, entonces la curva de la distribución de frecuencia presenta una asimetría positiva, siendo en este caso el SK > 0; y si por el contrario esa mayoría se encuentra en los extremos de las clases mayores de las variables, entonces la serie de valores presenta una curva con una asimetría negativa, luego el Coeficiente de asimetría será mayor que cero, es decir, SK>0 Ejemplos:
|
CLASES 3 |
f3 |
CLASES 4 |
f4 |
|
3—5 |
15 |
3—5 |
5 |
|
6—8 |
25 |
6—8 |
10 |
|
9—11 |
40 |
9—11 |
15 |
|
12—14 |
60 |
12—14 |
60 |
|
15—17 |
15 |
15—17 |
40 |
|
18—20 |
10 |
18—20 |
25 |
|
21—23 |
5 |
21—23 |
15 |
|
TOTAL |
170 |
TOTAL |
170 |
En la distribución 3 los datos presentan una curva marcadamente asimétrica positiva y el caso 4 la curva de la distribución es marcadamente asimétrica negativa.
Existen distribuciones de frecuencias que presentan curvas fuertemente marcadamente asimétricas y otras que las curvas son ligeramente asimétricas. Considerar la asimetría de una curva de frecuencia marcadamente o ligeramente asimétrica, es un asunto de criterio del investigador, puesto que no existen reglas rígidas establecidas que determinen las líneas divisorias o parámetros entre ligeramente o marcadamente asimétrica; Sin embargo cuando la mayoría de los datos de una distribución de frecuencia se ubican en los extremos mayores o menores de las variables se puede afirmar con certeza que la curva de la distribución es marcadamente asimétrica.
Algunos investigadores como Arthur Bowley determinaron que si se aplica el SKq y ese coeficiente de asimetría obtenido es menor que 0.3 (sin considera el signo) se puede afirmar que la curva de la distribución es ligeramente asimétrica, en caso contrario la curva de la distribución sería marcadamente asimétrica. Otros investigadores utilizan el coeficiente de asimetría según los momentos (SKm) para tales efectos, pero no existe criterio en cual ha de ser el coeficiente especifico que marque él límite entre ligera y marcadamente. Sin embargo, en este estudio se considerará que un coeficiente de asimetría según los momentos comprendido entre - 0.30 £ SKm £ 0.30, sería un buen límite para considerar una curva de distribución como ligeramente asimétrica, de lo contrario sería marcadamente asimétrica. El SKm es el coeficiente de asimetría de mayor precisión y confiabilidad, puesto que este, utiliza para su cálculo todos los valores de la serie de datos.
Es bueno afirmar que cuando el coeficiente de asimetría de una curva de distribución es marcadamente asimétrico no se puede utilizar la media aritmética como medida de tendencia central, puesto que esta es afectada altamente por los valores extremos de una serie de datos, en su lugar es recomendable utilizar la mediana como medida de posición.
ASIGNACIÓN: Describa brevemente lo referente a las Medidas de Asimetría de una distribución de frecuencia, los pasos para su cálculo, propiedades y de por lo menos un ejemplo de cada una.
KURTOSIS8 (CURTOSIS).- Es el grado de apuntamiento o altura de la curva de una distribución de frecuencia. La finalidad de la Kurtosis es determinar si la distribución de los términos de una serie de valores responde a una curva normal o no. Se utiliza para observar el promedio o posición de la distribución, así como la media, la mediana y la moda, se puede en esta observar la asimetría, el grado de concentración de los datos, en fin, para observar en forma general el comportamiento de una serie de datos en una distribución de frecuencia. Por medio de la Kurtosis se determinará si la distribución de frecuencia es demasiado puntiaguda, normal o muy achatada.
El grado de apuntamiento o altura de una curva de distribución se determina por medio del coeficiente de Kurtosis, el cual se calcula utilizando el momento cuatro de una serie de valores con respecto a su media aritmética. La Kurtosis se designa con la letra K4 y la fórmula de cálculo es:
![]()
En esta fórmula m4 es el momento cuatro con respecto a la media aritmética y S4 es la desviación típica elevada a la cuarta potencia, K4 es el coeficiente de Kurtosis. Tomando en cuenta la Kurtosis el k4 de una curva de distribución puede ser: Mesocurtica, Platicurtica y Leptocurtica.
Mesocurticas.- Es aquella curva de una distribución de frecuencia que no es ni muy alta ni muy achatada, es la llamada curva normal. La curva Mesocurtica tiene un coeficiente de Kurtosis igual a tres, es decir, K4 = 3.
Leptocurtica.- Es aquella curva de la distribución que presenta un apuntamiento o altura relativamente más alta que la curva Mesocurtica, en esta los datos se encuentran más concentrados alrededor del máximo valor. El coeficiente de Kurtosis para curva Leptocurtica es mayor de tres, es decir, K4 > 3.
Platicurtica.- Es la curva de una distribución de frecuencia que presenta un achatamiento más pronunciado que la Mesocurtica, encontrándose los datos más dispersos alrededor del máximo valor de la distribución. En esta curva el coeficiente de Kurtosis es menor de tres, es decir, K4 < 3.
En la gráfica 1 de Kurtosis se pueden observar los tres tipos de Kurtosis antes descritos, siendo la primera curva Platicurtica (azul), la segunda Mesocurtica (roja) y la última es Leptocurtica(amarilla):
ASIGNACIÓN: Describa brevemente lo referente a la Kurtosis de una distribución de frecuencia, los pasos para su cálculo, propiedades y de por lo menos un ejemplo de cada uno de los diferentes tipos de kurtosis.
Problemas Relacionados con la asimetría y la (Kurtosis) curtosis
1 – En la siguiente distribución de frecuencia, determine el coeficiente de asimetría utilizando los métodos de Pearson, de Bowley y el de los momentos, interprete los resultados y haga un análisis de los diferentes resultados y diga cuál es el resultado más recomendado en este caso; encuentre la Kurtosis e interprete los resultados.
|
CLASES |
fi |
|
10—12 |
1 |
|
13—15 |
5 |
|
16—18 |
15 |
|
19—21 |
40 |
|
22—24 |
15 |
|
25—27 |
10 |
|
28---30 |
9 |
|
å |
95 |
Solución.-
Para resolver el problema lo primero que hay que hacer es calcular la
y
determinar los desvíos di con respecto a la media, luego se elabora un
cuadro estadístico con el resumen de los cálculos necesarios para determinar la
asimetría y la curtosis. Además, se tendrá que calcular la mediana, la moda, el
Q1 el Q3, y después de realizar todos esos cálculos se
procede a buscar la asimetría y la curtosis con las formulas respectivas. En el
siguiente cuadro se encuentran resumidos la mayoría de los cálculos necesarios,
el resto se calcularan aparte.
|
CLASES |
fi |
|
|
di |
fi.di |
fi.d2 |
fi.d3 |
fi.d4 |
|
10—12 |
1 |
11 |
11 |
-10.07 |
-10.07 |
101.40 |
-1021.15 |
10282.95 |
|
13—15 |
5 |
14 |
70 |
-7.07 |
-35.35 |
249.92 |
-1766.97 |
12492.45 |
|
16—18 |
15 |
17 |
255 |
-4.07 |
-61.05 |
248.47 |
-1011.29 |
4115.94 |
|
19—21 |
40 |
20 |
800 |
-1.07 |
-42.80 |
45.80 |
-49.00 |
52.43 |
|
22—24 |
15 |
23 |
345 |
1.93 |
28.95 |
55.87 |
107.84 |
208.12 |
|
25—27 |
10 |
26 |
260 |
4.93 |
49.30 |
243.05 |
1198.23 |
5907.28 |
|
28---30 |
9 |
29 |
261 |
7.93 |
71.37 |
565.96 |
4488.10 |
35590.60 |
|
å |
95 |
|
2002 |
|
0.38 |
1510.40 |
1945.76 |
68649.77 |
Se recomienda al participante que debe realizar los cálculos de los parámetros que solo aparecen sus resultados
=
21.07, Mo = 20.0, Q1 = 18.71, Q2 = Md = 20.49,
Q3 = 23.55, S = 4.41, S2 = 19.46, S3 = 85.82, S4 = 378,82.
![]()
El resultado indica que la curva de distribución es ligeramente asimétrica positiva.
![]()
El resultado indica que la curva de la distribución es marcadamente asimétrica positiva.
![]()
El resultado indica que la curva es ligeramente asimétrica positiva.
Para calcular el coeficiente de asimetría según los SKm se cálcula primero el m3 así:
![]()
![]()
![]()
Para calcular el K4 se calcula el m4 así:

Ahora se procede a calcular el K4 aplicando la formula
![]()
El resultado indica que el apuntamiento de la curva es achatado, esto se observa en el grafico 2 la primera curva (de color verde), es decir, la curva es platicurtica. Observe la gráfica 1 donde se puede ver la curva normal (de color rojo) y se puede observar la kurtosis y la simetría. La asimetría positiva se puede observar en la parte derecha de la gráfica.
|
CLASES |
fi |
|
10—12 |
9 |
|
13—15 |
10 |
|
16—18 |
15 |
|
19—21 |
40 |
|
22—24 |
15 |
|
25—27 |
5 |
|
28—30 |
1 |
|
å |
95 |
Solución.-
Para resolver este problema se debe calcular la
y
los desvíos di con respecto a esta, también es necesario calcular la Md,
el Mo, el Q1, el Q3, la S, el m3, el
m4, elaborar un cuadro estadístico y finalmente aplicar las
formulas respectivas. En el siguiente cuadro se resumen los cálculos para tales
efectos. Se recomienda al estudiante realizar todos los cálculos pertinentes.
|
CLASES |
fi |
|
|
di |
fi.di |
fi.d2 |
fi.d3 |
fi.d4 |
|
10—12 |
9 |
11 |
99 |
-7.93 |
-71.37 |
565.96 |
-4488.10 |
35590.60 |
|
13—15 |
10 |
14 |
140 |
-4.93 |
-49.30 |
243.05 |
-1198.23 |
5907.28 |
|
16—18 |
15 |
17 |
255 |
-1.93 |
-28.95 |
55.87 |
-107.84 |
208.12 |
|
19—21 |
40 |
20 |
800 |
1.07 |
42.80 |
45.80 |
49.00 |
52.43 |
|
22—24 |
15 |
23 |
345 |
4.07 |
61.05 |
248.47 |
1011.29 |
4115.94 |
|
25—27 |
5 |
26 |
130 |
7.07 |
35.35 |
249.92 |
1766.97 |
12492.45 |
|
28—30 |
1 |
29 |
29 |
10.07 |
10.07 |
101.40 |
1021.15 |
10282.95 |
|
å |
95 |
|
1798 |
|
-0.35 |
1510.47 |
-1945.76 |
68649.77 |
Los resultados obtenidos de los diferentes cálculos son:
=
18.93, Mo = 20.0, Q1 = 16.45, Q2 = Md = 19.91.
S = 3.99, S3 = 63.40, S4 = 252.80, m3 = -20.48, m4 = 722.63
Ahora se procederá a calcular los diferentes coeficientes de asimetría así:
![]()
![]()
![]()
![]()
Si observa puede ver que este problema es casi idéntico al anterior, solo las frecuencias fueron cambiadas de la parte alta de las variables hacia la parte baja de las mismas, por tal razón todos sus cálculos son idénticos en valor absoluto al anterior, lo que indica que ahora la asimetrías obtenidas es negativas, es decir, con sesgo hacia la izquierda; si observa la gráfica 3 de asimetría y Kurtosis podrá notar las variaciones que hay en ambas curvas. La Kurtosis es idéntica a la anterior y la simetría tiene un sesgo a la izquierda, es decir, asimetría negativa.
Para calcular la Kurtosis se procede así:
![]()
La curva de la distribución es platikurtica. La interpretación es idéntica a la del problema anterior. Se puede ver que la curva más alta es la normal (roja) o Mesocurtica y la más achatada es la curva de la distribución en estudio, y en este caso es platikurtica.
3.- Dada la siguiente distribución de frecuencia determine el SK1, SK2, SKq, SKm e intérprete los resultados y diga cuál de esos coeficientes es el más recomendado para este caso; calcule el K4 e intérprete su resultado.
|
CLASES |
fi |
|
10—14 |
5 |
|
15—19 |
10 |
|
20—24 |
25 |
|
25—29 |
60 |
|
30—34 |
25 |
|
35—39 |
10 |
|
40—44 |
5 |
|
å |
140 |
Solución.- Para resolver el problema
primeramente se debe calcular la
,
los desvíos di con respecto a la
,
la Md, el Mo, el Q1, el Q2, la S, el m3,
el m4. Para trabajar mejor se debe elaborar un cuadro
estadístico con todos los cálculos necesarios para resolver el problema. Se
recomienda al estudiante realizar todos los cálculos.
Los siguientes son los diferentes cálculos necesarios para resolver el problema. Se recomienda al participante efectuar los diferentes cálculos de todos los parámetros utilizados.
=
27.00, Mo = 27.00, Q1 = 23.50, Q2 = Md = 27.00.
Q3 = 30.50, S = 6.27, S3 = 246.24, S4 = 1543.37, m3 = 0, m4 = 5267.86.
|
CLASES |
fi |
|
|
di |
fi.di |
fi.d2 |
fi.d3 |
fi.d4 |
|
10—14 |
5 |
12 |
60 |
-15 |
-75 |
1125 |
-16875 |
253125 |
|
15—19 |
10 |
17 |
170 |
-10 |
-100- |
1000 |
-10000 |
100000 |
|
20—24 |
25 |
22 |
550 |
-5 |
-125 |
625 |
-3125 |
15625 |
|
25—29 |
60 |
27 |
1620 |
0 |
0 |
0 |
0 |
0 |
|
30—34 |
25 |
32 |
800 |
5 |
125 |
625 |
3125 |
15625 |
|
35—39 |
10 |
37 |
370 |
10 |
100 |
1000 |
10000 |
100000 |
|
40—44 |
5 |
42 |
210 |
15 |
75 |
1125 |
16875 |
253125 |
|
å |
140 |
|
3780 |
|
0 |
5500 |
0 |
736500 |
![]()
![]()
![]()
![]()
El resultado obtenido con los diferentes coeficientes de asimetría indica que la curva de la distribución es simétrica. Se puede observar que cuando una curva de distribución es simétrica, con todos los métodos se logra el mismo resultado, cualquiera de ellos es valedero, pero si se tuviese que escoger uno en especial el más recomendado seria el SKm , ya que para su cálculo toma en cuenta todos los datos de la serie de valores.
Para él cálculo de la Kurtosis se procede así:
![]()
El resultado indica que la curva de la distribución de frecuencia es leptocurtica (Roja), es decir, la gran mayoría de los datos se encuentran ubicados alrededor de las medidas de tendencia central, además, la curva de la serie de valores es más alta que la curva normal (Azul). Observe que la gráfica de la curva leptokurtica, es más alta que la otra curva la normal. De la misma forma se puede observar que ambas curvas son simétricas, es decir, parten del mismo punto y no presentan sesgo en todo su recorrido y esto es así debido a que su coeficiente de asimetría es igual a cero. Lo único que varía entre ellas es la Kurtosis.
2
– Dada la siguiente distribución de
frecuencia determine el SK1, el SK2, el SKq, el
SKm, haga un análisis cada uno de estos y diga cuál es el más
recomendado, tomando en cuenta la precisión de cada uno. Determine, además, el
K4 e interprete el resultado. Se desea tomar una medida de posición
central, ¿cuál sería la más adecuada?
|
CLASES |
fi |
|
40—44 |
2 |
|
45—49 |
7 |
|
50—54 |
23 |
|
55—59 |
75 |
|
60—64 |
21 |
|
65—69 |
6 |
|
70—74 |
1 |
|
å |
135 |
Solución.- Para resolver el problema se
debe calcular primero la
luego
se determinan los desvíos con respecto a la
,
se calcula la Md, el Mo., el Q1, el Q3, la S, el m3
y el m4. Para facilitar el estudio es conveniente
elaborar un cuadro estadístico con todos los parámetros necesarios. En el
siguiente cuadro se resumen gran parte los parámetros necesarios para resolver
el problema.
|
CLASES |
fi |
|
|
di |
fi.di |
fi.d2 |
fi.d3 |
fi.d4 |
|
40—44 |
2 |
42 |
84 |
-14.74 |
-29.84 |
434.54 |
-6405.05 |
94410.42 |
|
45—49 |
7 |
47 |
329 |
-9.74 |
-68.18 |
664.07 |
-6468.07 |
62999.03 |
|
50—54 |
23 |
52 |
1196 |
-4.74 |
-109.02 |
516.75 |
-2449.42 |
11610.24 |
|
55—59 |
75 |
57 |
4275 |
0.26 |
19.50 |
5.07 |
1.32 |
0.34 |
|
60—64 |
21 |
62 |
1302 |
5.26 |
110.46 |
581.02 |
3056.16 |
16075.42 |
|
65—69 |
6 |
67 |
402 |
10.26 |
61.56 |
631.60 |
6480.27 |
66487.60 |
|
70—74 |
1 |
72 |
72 |
15.26 |
15.26 |
232.87 |
3553.56 |
54227.32 |
|
å |
135 |
|
7660 |
|
-0.26 |
3065.92 |
-2231.23 |
305810.37 |
Se recomienda al participante realizar los cálculos de los parámetros aquí utilizados:
=
56.74, Md = 56.87, Mo = 56.95, Q1 = 54.62, Q3 = 59.12, S = 4.76, S3
= 108.23,
![]()
S4 = 515.77, m3
=-16.53, m4 = 2265.26.
Este coeficiente indica que la curva de la
distribución es ligeramente asimétrica positiva. Con este resultado se observa
que la curva de la serie de valores es casi simétrica.![]()
Se puede observar que este resultado es un
poco mayor que el obtenido con SK1; la curva de acuerdo con este, es ligeramente
asimétrica positiva.![]()
Con este coeficiente se observa que la
curva es simétrica ya que su coeficiente de asimetría es igual a cero. Se puede
concluir que este coeficiente no es lo suficiente preciso, puesto que esa curva
de distribución no es simétrica, como se puede observar en la distribución de la
serie de valores.![]()
Este resultado indica que la curva de la distribución es ligeramente asimétrica negativa, este es bastante parecido al obtenido con el SK2, los cuales se acercan bastante a la realidad, por lo tanto, el resultado más recomendado para tomar una decisión seria el SKm, por cuanto en el cálculo del mismo intervienen todos los valores de la serie de datos. Se pudo detectar que en el orden de prioridades referente al coeficiente de asimetría los más indicados serian el SKm, luego el SK2 y el menos recomendado seria el SKq por no adaptarse a la realidad.
Para calcular el K4 se procede de la siguiente manera:
![]()
De acuerdo con este resultado la curva de la distribución es Leptocurtica, por ser mayor que el coeficiente de Kurtosis de la curva normal. Este resultado indica que la mayoría de los datos se encuentran ubicados alrededor de la moda y por lo tanto la curva en cuestión presenta un apuntamiento bastante alto.
La medida de posición central más adecuada es la media aritmética puesto que en este caso no es afectada por valores extremos por ser la curva de distribución ligeramente asimétrica negativa como se puede observar en la siguiente grafica. Observe la gráfica de ASIMETRÍA Y Kurtosis.

3.- Los años de servicio de un grupo de
trabajadores son 9, x, 10, 8, 6 y 7. El primer momento con respecto al origen
de esa serie de valores es de 7.5 y el m2 con respecto a la
es
de 2.92. Determine el SK2 y el SKm; de esos valores. Se
desea tomar una medida de posición central, ¿ cuál es la más indicada para el
caso?. Explique brevemente.
Solución.- Lo primero que se debe hacer es calcular el valor de x, para ello se procede así:
La
es
igual al primer momento con respecto al origen, entonces,
El
número de datos n = 6, m2 = S2 = 2.92,
ahora se aplica la formula de la media así:
![]()
![]()
Ahora se calcula la Md de la siguiente serie de valores, los cuales se han ordenado: 5, 6, 7, 8, 9 y 10, la mediana en este caso será: Md
![]()
(
Esto es así, por ser n un número par). Con estos datos se puede
calcular el SK2.
De acuerdo con el SK2 la curva
de la serie de valores es simétrica y esto es así, debido a que la
=
Md = 7.5. La medida de tendencia central más recomendada seria la media
debido a que este promedio para su cálculo utiliza todos los valores de la serie
de datos. Para calculr el SKm se calcula S y los desvíos con
respecto a la media de la serie de valores.
S2 = 2.92. S3 = 4.99.
![]()
|
CLASES |
di |
d3 |
|
5 |
-2.5 |
-15.62 |
|
6 |
-1.5 |
-3.38 |
|
7 |
-0.5 |
-0.12 |
|
8 |
0.5 |
0.12 |
|
9 |
1.5 |
3.38 |
|
10 |
2.5 |
15.62 |
|
å |
0 |
0 |
![]()
Cuando la curva de una serie de valores
es simétrica siempre el coeficiente de asimetría será igual a cero usando
cualquiera de los coeficientes de asimetría. Cuando la curva de una serie de
valores se le calcula el SKm, el resultado obtenido es el más
adecuado y preciso de los coeficientes en cuestión.
La medida de tendencia central más
recomendada en este caso es la media aritmética a pesar de que esta es igual a
la mediana, pero la
es
más confiable por utilizar esta todos los datos de la serie para su cálculo
3.- Los pesos en Kg, de una familia son 4, 35, 39, 40, 42, 48 y 58. Para realizar una investigación se requiere tomar una medida de posición. ¿Cuál es la más adecuada?. Explique brevemente.
Solución. – Para tomar la decisión es necesario calcular el SKm .
Para calcular el SKm se
determina la
de
los valores y los desvíos di con respecto a esta, se determina la S,
la S3,el di, el d2 y el d3
de los datos y la sumatoria de estos, luego se calcula el m3 y
se procede a determinar el SKm, se elabora un cuadro estadístico con
el resumen de los datos requeridos; y se aplica la formula respectiva para este
caso. El siguiente cuadro resume los datos necesarios para los cálculos.
|
Xi |
di |
d2 |
d3 |
|
4 |
-34 |
1156 |
-39304 |
|
35 |
-3 |
9 |
-27 |
|
39 |
1 |
1 |
1 |
|
40 |
2 |
4 |
8 |
|
42 |
4 |
16 |
64 |
|
48 |
10 |
100 |
1000 |
|
58 |
20 |
400 |
8000 |
|
åXi = 266 |
ådi = 0 |
åd2 = 1686 |
åd3 = -30258 |
![]()

![]()
![]()
De acuerdo con el resultado, la curva de la distribución es marcadamente asimétrica negativa, lo que indica que existen valores extremos, por lo tanto la media aritmética no se puede utilizar como medida de posición central por ser esta afectada por los valores extremos, en su lugar se utilizará la mediana como medida de posición central, por no ser esta, afectada por los valores extremos.
Los coeficientes SK1, SK2 y skq, se le dejan al participante para que los calcule e intérprete los resultados dando su opinión al respecto.
7. – Los siguientes datos 90, 70, X, 60, y 80 corresponden al peso en kg. De un grupo de profesores. El coeficiente de variación de esa serie de datos es de
19,285 %, el m4 con respecto a la media aritmética es de 109.492 y el K4 es de 1,840. Se requiere hacer una investigación y para ello es necesario tomar una medida de posición. ¿ Cuál es la medida de posición más adecuada?
Solución. – Lo primero que se debe hacer es calcular el valor de X, y para ello se procede así:
CV = 19,285 %, m4 = 109492, K4 = 1,840, n = 5, ahora se aplica la formula de la media así:
![]()
![]()
![]()
![]()
Calculado S se procede a calcular
la media así:
300+X = 405
X = 405 – 300
X = 105.
Después de calculado X sé procederá a calcular los desvíos di con respecto a la media aritmética y finalmente se calcula el SKm Se procederá ahora a elaborar un cuadro estadístico para facilitar los cálculos.
![]()
Ahora se calculara el SKm
![]()
El siguiente cuadro resume los cálculos a utilizar.
|
Xi |
(Xi- |
d3 |
|
60 |
-21 |
-9261 |
|
70 |
-11 |
-1331 |
|
80 |
-1 |
-1 |
|
90 |
9 |
729 |
|
104 |
24 |
13824 |
|
åXi = 405 |
ådi = 0 |
ådi = 3960 |
De acuerdo con el resultado la curva de la serie de datos es ligeramente asimétrica positiva, por lo tanto la medida de posición más recomendada para el estudio es la media aritmética. Se le recomienda al participante calcular el SK2, el mismo debe ser muy parecido al SKm.
8. – La media aritmética de dos números es igual a 60 y su desviación típica es igual a 20. Determine esos números.
Solución: Datos: X1 =?;
X2 =? ;
=
60; S = 20; n = 2
![]()
La formula de la S para datos simples es:



Se elevan al cuadrado ambos miembros de la ecuación y se elimina denominador


![]()
![]()
Despejando en (1), X1 = 120-X2 , y reemplazando en (2) se tiene
![]()
![]()
![]()

![]()
Los números buscados son 40 y 80.