Para volver al menú principal pulse sobre la palabra |
Esquema:
Introducción
1. Diagrama diferencial
2. Curva de distribución
3. Mediana
4. Media.
5. Varianza
Sea P una población formada por subpoblaciones P1, P2,… , Pm de efectivos n1, n2, …, nm. Siendo:
Sean x1, x2, …, xk los diferentes valores de la variable X, que supondremos discreta para simplificar, observados en las distintas subpoblaciones.
Sea nih el número de individuos en la población Ph que presenta el valor xi de la variable X. En la población P, la frecuencia absoluta correspondiente al valor xi es:
Como la frecuencia absoluta ni se obtiene sumando las nih, la frecuencia relativa fi se obtiene:
Designando por ph = nh/n las proporciones que definen la composición de la población, se obtiene:
En palabras, las frecuencias relativas de la composición son iguales a las medias ponderadas de las frecuencias en las subpoblaciones por las proporciones de la composición.
Sean F1(x), F2(x), …, Fm(x) las funciones de distribución de la variable x relativas a cada una de las subpoblaciones y F(x) la función de distribución relativa a la composición P.
El número de individuos n.F(x) cuyo carácter es inferior a x es igual a la suma de los correspondientes a cada una de las subpoblaciones.
de donde:
Supongamos ordenadas a las poblaciones por el índice h de manera que :
La mediana de la población P es la raíz de la ecuación:
Demostraremos que la mediana está comprendida entre los valores extremos M1 y Mm.
En efecto:
Como Fh son no decrecientes se tiene:
Por consiguiente:
Luego F (M1) ≤ F(M) y como F es no decreciente se deduce que M1 ≤ M.
Análogamente M ≤ Mm. En efecto, como Mm ≥ Mh para h=1, 2, … , m-1 se sigue que:
de donde
Como F es no decreciente, se sigue que Mm ≥ M.
Las medias de las subpoblaciones tienen de expresión:
y la media de la composición
De ahí que la relación entre ambas medias sea:
De donde se obtiene que: la media relativa a la composición es igual a la media de las medias subpoblacionales, ponderadas por las proporciones de la composición.
Las varianzas σh2 de las subpoblaciones Ph tienen por expresión:
Luego:
El término central de este último miembro es
Queda pues,
La varianza en la composición P es:
Como
se tiene:
Así la varianza de la composición es igual a la media de las varianzas más la varianza de las medias.
Un concepto que juega un papel importante en el estudio de la correlación es el siguiente:
Se llama fracción de la varianza total debido a la heterogeneidad de las medias entre subpoblaciones a la razón:
Razón comprendida entre 0 y 1. Vale 0 si todas las subpoblaciones tienen la misma media y vale 1 si las subpoblaciones son homogéneas.