![]()
COORDINACIÓN DE PREGRADOS VIRTUALES
ASIGNATURA: ESTADÍSTICA I
PROFESORA: SANDY QUINTERO
TRABAJO 1
INTEGRANTES: MIRLENA MALAVE, ALEXANDRA RAMIREZ, GABRIELA MUÑOZ, ELIANA
BEROES
a) Definición:
Procedimientos empleados para organizar y
resumir conjuntos de observaciones en forma cuantitativa. El resumen de los
puede hacerse mediante tablas, gráficos o valores numéricos. Los conjuntos de
datos que contienen observaciones de más de una variable permiten estudiar la
relación o asociación que existe entre ellas..
"La Estadística
Descriptiva es la organización y resumen de datos".
W. W. Daniel.
b)
Tipos de Variables:
Una variable no es sino el conjunto de las distintas modalidades o
valores que toma un carácter.
ü Variables cualitativas
(o categóricas): Aquellas que no aparecen en forma numérica, sino como categorías
o atributos (sexo, profesión, color de ojos). Las variables cualitativas sólo
pueden ser nominales u ordinales.
ü Variables cuantitativas: Las que pueden
expresarse numéricamente (temperatura, salario, número de goles en un partido).
Se pueden cuantificar los resultados experimentales por medio de instrumentos
adoptando unidades de medida para valorar los diferentes resultados. Variables
cuantitativas según el tipo de valores que pueda tomar pueden ser discretas o
continuas.
ü Variables discretas: Son el resultado de
contar y sólo toman valores enteros
ü Variables continuas: Son el resultado de
medir, y pueden contener decimales (temperatura, peso, altura). Se pueden
subdividir a voluntad. Pueden tomar, entonces, cualquier valor de un
determinado intervalo.
c)
Clasificación de Variables:
Variable Independiente:
Es aquella característica o propiedad que se supone ser la causa
del fenómeno estudiado. En investigación experimental se llama así, a la
variable que el investigador manipula.
Variable dependiente:
Hayman (1974 : 69) la define como propiedad o característica que se
trata de cambiar mediante la manipulación de la variable independiente.
La variable dependiente es el factor que es observado y medido
para determinar el efecto de la variable independiente.
Variable interviniente:
Son aquellas características o propiedades que de una manera u
otra afectan el resultado que se espera y están vinculadas con las variables
independientes y dependientes.
Variable moderadora:
Según tuckman: representan un tipo especial de variable
independiente, que es secundaria, y se selecciona con la finalidad de
determinar si afecta la relación entre la variable independiente primaria y las
variables independientes.
Variables cualitativas:
Son aquellas que se refieren a atributos o cualidades de un
fenómeno. Sabino (1989 : 80) señala que sobre este tipo de variable no puede
construirse una serie numérica definida.
Variable cuantitativa:
Son aquellas variables en las que características o propiedades
pueden presentarse en diversos grados de intensidad, es decir, admiten una
escala numérica de medición.
Variables continuas:
Son aquellas que pueden adoptar entre dos números puntos de
referencias intermedio. Las calificaciones académicas (10.5, 14.6, 18.7, etc.)
Variables discretas:
Son aquellas que no admiten posiciones intermedias entre dos números.
Ej., en Barinas la división de territorial la constituyen 11 municipios por no
(10.5 u 11.5 municipios).
Variables de control:
Según tuckman: la define como esos factores que son controlados
por el investigador para eliminar o neutralizar cualquier efecto que podrían
tener de otra manera en el fenómeno observado.
2) Distribución de
Frecuencias
a)
Concepto
Es una tabla en la que los datos se organizan en clases, es
decir, en grupos de valores que describen una características de los datos
mostrando el numero de observaciones del conjunto de datos que caen en cada una
de las clases.
b)
Formulas
Para determinar el
numero aproximado de clases, se puede hacer uso de
K = 1 + 3,3 log n
K= numero de clases,
n= numero total de
observaciones de la muestra,
log logaritmo común base
10.
Se debe dejar en claro
que
numero de clases, siempre es posible tomar una
mas o una menos de lo que
la formula nos da.
3)
Distribución de frecuencias agrupadas.
a) Concepto.
Son aquellas comúnmente
llamadas tablas de frecuencia y se utilizan para hacer la presentación de datos
provenientes de las observaciones realizadas en el estudio establecidas en un orden mediante la
división en clase y el registro de la
cantidad de observaciones correspondiente
cada clase. Una distribución de
frecuencias constituye una tabla en el ámbito de investigación.
4) Medidas
de posición central.
a) Concepto.
Los procedimientos de representación gráfica de
las distribuciones estadísticas facilitan las comparaciones que, frecuentemente, son el objetivo de los estudios
estadísticos; pero lo hacen en un
sentido cualitativo. Por esta razón, la distribución de frecuencia de una
variable, se caracteriza mediante parámetros o estadísticos que permiten
obtener una descripción cuantitativa de dicha distribución. Un primer tipo de
estos parámetros lo constituyen los llamados estadísticos de posición, que permiten describir cuantitativamente,
de forma resumida, la posición de los valores de la variable a lo largo de su
rango o recorrido. Junto con estos estadísticos o parámetros, se usan los estadísticos de dispersión, que miden el grado de variación de los
valores a través de una estimación cuantitativa de su concentración en torno a
puntos determinados del rango de la variable.
b) Tipos.
Estadísticos de Posición: La posición de una distribución se describe a través de unos
estadísticos que son las llamadas medidas de “centralización” o de “tendencia central”; se trata de algún tipo de promedio de los
valores de la variable, definido de manera que se tengan en cuenta las
características de la variable así como el hecho de que los distintos valores
pueden presentarse con frecuencias diferentes. Los más utilizados son la media
aritmética que sólo está definida por variables cuantitativas; la mediana que
puede utilizarse también para variables ordinales y la moda, que está definida
para todo tipo de variables.
Estadísticos de
Dispersión: Una mediada del grado
variación de un conjunto de valores de una variable estadística la proporciona
el propio rango o recorrido de la variable. Lo más frecuente sin embargo, es
describir esa variación mediante las diferencias entre esos valores y alguna
medida de centralización. Para las variables cuantitativas, los estadísticos de
dispersión más utilizados son la desviación
media y la desviación típica.
N
Desviación Media= Sumatoria
/Xi – Xº/
i=1
_________________
N
En donde:
Xº= Media Aritmética
/Xi – Xº/: Valor absoluto de las desviaciones de
los Xi valores respecto de la
media
Ejemplo: Hallar la desviación media de: 4,6,12,16,22
Xº= 4+6+12+16+22
= Xº= 60 Xº= 12
5 5
Desviación Media= /4-12/+/6-12/+/12-12/+/16-12/+/22-12/
5
= /-8/+/-6/+/0/+/4/+/10/ = 28 = 5.6
5
5
N 2
Sumatoria (Xi-Xº)
S= Raiz Cuadrada i=1
____________________
N
N 2
2
Sumatoria (Xi-Xº)
S
= i=1
____________________
N
V= s
Xº
c) Formulas.
Media Aritmética: Dado un conjunto de N números X1, X2, X3, … Xn, la media
aritmética se define como el valor Xº
dado por la siguiente expresión:
Xº= X1+ X2+ X3+…….Xn
N
Siendo:
n
X1+X2+X3+…..Xn= Sumatoria Xi
i= 1
Ejemplo: Dado los siguientes valores: 8, 10, 12,
5, 4, 9. Hallar la media:
Xº= 8 + 10 + 12 + 5 + 4 + 9 Xº= 48 Xº
6
6
d) Principales medidas.
Mediana: Es el valor para el
cual el número de observaciones mayores que él, es igual al número de
observaciones menores que él.
Cuando el número de
observaciones es impar, la mediana queda definida como el valor correspondiente
a la observación que ocupa la posición central. Por ejemplo: La mediana de los
valores 4,8,7,3,1,5,9 es 5.
Si el número de
observaciones es ar, el valor de la mediana se determina como promedio de las
dos observaciones centrales, por ejemplo: Para 10,15,25,42; la mediana será:
15+25 = 20
2
7) Medidas
de forma: grado de concentración.
a) Concepto.
Son las que permiten conocer que forma tienen la
curva que representa la serie de datos de una muestra.
b) Tipos.
·
Concentración: mide si los valores de la variable están más o
menos uniformemente repartidos a lo largo de la muestra.
·
Asimetría: mide si la curva tiene una forma simétrica, es
decir, si respecto al centro de la misma (centro de simetría) los segmentos de
curva que quedan a derecha e izquierda son similares.
·
Curtosis: mide si los valores de
la distribución están más o menos concentrados alrededor de los valores medios
de la muestra.
·
c) Principales medidas. Ejemplos.
Este índice se calcula
aplicando la siguiente fórmula:
|
IG = |
(pi - qi) |
|
---------------------------- |
|
|
pi |
|
|
(i toma valores entre
1 y n-1) |
|
En donde pi mide el
pocentaje de individuos de la muestra que presentan un valor igual o inferior
al de xi.
|
pi = |
n1 + n2 + n3 + ... + ni |
|
|
---------------------------- |
x 100 |
|
|
n |
|
Mientras que qi se
calcula aplicando la siguiente fórmula:
|
qi = |
(X1*n1) + (X2*n2) + ... + (Xi*ni) |
|
|
----------------------------------------------------- |
x 100 |
|
|
(X1*n1) + (X2*n2) + ... + (Xn*nn) |
|
El Índice Gini
(IG) puede tomar valores entre 0 y 1:
IG = 0 : concentración mínima.
La muestra está uniformemente repartida a lo largo de todo su rango.
IG = 1 : concentración máxima.
Un sólo valor de la muestra acumula el 100% de los resultados.
Es un gráfico frecuentemente utilizado para
representar la distribución relativa de una variable en un dominio determinado.
Ejemplo:
En el eje de abscisas se
representa la población "ordenada" de forma que los percentiles de
renta más baja quedan a la izquierda y los de renta más alta quedan a la
derecha. El eje de ordenadas representa las rentas.
En la gráfica se muestran como ejemplo la
representación de dos países imaginarios, uno en azul y otro en rojo. La
distribución de la renta en el país azul es más desigual que en el país rojo. En
el caso del país azul, el cuarenta por ciento más pobre de la población recibe
una renta inferior al veinte por ciento del total del país. En cambio, en el
país rojo, el cuarenta por ciento más pobre recibe más del veinte por ciento de
la renta. La línea diagonal negra muestra la situación de un país en el que
todos y cada uno de los individuos obtuviese exactamente la misma renta; sería
la equidad absoluta. Cuanto más próxima esté la curva de Lorenz de la diagonal,
más equitativa será la distribución de la renta de ese país.
8) Medidas de forma:
Coeficiente de Asimetría.
a)
Concepto.
Es el que permite conservar la información
acerca tanto del signo como de la distancia de cada dato a la media
b) Tipos. Formulas.
·
Coeficiente de Asimetría
para datos sin agrupar
El
coeficiente de asimetría se define como

Cálculo usando las
frecuencias absolutas

Cálculo usando las
frecuencias relativas

c)
Principales medidas.
Curvas. Ejemplos.
El coeficiente de asimetría de Pearson: se basa en la comparación con la media de todos los valores de la
variable, así que es una medida que se basará en las diferencias
, como
vimos en el caso de la dispersión si medimos la media de esas desviaciones
sería nulas, si las elevamos al cuadrado, serían siempre positivas por lo que
tampoco servirían, por lo tanto precisamos elevar esas diferencias al cubo.
Para
evitar el problema de la unidad, y hacer que sea una medida escalar y por lo
tanto relativa, dividimos por el cubo de su desviación típica. Con lo que
resulta la siguiente expresión:

Coeficiente
de asimetría de Fisher
Cuando al trazar una vertical, en el diagrama de barras o histograma, de una
variable, según sea esta discreta o continua, por el valor de la media, esta
vertical, se transforma en eje de simetría, decimos que la distribución es
simétrica.
El
coeficiente de asimetría más preciso es el de Fisher, que se define por:
|
|

9) Medidas de forma:
Coeficiente de Curtosis. Concepto. Tipos de distribuciones. Formulas. Curvas.
Ejemplos.
a) Concepto: Es el que analiza el
grado de concentración que presentan los valores alrededor de la zona central
de la distribución.
b) Tipos de Distribución: Se
definen 3 tipos de distribuciones según su grado de curtosis:
ü
Distribución mesocúrtica: presenta un grado de concentración medio
alrededor de los valores centrales de la variable (el mismo que presenta una
distribución normal).
ü
Distribución leptocúrtica: presenta un elevado grado de
concentración alrededor de los valores centrales de la variable.
ü
Distribución platicúrtica: presenta un reducido grado de
concentración alrededor de los valores centrales de la variable
c) Formula: El Coeficiente de
Curtosis viene definido por la siguiente fórmula:

d)
Curvas:



e)
Ejemplos:
Ejemplo: Vamos a calcular el
Coefiente de Curtosis de la serie de datos referidos a la estatura de un grupo
de alumnos (lección 2ª):
|
Variable |
Frecuencias absolutas |
Frecuencias relativas |
||
|
(Valor) |
Simple |
Acumulada |
Simple |
Acumulada |
|
x |
x |
x |
x |
x |
|
1,20 |
1 |
1 |
3,3% |
3,3% |
|
1,21 |
4 |
5 |
13,3% |
16,6% |
|
1,22 |
4 |
9 |
13,3% |
30,0% |
|
1,23 |
2 |
11 |
6,6% |
36,6% |
|
1,24 |
1 |
12 |
3,3% |
40,0% |
|
1,25 |
2 |
14 |
6,6% |
46,6% |
|
1,26 |
3 |
17 |
10,0% |
56,6% |
|
1,27 |
3 |
20 |
10,0% |
66,6% |
|
1,28 |
4 |
24 |
13,3% |
80,0% |
|
1,29 |
3 |
27 |
10,0% |
90,0% |
|
1,30 |
3 |
30 |
10,0% |
100,0% |
Recordemos que la media
de esta muestra es 1,253
|
S((xi - xm)^4)*ni |
S((xi - xm)^2)*ni |
|
x |
x |
|
0,00004967 |
0,03046667 |
Luego:
|
|
(1/30) * 0,00004967 |
|
|
|
g2 = |
------------------------------------------------- |
- 3 |
= -1,39 |
|
|
((1/30) * (0,03046667))^2 |
|
|
Por lo tanto, el Coeficiente
de Curtosis de esta muestra es -1,39, lo que quiere decir que se trata de
una distribución platicúrtica, es decir, con una reducida concentración
alrededor de los valores centrales de la distribución.
10) Distribuciones
Bidimensionales. Concepto. Representación de los datos. Formulas. Ejemplos.
a)
Concepto: Es una función P(xi,yj)
que asigna las probabilidades a los diferentes valores conjuntos de la v.a.
bidimensional (X,Y), esta representada por el conjunto de pares de valores
correspondiente a cada individuo.
b)
Representación de los
datos:
Diagramas de dispersión
Es
la representación sobre unos ejes cartesianos de los distintos valores de la
variable (X, Y). En el eje de abscisas representamos los valores de X y en el
de ordenadas los valores de Y, de tal forma que cada par viene representado por
un punto del plano X×Y.

10) Distribuciones marginales. Concepto.
Tipos. Formulas. Ejemplos.
a)
Concepto: Es cuando se tiene en cuenta solamente
la variable X y el recuento de sus frecuencias, sin que para nada
intervengan los valores de
b)
Tipos: Frecuencia Absoluta marginal y Absoluta.
c)
Formulas:

d)
Ejemplo:
En
base a la siguiente tabla de distribución conjunta de frecuencias de las
variables X e Y, diga cuál de las siguientes afirmaciones es
cierta:
|
|
Y |
|||
|
|
|
1 |
2 |
3 |
|
|
1 |
2 |
4 |
6 |
|
2 |
3 |
10 |
1 |
|
|
3 |
4 |
3 |
2 |
|
12)
CONCLUSION
Se puede señalar que existe una gran
variedad de variables que permiten adquirir valores a cada carácter que se
evalúa estas pueden ser cualitativas, cuantitativas discretas o continuas
Para que el
proceso de la estadística descriptiva sea completo es necesario que existan diferentes
medidas estadísticas las cuales pretenden resumir la información de la muestra
para poder tener así un mejor conocimiento de la población que se esta estudiando
o investigando- Estas son:
Las de Centralización que sirven para
determinar los valores centrales o medios de la distribución, las de
Dispersión; son las que dan una representatividad de las medidas centrales y
las de Simetría la cual sirve para ver si la distribución tiene la misma
distribución por encima y por debajo de los valores centrales.
13)
BIBLIOGRAFIA
Trejos, Javier y Ericka Moya. Introducción a la Estadística
Descriptiva.
Grupo Océano. “Mentor Interactivo”. Enciclopedia
Temática Estudiantil. Editorial Océano. 2002. Barcelona – España. Pág.
162-164.-
INFOGRAFIA
http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt152.htmlhttp://www.aulafacil.com/CursoEstadistica/Lecc-7-est.htmhttp://www.eumed.net/libros/2006a/rmss/a2.htm
http://personal5.iddeo.es/ztt/Tem/t15_distribuciones_bidimensionales.htm