COORDINACIÓN DE PREGRADOS VIRTUALES

ASIGNATURA: ESTADÍSTICA I

PROFESORA: SANDY QUINTERO

 

TRABAJO 1

 

INTEGRANTES: MIRLENA MALAVE, ALEXANDRA RAMIREZ, GABRIELA MUÑOZ, ELIANA BEROES

 

 

  1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

 

 

a)      Definición:

 

Procedimientos empleados para organizar y resumir conjuntos de observaciones en forma cuantitativa. El resumen de los puede hacerse mediante tablas, gráficos o valores numéricos. Los conjuntos de datos que contienen observaciones de más de una variable permiten estudiar la relación o asociación que existe entre ellas..

 

"La Estadística Descriptiva es la organización y resumen de datos".
 
W. W. Daniel.                                                                                                     

 

b)       Tipos de Variables:

 

Una variable no es sino el conjunto de las distintas modalidades o valores que toma un carácter.

 

ü       Variables cualitativas (o categóricas): Aquellas que no aparecen en forma numérica, sino como categorías o atributos (sexo, profesión, color de ojos). Las variables cualitativas sólo pueden ser nominales u ordinales.

ü       Variables cuantitativas: Las que pueden expresarse numéricamente (temperatura, salario, número de goles en un partido). Se pueden cuantificar los resultados experimentales por medio de instrumentos adoptando unidades de medida para valorar los diferentes resultados. Variables cuantitativas según el tipo de valores que pueda tomar pueden ser discretas o continuas.

ü       Variables discretas: Son el resultado de contar y sólo toman valores enteros

ü       Variables continuas: Son el resultado de medir, y pueden contener decimales (temperatura, peso, altura). Se pueden subdividir a voluntad. Pueden tomar, entonces, cualquier valor de un determinado intervalo.

 

                                                                                                              

c)       Clasificación de Variables:

 

Variable Independiente:

Es aquella característica o propiedad que se supone ser la causa del fenómeno estudiado. En investigación experimental se llama así, a la variable que el investigador manipula.

Variable dependiente:

Hayman (1974 : 69) la define como propiedad o característica que se trata de cambiar mediante la manipulación de la variable independiente.

La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente.

Variable interviniente:

Son aquellas características o propiedades que de una manera u otra afectan el resultado que se espera y están vinculadas con las variables independientes y dependientes.

Variable moderadora:

Según tuckman: representan un tipo especial de variable independiente, que es secundaria, y se selecciona con la finalidad de determinar si afecta la relación entre la variable independiente primaria y las variables independientes.

Variables cualitativas:

Son aquellas que se refieren a atributos o cualidades de un fenómeno. Sabino (1989 : 80) señala que sobre este tipo de variable no puede construirse una serie numérica definida.

Variable cuantitativa:

Son aquellas variables en las que características o propiedades pueden presentarse en diversos grados de intensidad, es decir, admiten una escala numérica de medición.

Variables continuas:

Son aquellas que pueden adoptar entre dos números puntos de referencias intermedio. Las calificaciones académicas (10.5, 14.6, 18.7, etc.)

Variables discretas:

Son aquellas que no admiten posiciones intermedias entre dos números. Ej., en Barinas la división de territorial la constituyen 11 municipios por no (10.5 u 11.5 municipios).

Variables de control:

Según tuckman: la define como esos factores que son controlados por el investigador para eliminar o neutralizar cualquier efecto que podrían tener de otra manera en el fenómeno observado.

 

2) Distribución de Frecuencias

a)      Concepto

Es una tabla en la que los datos se organizan en clases, es decir, en grupos de valores que describen una características de los datos mostrando el numero de observaciones del conjunto de datos que caen en cada una de las clases.

b)      Formulas

Para determinar el numero aproximado de clases, se puede hacer uso de

la Regla de Sturges:

 

K = 1 + 3,3 log n

K= numero de clases,

n= numero total de observaciones de la muestra,

log logaritmo común base 10.

 

Se debe dejar en claro que la Regla de Sturges es una aproximación del

numero de clases, siempre es posible tomar una mas o una menos de lo que

la formula nos da.

 

3) Distribución de frecuencias agrupadas.

 

a)      Concepto.

 

Son aquellas comúnmente llamadas tablas de frecuencia y se utilizan para hacer la presentación de datos provenientes de las observaciones realizadas en el  estudio establecidas en un orden mediante la división  en clase y el registro de la cantidad de observaciones correspondiente  cada clase.  Una distribución de frecuencias constituye una tabla en el ámbito de investigación.

 

 

4) Medidas de posición central.

 

a)      Concepto.

 

Los  procedimientos de representación gráfica de las distribuciones estadísticas facilitan las comparaciones que,  frecuentemente,  son el objetivo de los estudios estadísticos;  pero lo hacen en un sentido cualitativo. Por esta razón, la distribución de frecuencia de una variable, se caracteriza mediante parámetros o estadísticos que permiten obtener una descripción cuantitativa de dicha distribución. Un primer tipo de estos parámetros lo constituyen los llamados estadísticos de posición, que permiten describir cuantitativamente, de forma resumida, la posición de los valores de la variable a lo largo de su rango o recorrido. Junto con estos estadísticos o parámetros, se usan los estadísticos de dispersión,  que miden el grado de variación de los valores a través de una estimación cuantitativa de su concentración en torno a puntos determinados del rango de la variable.

 

b)      Tipos.

 

Estadísticos de Posición: La posición de una distribución se describe a través de unos estadísticos que son las llamadas medidas de “centralización”  o de “tendencia central”;  se trata de algún tipo de promedio de los valores de la variable, definido de manera que se tengan en cuenta las características de la variable así como el hecho de que los distintos valores pueden presentarse con frecuencias diferentes. Los más utilizados son la media aritmética que sólo está definida por variables cuantitativas; la mediana que puede utilizarse también para variables ordinales y la moda, que está definida para todo tipo de variables.

 

Estadísticos de Dispersión: Una mediada del grado variación de un conjunto de valores de una variable estadística la proporciona el propio rango o recorrido de la variable. Lo más frecuente sin embargo, es describir esa variación mediante las diferencias entre esos valores y alguna medida de centralización. Para las variables cuantitativas, los estadísticos de dispersión más utilizados son la desviación media y la desviación típica.

 

 

 

                                          N

Desviación Media=  Sumatoria   /Xi – Xº/

                                    i=1

                                 _________________

                                               N

En donde:

 

Xº= Media Aritmética

 

/Xi – Xº/: Valor absoluto de las desviaciones de los Xi valores respecto de la   

                media

 

Ejemplo: Hallar la desviación media de: 4,6,12,16,22

 

 

 

Xº=  4+6+12+16+22 =  Xº= 60    Xº= 12

                  5                          5

 

 

Desviación Media=    /4-12/+/6-12/+/12-12/+/16-12/+/22-12/

                                                              5

 

= /-8/+/-6/+/0/+/4/+/10/  =   28     = 5.6

5                                                      5

 

 

 

                                           N                      2

                                     Sumatoria     (Xi-Xº)

 S=  Raiz Cuadrada           i=1

                                     ____________________

                                                      N

 

 

 

 

                   N                      2

   2        Sumatoria     (Xi-Xº)

 S  =           i=1

        ____________________

                          N

 

 

 

 

V=   s

      

 

 

c)       Formulas.

 

Media Aritmética: Dado un conjunto de N números X1, X2, X3, … Xn, la media aritmética se define como el valor  Xº dado por la siguiente expresión:

 

 

Xº=   X1+ X2+ X3+…….Xn

                                                                N

 

Siendo:

                                                  n

        X1+X2+X3+…..Xn=  Sumatoria Xi

                                                   i= 1

 

Ejemplo: Dado los siguientes valores: 8, 10, 12, 5, 4, 9.  Hallar la media:

 

Xº= 8 + 10 + 12 + 5 + 4 + 9           Xº= 48     

6                                                                                    6

 

 

d)      Principales medidas.

 

Mediana: Es el valor para el cual el número de observaciones mayores que él, es igual al número de observaciones menores que él.

 

Cuando el número de observaciones es impar, la mediana queda definida como el valor correspondiente a la observación que ocupa la posición central. Por ejemplo: La mediana de los valores 4,8,7,3,1,5,9 es 5.

 

Si el número de observaciones es ar, el valor de la mediana se determina como promedio de las dos observaciones centrales, por ejemplo: Para 10,15,25,42; la mediana será:

 

15+25 =  20

2      

La Moda: Es aquel valor que se presenta con la mayor frecuencia. Puede decirse que es el valor más común. La moda puede no existir e incluso, si existe, puede no ser única. Por ejemplo: La moda de los siguientes números 7,4,8,6,2,3,9,7,8,7,1,7 es 7.

 

7) Medidas de forma: grado de concentración.

 

a)      Concepto.

 

Son las que permiten conocer que forma tienen la curva que representa la serie de datos de una muestra.

 

b)      Tipos.

 

·         Concentración: mide si los valores de la variable están más o menos uniformemente repartidos a lo largo de la muestra.

·         Asimetría: mide si la curva tiene una forma simétrica, es decir, si respecto al centro de la misma (centro de simetría) los segmentos de curva que quedan a derecha e izquierda son similares.

·          Curtosis: mide si los valores de la distribución están más o menos concentrados alrededor de los valores medios de la muestra.

·          

c)       Principales medidas. Ejemplos.

 

 

Este índice se calcula aplicando la siguiente fórmula:

IG =

 (pi - qi)

----------------------------

 pi

(i toma valores entre 1 y n-1)

En donde pi mide el pocentaje de individuos de la muestra que presentan un valor igual o inferior al de xi.

pi =

n1 + n2 + n3 + ... + ni

 

----------------------------

x 100

n

 

Mientras que qi se calcula aplicando la siguiente fórmula:

qi =

(X1*n1) + (X2*n2) + ... + (Xi*ni)

 

-----------------------------------------------------

x 100

(X1*n1) + (X2*n2) + ... + (Xn*nn)

 

El Índice Gini (IG) puede tomar valores entre 0 y 1:

IG = 0 : concentración mínima. La muestra está uniformemente repartida a lo largo de todo su rango.

IG = 1 : concentración máxima. Un sólo valor de la muestra acumula el 100% de los resultados.

 

Es un gráfico frecuentemente utilizado para representar la distribución relativa de una variable en un dominio determinado.

 

Ejemplo:

 

En el eje de abscisas se representa la población "ordenada" de forma que los percentiles de renta más baja quedan a la izquierda y los de renta más alta quedan a la derecha. El eje de ordenadas representa las rentas. 

 

En la gráfica se muestran como ejemplo la representación de dos países imaginarios, uno en azul y otro en rojo. La distribución de la renta en el país azul es más desigual que en el país rojo. En el caso del país azul, el cuarenta por ciento más pobre de la población recibe una renta inferior al veinte por ciento del total del país. En cambio, en el país rojo, el cuarenta por ciento más pobre recibe más del veinte por ciento de la renta. La línea diagonal negra muestra la situación de un país en el que todos y cada uno de los individuos obtuviese exactamente la misma renta; sería la equidad absoluta. Cuanto más próxima esté la curva de Lorenz de la diagonal, más equitativa será la distribución de la renta de ese país.

8) Medidas de forma: Coeficiente de Asimetría.

a)      Concepto.

Es el que permite conservar la información acerca tanto del signo como de la distancia de cada dato a la media

b)      Tipos. Formulas.

 

·         Coeficiente de Asimetría para datos sin agrupar

El coeficiente de asimetría se define como

Cálculo usando las frecuencias absolutas

Cálculo usando las frecuencias relativas

 

c)       Principales medidas. Curvas. Ejemplos.


El coeficiente de asimetría de Pearson:  se basa en la comparación con la media de todos los valores de la variable, así que es una medida que se basará en las diferencias , como vimos en el caso de la dispersión si medimos la media de esas desviaciones sería nulas, si las elevamos al cuadrado, serían siempre positivas por lo que tampoco servirían, por lo tanto precisamos elevar esas diferencias al cubo.

Para evitar el problema de la unidad, y hacer que sea una medida escalar y por lo tanto relativa, dividimos por el cubo de su desviación típica. Con lo que resulta la siguiente expresión:

Coeficiente de asimetría de Fisher

         Cuando al trazar una vertical, en el diagrama de barras o histograma, de una variable, según sea esta discreta o continua, por el valor de la media, esta vertical, se transforma en eje de simetría, decimos que la distribución es simétrica.

El coeficiente de asimetría más preciso es el de Fisher, que se define por:

 

9) Medidas de forma: Coeficiente de Curtosis. Concepto. Tipos de distribuciones. Formulas. Curvas. Ejemplos.

a)       Concepto: Es el que analiza el grado de concentración que presentan los valores alrededor de la zona central de la distribución.

b)       Tipos de Distribución: Se definen 3 tipos de distribuciones según su grado de curtosis:

 

ü       Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).

ü       Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable.

ü       Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable

c)       Formula: El Coeficiente de Curtosis viene definido por la siguiente fórmula:

d)      Curvas:

e)      Ejemplos:

Ejemplo: Vamos a calcular el Coefiente de Curtosis de la serie de datos referidos a la estatura de un grupo de alumnos (lección 2ª):

Variable

Frecuencias absolutas

Frecuencias relativas

(Valor)

Simple

Acumulada

Simple

Acumulada

x

x

x

x

x

1,20

1

1

3,3%

3,3%

1,21

4

5

13,3%

16,6%

1,22

4

9

13,3%

30,0%

1,23

2

11

6,6%

36,6%

1,24

1

12

3,3%

40,0%

1,25

2

14

6,6%

46,6%

1,26

3

17

10,0%

56,6%

1,27

3

20

10,0%

66,6%

1,28

4

24

13,3%

80,0%

1,29

3

27

10,0%

90,0%

1,30

3

30

10,0%

100,0%

Recordemos que la media de esta muestra es 1,253

S((xi - xm)^4)*ni

S((xi - xm)^2)*ni

x

x

0,00004967

0,03046667

 

Luego:

 

(1/30) * 0,00004967

 

 

g2 =

-------------------------------------------------

- 3

= -1,39

 

((1/30) * (0,03046667))^2

 

 

Por lo tanto, el Coeficiente de Curtosis de esta muestra es -1,39, lo que quiere decir que se trata de una distribución platicúrtica, es decir, con una reducida concentración alrededor de los valores centrales de la distribución.

10) Distribuciones Bidimensionales. Concepto. Representación de los datos. Formulas. Ejemplos.

a)      Concepto: Es una función P(xi,yj) que asigna las probabilidades a los diferentes valores conjuntos de la v.a. bidimensional (X,Y), esta representada por el conjunto de pares de valores correspondiente a cada individuo.

b)       Representación de los datos:

 

Diagramas de dispersión

Es la representación sobre unos ejes cartesianos de los distintos valores de la variable (X, Y). En el eje de abscisas representamos los valores de X y en el de ordenadas los valores de Y, de tal forma que cada par viene representado por un punto del plano X×Y.

10) Distribuciones marginales. Concepto. Tipos.  Formulas. Ejemplos.

a)       Concepto: Es cuando se tiene en cuenta solamente la variable  X  y el recuento de sus frecuencias, sin que para nada intervengan los valores de la Y

b)       Tipos: Frecuencia Absoluta marginal y Absoluta.

c)       Formulas:

d)      Ejemplo:

En base a la siguiente tabla de distribución conjunta de frecuencias de las variables X e Y, diga cuál de las siguientes afirmaciones es cierta:

       

 

Y

 

 

1

2

3

 
X

1

2

4

6

2

3

10

1

3

4

3

2

  1. La frecuencia marginal absoluta de X es {9,17,9}
  2. La frecuencia relativa de Y es {9,17,9}
  3. La media de X es igual a 1,5.
  4.  
  5. La media de Y, condicionada a X=1, es 1,76.

 

12) CONCLUSION

La Estadística descriptiva es una ciencia que analiza ciertos tipos de datos  mediante procedimientos empleados para organizar y resumir conjuntos de observaciones en forma cuantitativa.

Se puede señalar que existe una gran variedad de variables que permiten adquirir valores a cada carácter que se evalúa estas pueden ser cualitativas, cuantitativas discretas o continuas

            Para que el proceso de la estadística descriptiva sea completo es necesario que existan diferentes medidas estadísticas las cuales pretenden resumir la información de la muestra para poder tener así un mejor conocimiento de la población que se esta estudiando o investigando-  Estas son:

Las de Centralización que sirven para determinar los valores centrales o medios de la distribución, las de Dispersión; son las que dan una representatividad de las medidas centrales y las de Simetría la cual sirve para ver si la distribución tiene la misma distribución por encima y por debajo de los valores centrales.

 

13) BIBLIOGRAFIA

Trejos, Javier y Ericka Moya. Introducción a la Estadística Descriptiva.

 

Grupo Océano. “Mentor Interactivo”. Enciclopedia Temática Estudiantil. Editorial Océano. 2002. Barcelona – España. Pág. 162-164.-

 

INFOGRAFIA

http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt152.htmlhttp://www.aulafacil.com/CursoEstadistica/Lecc-7-est.htmhttp://www.eumed.net/libros/2006a/rmss/a2.htm

http://personal5.iddeo.es/ztt/Tem/t15_distribuciones_bidimensionales.htm

 

 

 

 

Hosted by www.Geocities.ws

1