Curso de R:

Capítulo 3: Medidas de estadística descriptiva.

Comenzamos a trabajar con medidas estadísticas, de momento pondré las medidas clásicas y posteriormente añadiré diversas funciones para que  podamos trabajar con métodos robustos, estas medidas robustas las tendremos que programar nosotros (en este caso yo) así que su fiabilidad puede dejar algo que desear pero si alguien se atreve a programar conmigo.. . De todas formas recomendaros el curso de la UNED de Experto Universitario en Estadística Aplicada. Aun así espero poner a vuestra disposición mis pequeños conocimientos sobre el tema y también explicaros como añadir módulos a vuestro programa R aunque de nuevo si vais a la página web del proyecto R y os entretenéis en leer un ratito no creo que os cueste mucho.

Pues bien, aquí tenéis las funciones estadísticas más comunes con R:

Medidas de dispersión
Frecuencias acumuladas > cumsum(datos)
Media aritmética > mean (datos)
Mediana > median(datos)
Cuantiles

> cuantile(datos) #obtenemos los cinco cuantiles

> cuantile(datos,prob=p) #obtenemos un cuantil concreto

El símbolo # no tiene ninguna función estética, es la forma de poner comentarios mediante R. por otro lado si quisiéramos las medidas de posición más comunes emplearíamos el comando summary(datos) y tendríamos recogidos las medidas anteriores.

Medidas de dispersión
Cuasivarianza > var(datos)

Como medida de dispersión R nos ofrece la cuasivarianza, si queremos obtener la varianza o la desviación típica tenemos que transformar lo que podemos obtener con R a nuestro antojo. A partir de este momento vamos a programar nuestras propias funciones.

La varianza como me imagino que sabreis es [(n-1)/n]*cuasivarianza y la desviación típica es su raiz cuadrada; en R es del siguiente modo:

Varianza > ((length(datos)-1)/length(datos))*var(datos)

De nuevo tenemos nuevas funciones. La función length sirve para conocer el tamaño de un vector, para conocer el número de observaciones n. Pues si cada vez que queramos determinar la varianza tenemos que hacer esto lo llevamos claro. Soy un poco exagerado, tampoco hay que escribir tanto, pero es una ocasión estupenda para que podais empezar a programar en R:

> varianza<-function(x) { ((length(x)-1)/length(x))*var(x) } Editamos la función varianza
varianza(datos) Comprobamos su funcionamiento

Veamos más en profundidad como se editan funciones en R. Asignamos a un objeto varianza el valor de una función que recibe un único parámetro x esa función viene editada entre llaves { }. Para comprobar como funciona basta con ejecutarla como otra función cualquiera.

Ahora bien si queremos conservar la función editada al cerrar nuestra sesión de R nos aparecerá un mensaje qestion que nos pregunta si queremos guardar la imagen (Save workspace image?) nosotros decimos que si y la aplicación nos guarda todo lo que hemos hecho hasta el momento en la presente sesión de R. ¿Por qué no os lo comenté antes? Pues simplemente porque se me ha olvidado... Tendré que dedicarme en algún otro capítulo al manejo de archivos y a la lectura de datos, pero es que eso me aburre un montón.

Volver a la página principal

Menú del curso

Capítulo 4: Trabajo con datos I.

 

1