EstadisticaComputarizada2405.html (Capítulo 2)

 

EL PROGRAMA INFORMATICO   SPSS 13 Y  EL ANALISIS ESTADISTICO

 

OBJETIVO: Aplicar los principios basicos del programa computacional  de Estadistica SPSS 13.0 en la resolucion de problemas relacionados con la Estadistica Descriptiva.

CONTENIDO: Definicion de SPSS. Caracteristicas del SPSS. Instalar el programa SPSS. Estructura del SPSS. Archivos de datos del SPSS. Editor de Datos del SPSS. Transformar datos mediante el SPSS. Modificar Archivos de datos en el SPSS.El Visor del SPSS. Archivos de sintesis del SPSS. Analisis Estadistico con el SPSS. Aplicacion  del SPSS en estadistica descriptiva. Solucion de problemas estadisticas con el SPSS.

 

CURSO DE SPSS  (2006)

 

(MATERIAL TOMADO DE LA RED)

http://www.mailxmail.com/curso-software-analisis-estadistico/introduccion

 

El principal objetivo de este curso es capacitar al participante, en el manejo del paquete estadístico SPSS, inculcado los conceptos y forjando los conocimientos necesarios para que pueda realizar diversos análisis descriptivos de datos, empleando gráficos, tablas o estadísticos y que a su vez esté en capacidad de interpretar los resultados extrayendo sus respectivas conclusiones.

Dentro de los objetivos secundarios encontramos:

·                     Conocer las principales ventanas del programa detallando cada uno de los elementos que las componen, así como sus aplicaciones.

·                     Aprender a utilizar los diversos sistemas de ayuda con que cuenta el programa, evidenciando sus fortalezas y debilidades, así como las aplicaciones que se pueden realizar con ellos.

·                     Reconocer los métodos para la importación de datos con que cuenta SPSS, definiendo las diferentes fuentes compatibles con el programa, así como los requerimientos necesarios para realizarla.

·                     Examinar cada uno de los procedimientos con los que cuenta SPSS, para transformar los datos e incluso para crear nueva información a partir de la existente.

·                     Conocer las principales medidas de la estadística descriptiva, haciendo énfasis en los procedimientos de SPSS que nos permiten calcularlas.

·                     Identificar los métodos empleados para la captura y procesamiento de las variables de respuesta múltiple, abordando los procedimientos empleados en el análisis descriptivo.

·                     Reconocer cada uno de los diferentes tipos de gráficos con que cuenta SPSS, exhibiendo la forma de crearlos, modificarlos y/o personalizarlos.

·                     Aprender los procedimientos con que cuenta SPSS para generar tablas personalizadas, evidenciando las diferentes aplicaciones que se pueden realizar con ellos.

 

LECCIÓN 1 - INTRODUCCIÓN

SPSS es un poderoso paquete para el análisis estadístico y la gestión de datos, fue diseñado en un principio para las ciencias sociales en la década de los 70’s. Con el pasar del tiempo se observo que su aplicación se extendía a la mayoría de las ramas de la ciencia que utilizan la estadística para el análisis de datos y se fueron agregando nuevos módulos para pruebas estadísticas especializadas.

El objetivo de este curso es hacer una pequeña introducción al paquete, para que usted se haga una impresión de los diferentes componentes del programa y la forma de emplearlos en el análisis descriptivo de datos.

INICIAR EL PROGRAMA  SPSS 13

Para conectarse al SPSS 13 existen  dos opciones, la primera es mediante el acceso directo, si lo hay (Ver Figura I),

Figura I

y la segunda es utilizando  el  recorrido Inicio...... Programas..... SPSS para windows..... SPSS 13.0 en español. Al ejecutar el programa por cualquiera de las dos formas se abre automáticamente el asistente de inicio (ver Figura 1.0), donde se  nos plantea la interrogante ¿Qué desea hacer?, lo cual   comprende 6 alternativas:

Figura 1.0

* Ejecutar el tutoríal.

* Introducir datos.

* Ejecutar una consulta creada anteriormente.

* Crear una nueva consulta mediante el asistente de base de datos.

* Abrir una fuente de datos existente. En la parte inferior de  de esas opciones se observar una ventana que muestra  aquellos archivos de datos que han sido usados por el SPSS, si es la primera vez que se inicia desde su instalación expondrá la opción de Más archivos, la cual al ser elegida abre una ventana de exploración para la ubicación de archivos en formato (*.sav); en otras palabras, archivos correspondientes  a  datos del  SPSS 13.

* Abrir otro tipo de archivo. Debajo de esta alternativa  se puede observar  una casilla con el registro de los diferentes archivos que se  han utilizado, tales como archivos de texto, bases de datos, hojas de cálculo, archivos de sintaxis, archivos de resultados, etc. Sin embargo, si es  la primera vez que se inicia desde su instalación mostrará la alternativa: Más archivos, la que al seleccionarse abre una ventana de exploración para la localización  de archivos en cualquier formato.

LECCIÓN 2 - TIPOS DE ARCHIVOS

Antes de continuar es necesario aclarar los tipos de archivos que genera SPSS, los cuales son:

1.                  Archivos de Datos: son los archivos generados por el sistema (SPSS), en los cuales se contiene la información (casos y variables). Este tipo de archivos se generan con la extensión *.sav y son propios del paquete.

2.                  Archivos de resultados: son los archivos generados por el sistema, en los cuales se plasman todos los resultados de los procesos que se han realizado con el paquete, tales como gráficos, tablas o estadísticos. Este tipo de archivos se identifican con la extensión *.spo y son propios del paquete.

3.                  Archivos de sintaxis: son los archivos generados por el sistema, en los cuales se puede acceder a los diferentes procesos del paquete mediante la utilización de palabras clave o líneas de código. Este tipo de archivos se identifican con la extensión *.sps y son propios del paquete.

Una vez aclarado este concepto, procederemos a seleccionar la opción Abrir una fuente de datos existente en el asistente de inicio, y hacemos clic en Aceptar. Inmediatamente se abre una ventana de exploración o navegación (Figura 2) con la cual podemos ubicar de forma fácil un archivo dentro de nuestro PC o dentro de la red.

Para nuestro caso, vamos a ubicar el archivo Cap1.sav, el cual debes descargar con antelación. Para efectos del curso vamos a suponer que ya descargaste los respectivos archivos adjuntos y que se encuentran en la carpeta mis documentos de su ordenador. Después de aclarar este punto, continuamos para lo que empleamos la ventana de navegación para ubicar el archivo en C:\Mis documentos\Cap1.sav; una vez ubicado hacemos clic en Aceptar.

Editor de datos de spss

Una vez que hemos abierto el archivo podemos observar que los datos son representados en el Editor de datos del SPSS (Figura 3), antes de continuar haremos una pequeña descripción de esta ventana, ya que es la principal del programa por lo que es necesario conocer su contenido.

LECCIÓN 3 - PARTES EDITOR DE DATOS DE SPSS

El editor de datos de SPSS es la ventana principal del paquete; en ella encontramos las herramientas fundamentales del programa, además esta ventana es la única que nos permite observar la información (Datos y Variables), en su forma original (desagrupada), para tener una idea más clara debemos conocer algunos conceptos fundamentales. Antes de conocer las partes del editor de datos es necesario conocer como está diseñada la estructura de los datos en SPSS.    

 

Variable 1

Variable 2

Caso 1

Observaciones

Observaciones

Caso 2

Observaciones

Observaciones

 

Tabla 1. Estructura del Editor de datos

Al observar la tabla 1, notaremos que las columnas representan las variables o preguntas y las filas contienen las observaciones, mediciones o respuestas de dichas preguntas. Cada caso contiene las respuestas de un individuo a la totalidad de las preguntas o variables.

Partes de la ventana

El editor de datos se divide en 5 partes:

1. Barra de menús:

Como cualquier programa basado en ambiente Windows, el editor de datos del SPSS posee una barra de menús desplegables, dentro de los cuales podemos encontrar diferentes aplicaciones, procedimientos o procesos. En SPSS se cuenta con diez diferentes menús desplegables como los son (Archivo, Edición, Ver, Datos, Transformar, Analizar, Gráficos, Utilidades, Ventana y Ayuda). Algunos de estos menús serán explorados a lo largo del curso.

2. Barra de herramientas:

En esta barra se encuentran los procedimientos mas comúnmente utilizados en el programa, aunque se puede personalizar el contenido de esta barra mediante la opción menú Ver... Barra de herramientas (Figura 4) al hacer clic nos abre un nuevo cuadro de diálogo llamado mostrar barra de herramientas (Figura 5) en el cual encontraremos la opción personalizar en la parte inferior derecha; al hacer clic en ella, se abre un nuevo cuadro llamado Personalizar barra de herramientas (Figura 6) en donde aparecen cada uno de los procesos, procedimientos o elementos que posee el programa. Por el momento no entraremos en detalle de esta acción.

Ver barra de herramientas

Mostrar barra de herramientasPersonalizar barra de herramientas

LECCIÓN 4 - BARRA DE HERRAMIENTAS

Por defecto la barra posee las funciones:

Abrir ArchivoAbrir archivo Guardar archivoGuardar archivo   ImprimirImprimir


Como podemos observar estos tres iconos son comunes en casi todos los programas de Windows, por lo cual no entraremos en detalle de ellos.

Recuperar cuadro de diálogo Recuperar cuadro de diálogo

Este icono nos permite acceder de forma rápida a los últimos procedimientos que hayamos efectuado en SPSS; es decir, nos muestra los diferentes cuadros de diálogo (ventanas) que hayamos ejecutado (entrado) con anterioridad como frecuencias, gráficos, tablas, etc. Lo que hace es abrir nuevamente el procedimiento seleccionado.

Deshacer Deshacer Rehacer Rehacer

Este par de iconos también son comunes en la mayoría de los programas de Windows, con la diferencia que solo nos permite deshacer o rehacer la última acción y solamente una. Se activan después de realizar alguna operación en el paquete.

Ir a Gráfico Ir a gráfico

Este icono nos permite ir rápidamente al último gráfico realizado cambiando a la ventana de resultados y mostrando el gráfico.

Ir a Caso Ir a caso

Como su nombre lo indica nos permite ir a un caso específico, es decir, ir a la posición donde se ubica dicho caso dentro del archivo de datos que se encuentre abierto.

Variables  Variables

Cuando seleccionamos este icono se abre un nuevo cuadro de diálogo (Figura 7), en donde aparece toda la información de cada una de las variables (el nombre, la etiqueta, si hay o no valores perdidos, el nivel de medida, los valores y las etiquetas de cada valor).

Cuadro de diálogo VARIABLES

La forma de utilizarlo es haciendo clic sobre la variable que deseemos en la lista, de manera que la ventana se actualiza y nos enseña la información de la variable seleccionada.

Buscar  Buscar

Este icono nos permite ubicar un valor dentro de una variable, es decir, nos permite encontrar un número o una combinación de caracteres dentro de los registros. Dado que generalmente se utilizan números para representar una categoría (hombre = 0 y mujer =1), y a su vez, las bases de datos poseen múltiples variables, sería ilógico esperar que la búsqueda se realice en todo el archivo, es por este motivo que al activar el icono aparece en la parte superior del cuadro de diálogo (Figura 8) la frase “Buscar datos en la variable *****” (**** = nombre de la variable). La forma de seleccionar una variable es hacer clic sobre ella en el editor de datos, con lo cual el nombre de la variable en la frase cambiará por el de la variable seleccionada.

Buscar datos - Cuadro de diálogo

Podemos observar en el cuadro de diálogo Buscar, una pequeña casilla en la parte inferior izquierda la cual nos da la posibilidad de pedirle que la búsqueda sea lo más exacta posible; esta opción sólo se utiliza en variables alfanuméricas. Por último tenemos el botón Buscar siguiente quien nos permite pasar de un caso o registro encontrado al siguiente.

LECCIÓN 5 - BARRA DE HERRAMIENTAS (PARTE II)

Insertar caso Insertar caso

Como su nombre lo indica nos permite ingresar un nuevo caso; es decir, las respuestas de un nuevo individuo. Hago énfasis en las respuestas ya que generalmente se trabaja con encuestas pero también pueden ser observaciones o mediciones si trata de un experimento.

Insertar Variable Insertar variable

Nos permite ingresar una nueva variable o pregunta, no necesariamente tiene que ser respondida por todos los individuos; sin embargo, se recomienda que las variables que se empleen en el archivo cuenten con la mayor cantidad de respuestas ya que es posible que al sacar conclusiones de la información se infiera en la totalidad de la población y solo un fragmente haya respondido la pregunta, lo que causa una mala interpretación de los datos.

Segmentar Archivo Segmentar archivo

Este icono nos permite dividir nuestra base de datos en distintos grupos de acuerdo a la variable que utilicemos para la segmentación; al hacer clic sobre el icono se abre un nuevo cuadro de diálogo (Figura 9), en el que aparecen tres posibilidades.

Segmentar archivo - Cuadro de diálogo

·                     Analizar todos los casos, no crear los grupos: esta opción nos permite trabajar con todos los casos de la base y sacar resultados (Estadísticos), con todos los casos u observaciones.

·                     Comparar los grupos: esta opción nos permite comparar los resultados de cada uno de los grupos, de la variable seleccionada.

·                     Organizar los resultados por grupos: esta opción nos permite ver de forma organizada los resultados (gráficos, tablas, estadísticos) por cada uno de los grupos. Esta opción es bastante útil si nosotros deseamos hacer un análisis separado de la muestra por algún tipo de “rangos”, como por ejemplo el género, la región o la fecha etc.

La forma de utilizar la segmentación es seleccionar una de las dos últimas opciones e ingresar la variable o las variables que deseamos utilizar como rango y luego darle Aceptar, después de esto cada procedimiento (tablas, gráficos o estadísticos) que le pidamos al programa no lo mostrara de acuerdo a la segmentación. En capítulos posteriores lo utilizaremos para notar su operación.

Ponderar datosPonderar
Ponderar es dar un peso o valor diferente a cada uno de los casos; es decir, darle mayor importancia a unos valores que a otros, esto se hace con el fin de poder sacar algún resultado representativo de la población y no de la muestra, profundizaremos más acerca de este tema en los capítulos posteriores.

Seleccionar casos Seleccionar casos

Esta opción selecciona sólo aquellos casos que cumplan una condición especificada por el investigador; adicionalmente el programa también nos permite tomar un fragmento de los casos ya sea de forma arbitraria o no de acuerdo a los criterios que necesitemos.

LECCIÓN 6 - OTRAS PARTES DEL EDITOR

Etiquetas de valor Etiquetas de valor


Esta opción nos permite observar los valores de los datos o la categoría a la que corresponde; es decir, cuando está activada vemos en el editor de datos las palabras de cada uno de los rangos de las variables (Figura 10) y por el contrario cuando está desactivada vemos los números que les corresponde dentro de cada variable (Figura 11). Es útil para hacerse una idea de las categorías a la que corresponde cada valor dentro de una variable.

Vista de etiquetas

Vista de valores

Usar conjuntos Usar conjuntos

Este icono nos permite generar o utilizar conjuntos de variables, es útil cuando trabajamos con preguntas de respuesta múltiple o tenemos variables que podemos agrupar para hacer un análisis específico.

3. Barra de posición:

La barra de posición la encontramos ubicada debajo de la barra de herramientas, esta barra al igual que en Excel, nos indica la fila (caso), la columna (variable) y el valor que corresponde a la posición seleccionada. Esta barra es un parámetro netamente informativo.

Barra de posición

4. Vistas del editor de datos:

El editor de datos cuenta con dos vistas, la primera es la vista de datos (Figura 13), en la cual podemos visualizar cada uno de los datos (variables y casos); debemos recordar que los casos se representan en las filas y las variables en las columnas. Está es la visión por defecto del programa.

Vista de datos

Al igual que en una hoja de calculo SPSS cuenta con un área de trabajo; es decir, un espacio determinado en el cual podemos ingresar nuestras variables y casos, esta área es de 33.000 variables y 2’000.000 de casos, lo cual nos garantiza que podremos manejar cualquier base de datos, hay que notar que para aquellos que tienen la versión estudiantil el número de casos se reduce a 1500.

LECCIÓN 7 - VISTA DE VARIABLES

Vista de variables

La segunda vista que posee el editor de datos es la vista de variables, y es sin ninguna duda la parte más importante del paquete, de la correcta definición de nuestras variables depende la efectividad de nuestro análisis. La forma de seleccionar esta vista es sencillamente hacer clic sobre la pestaña vista de variables que aparece en la parte inferior izquierda de la ventana; una vez hecho esto podremos ver que la forma en el editor de datos  cambia (Figura 14).

Vista de variables

Al observar la parte superior del área de trabajo, notaremos que la estructura ha cambiado, vemos que en la fila principal tenemos diferentes propiedades que ya vienen establecidas en el paquete, estas propiedades son:

Casillas de la vista de variables

Cada una de ellas tiene un propósito específico y es necesario antes de generar algún tipo de análisis, comprobar que estén correctamente diligenciados cada uno de los campos. También podemos notar que ahora las filas corresponden a cada una de las variables de nuestra base o archivo. Por lo tanto la estructura de la vista de variables es:

 

Propiedades

Propiedades

Variable1

Definición

Definición

Variable2

Definición

Definición

Tabla 2 Estructura Vista de Variables

Es importante hacer notar que en esta vista existe una gran diferencia con la vista de datos (Figura 15), esto es debido que en la vista de variables vamos a definir las características de las variables, es decir, sus propiedades y no vamos a modificar los datos, lo único que realizamos en esta sección es ingresar información adicional de las variables la cual será utilizada en por el programa en el análisis.

Comparación de las estructuras de las vistas

Una vez aclaradas las diferencias estructurales de las vistas, podemos continuar. Ahora conoceremos cada una de las propiedades de las variables las cuales son:

1. Nombre

El nombre de la variable es la forma de identificarla, cada variable debe tener un nombre único y sus características son:

·                     Su longitud no puede superar los ocho (8) caracteres en las versiones hasta la 11.5 y 64 caracteres en la versión 12. Puede ser alfanumérica es decir letras y números.

·                     El primer carácter debe ser siempre una letra.

·                     No se puede utilizar palabras clave (reservadas) como AND, OR y NOT.

·                     No se pueden utilizar caracteres específicos (+, -, *, /, !, ”, #o espacios en blanco).

Generalmente 8 caracteres no son suficientes para identificar una variable, por lo que es recomendable utilizar las tres primeras letras de cada palabra de la frase,

Estado Civil = estciv

Nivel de confianza = nivdecon

No necesariamente se debe seguir esta forma, lo realmente importante es que el nombre de la variable le permita identificar a que se hace referencia fácilmente.

LECCIÓN 8 - VISTA DE VARIABLES (PARTE II)

2. Tipo

El tipo de la variable especifica la forma de los datos de que contiene; es decir, identifica el tipo de caracteres que encontraremos en los registros. Es aconsejable trabajar las variables de forma numérica ya que el análisis estadístico es una ciencia matemática y para su correcto funcionamiento es necesario realizar las operaciones con números. En algunos casos no es posible tener los datos de forma numérica para estos casos el paquete nos permite trabajarlos como una cadena de caracteres.

La forma de activarlo es haciendo clic en la casilla tipo correspondiente a la variable que estamos editando, con lo cual la activaremos, en ese momento podemos ver un pequeño cuadrado con unos puntos suspensivos, haciendo clic en el cuadro activaremos el cuadro de diálogo tipo de variable (Figura 16). Los tipos que maneja SPSS son:

Tipo de variable

·                     Numérico: una variable numérica cuyos valores son números y se muestran de forma estándar, es decir, asume la notación por defecto de Windows para la separación decimal (Enteros (,) Decimales) “1000,00”; es el tipo mas usado.

·                     Coma: una variable numérica cuyos valores se muestran con comas que delimitan cada tres posiciones y con el punto como delimitador decimal “1,000.00”.

·                     Punto: una variable numérica cuyos valores se muestran con puntos que delimitan cada tres posiciones y con la coma como delimitador decimal “1.000,00”.

·                     Notación científica: una variable numérica cuyos valores son demasiado grandes o pequeños por lo cual se utiliza un exponente con signo que representa una potencia en base diez.

·                    
1’000.000.00 = 1.0E+6 ó 0.000001 = 1.0E-6

·                    
SPSS nos permite representarlo de varias formas como 1000000, 1.0E6, 1.0D6, 1.0E+6,

·                     1.0+6. La notación es útil cuando manejamos cifras extremas de lo contrario es mejor manejarlo de forma numérica.

·                     Fecha: una variable numérica cuyos valores representan uno de los diferentes formatos de fecha-calendario u hora-reloj (Figura 17). Se puede introducir la fecha utilizando como delimitadores barras, guiones, puntos, comas, o espacios.

Tipo fecha

Al observar el cuadro de diálogo, notaremos que en la parte derecha de la ventana aparece un listado donde podemos seleccionar el formato de fecha que nos sea más útil o el que mejor se acomode a nuestros datos.

LECCIÓN 9 - VISTA DE VARIABLES (PARTE III)

·                     Dólar: una variable numérica cuyos valores representan sumas de dinero en dólares (Figura 18), al seleccionarla se actualiza el listado, en donde debemos seleccionar uno de los formatos preestablecidos.

Tipo Dólar

·                     Moneda personalizada: una variable numérica cuyos valores representan sumas de dinero, al seleccionarla se actualiza la ventana y el listado nos presenta las cinco opciones que tenemos para elegir (Figura 19).

Tipo Moneda personalizada

La diferencia con el tipo dólar es que nos permite trabajar con 5 tipos de moneda diferentes; al seleccionar alguno, el programa desconocerá el origen de la moneda y solo tendrá en cuenta que es un tipo de moneda diferente al dólar.

·                     Cadena: variable cuyos valores no son numéricos y por ello, no se utilizan en los cálculos. Pueden contener cualquier tipo de caracteres siempre que no exceda la longitud máxima de 255; las mayúsculas y las minúsculas se consideran diferentes ya que trabaja bajo el código ASCII. También se conoce como variable alfanumérica.

3. Anchura

Determina el máximo de dígitos que podemos esperar en una variable, este ancho incluye los dígitos enteros y los decimales, por ejemplo:

Anchura 5 = xxx.xx ó x,xxx.x ó xx,xxx donde x representa un número aleatorio.

No debemos cometer el error de pensar que una vez establecida la anchura ya no podremos encontrar una cifra con mayor cantidad de números; ya que esta opción es para darle una idea al investigador de las cifras que encontrará cuando le pida al paquete información de las variables; es decir, no restringe la cantidad de números sino que es un parámetro informativo, el cual le brinda a la persona que opere el programa una idea de los rangos máximos que puede tomar esta variable, pero no impide sobrepasarlo.

4. Decimales

Determina el máximo de dígitos decimales que tendremos, las cifras que superen su longitud serán aproximadas hacia arriba, si superan el valor 5 de lo contrario serán aproximadas hacia abajo, es decir:
1.07X   si X <= 5 entonces se aproxima a 0 es decir = 1.07
1.07X si X > 5 entonces se aproxima a 10 es decir = 1.08
Estas dos columnas (Anchura y Decimales) pueden ser editadas directamente desde la ventana de Tipo de variable (Figura 20) ya que esta ventana nos da la posibilidad de definirlas.

Decimales y Anchura en el cuadro Tipo

Hay que notar que cuando seleccionamos Tipos de variables como Fecha estas opciones se desactivan ya que el formato de la fecha esta predefinido y no podemos alterarlo, la única opción que tenemos es escoger otro formato de fecha.

LECCIÓN 10 - VISTA DE VARIABLES (PARTE IV)

5. ETIQUETA

Dado que generalmente los ocho (8) caracteres del nombre no son suficientes para describir la variable, SPSS nos brinda la posibilidad de utilizar una etiqueta en la cual podemos describir la variable mediante la utilización de un máximo de 255 caracteres. El uso de la etiqueta es bastante útil ya que facilita la interpretación de los resultados (Tablas o Gráficos), a las personas que no han participado en la generación de los procedimientos y desconocen el significado del nombre de la variable. El uso de la etiqueta es opcional, el programa en caso de no existir una etiqueta utiliza el nombre de la variable para generar los resultados. Podemos darnos cuenta de las etiquetas manteniendo el cursor sobre el nombre de la variable en la vista de datos.

Comparación de los usos de etiquetas

En la figura 21, se aprecia claramente la diferencia que existe al utilizar las etiquetas y las etiquetas de valor en los resultados. Antes de continuar con la propiedad valores, debemos ver primero las propiedades perdidos y medida ya que el uso de etiquetas de valor está determinado por estas propiedades y en este momento no sería muy clara su definición.

6. Perdidos 

Los valores perdidos son razones por las cuales no obtenemos una respuesta coherente de algún entrevistado; es decir, es una razón que me indica la causa por la que él entrevistado no me aporta información. Dentro de los valores perdidos podemos encontrar:

·                     No sabe

·                     No responde o se niega a responder

·                     No aplica o sencillamente la pregunta no lo afecta EJ: preguntarle a una persona soltera la edad a la que se caso por primera vez, si no se ha casado nunca esta pregunta no lo afecta.

Debemos tener claro que los valores perdidos son razones y no errores, generalmente tendemos a confundir un valor perdido con un valor que no esta dentro de nuestro rango.

 EJ: en la variable género (sexo), tenemos los valores (1 = mujeres y 2 = hombres), después de revisar el archivo nos damos cuenta que tenemos en algunos registros el valor 3, generalmente cometemos el error de pensar que este es un valor perdido, pero no lo es, este tipo de valores los debemos considerar como errores ya sea de digitación o de captura y la forma de corregirlos es ir hasta la fuente (entrevistas) y determinar a que grupo pertenecía el individuo. Si no podemos determinar el grupo y los valores son muy pocos es recomendable prescindir de estos casos.

SPSS maneja dos tipos de valores perdidos; el primero es perdido por el sistema, el cual se identifica por la ausencia total de datos es decir casillas vacías y la segunda es datos perdidos definidos por el usuario que corresponden a razones por las que no obtuvimos información. Sea cual sea el tipo de valor perdido debemos definirlos ya que de no hacerlo el programa hará los cálculos contando con estos valores lo cual afectará severamente los resultados.

 La forma de definirlos es activando la casilla correspondiente a perdidos, una vez activa observaremos de nuevo el cuadradito en la parte derecha con los respectivos puntos suspensivos, al hacer clic sobre él, se abrirá la ventana de Valores Perdidos (Figura 22) la cual nos ofrece tres posibilidades.

Definir valores perdidos

·                     No hay valores perdidos

·                     Valores perdidos discretos: son un máximo de tres valores perdidos que tendremos en nuestra variable, pueden tomar los valores que deseemos. Se recomienda que exista una distancia considerable entre los valores representativos y los perdidos con el fin facilitar su identificación.

·                     Rango más un valor discreto opcional: se utiliza cuando tenemos varios parámetros de valores perdidos los cuales se encuentran dentro de un rango y no hay valores representativos de grupos dentro de ellos, además nos brinda la opción de ingresar un valor discreto adicional (Un número específico).

LECCIÓN 11 - VISTA DE VARIABLES (PARTE V)

7. Columnas y Alineación

Estos dos parámetros son netamente de formato; es decir, de presentación y sus efectos únicamente son apreciables en la vista de datos. La primera propiedad (columna) nos indica el ancho de la columna y la segunda la alineación dentro de la casilla. La columna al igual que en una hoja de cálculo, podemos alterarla de forma directa en la vista de datos colocando el cursor al lado de la columna hasta que aparezca el indicador, hacemos clic y lo sostenemos arrastrando hasta obtener el ancho deseado.

8. Medida

Es el parámetro más importante de las variables, de su definición depende el tipo de análisis que podemos realizar, dentro de la estadística se han catalogado cuatro diferentes escalas de medida, pero para SPSS estas escalas se resumen en tres:

·                     Nominal: son variables numéricas o de cadena cuyos valores indican una categoría de pertenencia, sin tener un orden dentro de sus categorías. Un ejemplo de variable nominal puede ser el género, la raza, el estado civil, etc. El programa asume que las variables de cadena son siempre variables Nominales.

·                     Ordinal: son variables numéricas cuyos valores indican una categoría de pertenencia y poseen un orden lógico dentro de sus categorías. Un ejemplo de variable ordinal puede ser el nivel de ingresos, categoría del vehículo, nivel educativo, etc.

·                     Escala: son variables numéricas cuyos valores representan una magnitud y no una categoría. Un ejemplo de variable de escala puede ser la edad, años estudiados, la distancia en metros, la altura, el sueldo, etc.

Es claro que estas definiciones no son Estadísticas, sencillamente las utilizo por que son a mi manera de pensar la forma más sencilla de entenderlas. Quiero aclarar que este curso está dirigido a todas esas personas que deseen aprender a manejar el paquete sin tener conocimientos de estadística y su área de trabajo sea dentro de otra rama científica.

9. Valores

Los valores o Etiquetas de valor nos permiten generar una leyenda que facilite la interpretación de los valores de una variable, ya sea en los resultados o en la vista de datos. Debido a que se utilizan números para representar cada categoría es necesario crear una pequeña leyenda que nos permita ver en letras el significado de la categoría a la que corresponde cada número.

Las etiquetas de valor no deben exceder los 60 caracteres y se utilizan si:

·                     La variable es categórica, es decir Nominal u Ordinal.

·                     Se tienen valores perdidos definidos por el usuario.

·                     Para ingresar las etiquetas de valor debemos activar la casilla correspondiente y sucesivamente hacer clic sobre el cuadradito con lo cual se abre la ventana Etiquetas de valor (Figura 23); en esta ventana encontramos tres casillas.

Etiquetas de valor

 

La primera casilla corresponde al valor o número, en ella debemos digitar el número al que deseamos dar la etiqueta; la segunda casilla es la etiqueta de valor, en ella digitamos la categoría a la que corresponde ese valor (máximo 60 caracteres) y la tercera casilla corresponde a las etiquetas añadidas, es decir, las categorías que ya hemos ingresado.

Es necesario añadir antes de aceptar ya que si no lo hacemos se perderá cualquier operación de añadir o de cambiar pendiente. Si deseamos cambiar una etiqueta que ya hayamos añadido, la forma de hacerlo es seleccionándola en la casilla (hacer clic sobre ella), editar ya sea el número o la etiqueta y posteriormente hacer clic en Cambiar. Si por el contrario deseamos eliminarla la seleccionamos y hacemos clic en eliminar con lo que desaparece del listado.

5. Área del procesador

Nos indica el estado del procesador, posee diversos estados de acuerdo del proceso que este realizando, es bastante útil cuando le pedimos un proceso al paquete y contamos con múltiples registros; en algunos casos la base es tan extensa que puede tardar bastante tiempo la ejecución del resultado, en estos casos generalmente se tiende a pensar que el programa se bloqueo, antes de determinarlo es importante saber cuál es el estado del procesador. Además, cuando la licencia caduca, en esta área encontramos el mensaje el procesador no está disponible.

 

LECCIÓN 12 - TABLAS DE FRECUENCIAS

Generando tablas de frecuencias

Ahora vamos a generar una tabla de frecuencias para conocer la ventana de resultados del SPSS, debemos recordar que este tipo de archivos los catalogamos con la extensión (*.spo). Antes de generar resultados necesitamos abrir un archivo de datos, así que vamos al menú archivo... abrir... datos.... o hacemos clic en el icono de acceso directo  abrirarchivoen la barra de herramientas.

Una vez que le pedimos abrir al programa obtenemos una ventana de exploración con la cual vamos a ubicar el archivo Cap1.sav que se encuentra en la ubicación (C:\Mis documentos\Cap1.sav), una vez ubicado lo seleccionamos y le damos abrir.

Ahora vamos a generar una tabla de frecuencias, para esto debemos ir al menú ANALIZAR... ESTADÍSTICOS DESCRIPTIVOS... FRECUENCIAS... (Figura 24). Al dar clic en el procedimiento frecuencias surge una nueva ventana llamada FRECUENCIAS (Figura 25).

Menú Analizar

Ventana Frecuencias

En la figura 25 podemos observar que el cuadro de diálogo se divide en 3 partes. La primera corresponde a la lista de variables, en ella encontramos todas las variables que posee nuestro archivo. El programa nos permite saber el tipo de variable al que pertenece cada una de ellas mediante el icono que se encuentra a su izquierda, diferenciando si son variables numéricas o de cadena.

Variables Numéricas para variables numéricas


Variables de Cadena para variables de cadena

El símbolo (<) indica que son cadenas cortas es decir que poseen menos de 8 caracteres, si encontramos el símbolo (>) esto indica que son cadenas largas, más de ocho (8) caracteres. Generalmente este tipo de variables contienen el nombre o la dirección de los encuestados.

Si observamos la lista de variables notaremos que las variables están por su etiqueta y no por el nombre, esto es útil si desconocemos el archivo y su contenido, pero si es un archivo que hemos creado o su contenido es familiar, sería más aconsejable manejarlo por el nombre de las variables. Antes de continuar vamos a ver como se puede cambiar la forma de representar las variables en la lista, para hacerlo es necesario cerrar por un momento la ventada de Frecuencias, luego volveremos a ella. La forma de cerrarla es haciendo clic en cancelar.

LECCIÓN 13 - MODIFICANDO OPCIONES DE SPSS

Una vez cerrada la ventana nos dispondremos a cambiar la forma de representar las variables en la lista, para esto debemos ir al menú Edición... opciones, al hacer clic en opciones se abre un nuevo cuadro de diálogo (Figura 26).

Cuadro de Opciones de SPSS

En este cuadro se manejan todas las opciones del paquete; al observarlo notaremos que en la parte superior hay una serie de pestañas, cada una de ellas corresponde a un proceso específico del paquete, dentro de estos procesos encontramos (General, Visor, Visor de borrador, etiquetas de los resultados, gráficos, interactivos, tablas pivote, datos, moneda y procesos). Al seleccionar uno de ellos la venta cambiará y nos mostrará las opciones que cada uno maneja. Por el momento nos concentraremos en la pestaña General, en ella encontraremos la opción de listas de variables, en la parte superior izquierda.

Cambio en las listas

Esta sección nos permite manipular la forma como deseamos que se representen las listas de variables en los diferentes procedimientos del programa. En nuestro caso deseamos que las listas se determinen por el nombre de las variables y en orden alfabético. Para hacerlo debemos hacer clic en el círculo  que se encuentra a la izquierda de  Mostrar nombres  y el de Alfabético (Figura 27). Una vez hecho esto hacemos clic en Aplicar y luego en Aceptar, con lo que los cambios son aplicados.

Para comprobar el efecto realizado en las listas de variables, vamos a continuar con la realización de una tabla de frecuencias; nuevamente abrimos la opción frecuencias en el menú Analizar... Estadísticos descriptivos... Frecuencias, al hacer clic en frecuencias aparecerá el cuadro Frecuencias. Si nos fijamos en la lista de variables, notaremos que ahora las variables se representan con el nombre y a su vez, se encuentran en orden alfabético (Figura 28).

Comprobando cambio en las listas de los cuadros de diálogo

La segunda parte en la que se divide la ventana de Frecuencias, es la casilla de selección, en ella se muestran las variables que han sido escogidas para el análisis. La forma de escoger las variables es hacer doble clic sobre ellas ó seleccionándolas y luego hacer clic en el botón Ingresar Botón Ingresar (Figura 29).

Cuadro de Frecuencias

Una vez seleccionadas veremos cómo las variables aparecen en la casilla de selección y también se activan los iconos correspondientes a Aceptar y Pegar, los cuales permanecerán inactivos mientras no seleccionemos, por lo menos una variable.

La tercera parte que conforma el cuadro de diálogo se denomina las opciones de análisis, dentro de estas opciones encontramos Estadísticos (nos permiten solicitar los estadísticos descriptivos y de resumen opcionales para las variables numéricas), Gráficos (solicitar la creación de gráficos de barras o histogramas para estas variables) y Formato, el cual nos permite cambiar el formato de la tabla de frecuencias. Esta parte la analizaremos en los capítulos siguientes. Por el momento nos limitaremos a generar una tabla de frecuencias para las variables Género (categoría de precio del vehículo principal) y estciv (estado civil).

LECCIÓN 14 - VISOR DE RESULTADOS

Visor de resultados

En esta ventana se representan de forma gráfica todos los procedimientos (Tablas, Gráficos o Estadísticos) que se hayan ejecutado en el programa. SPSS cuenta con dos tipos diferentes de Ventanas de resultados, el primero es el Visor de Resultados (Figura 31) donde se muestra de forma interactiva los resultados de los procesos y los organiza en forma jerárquica de acuerdo con el orden que se hayan realizado; la segunda ventana Visor de Borrador (Figura 32), muestra los resultados en formato de texto, el cual podemos abrir por medio de cualquier lector de texto.

La principal diferencia de estas dos ventanas, es que en el visor de Borrador no puedo modificar el formato de los resultados, además se pierden las propiedades interactivas de los objetos. Mientras que en el visor de Resultados puedo ordenar y editar los resultados o inclusive generar nuevos procesos.

Visor de resultados

Visor de borrador

Dado que el visor de resultados es más completo y contiene propiedades de edición, nos concentraremos en el estudio de esta ventana.

En la Figura 33 podemos observar que la ventana  de resultados está dividida en tres partes. La primera de ellas es el navegador de resultados, está sección nos permite explorar los resultados que hemos obtenido a través de los diferentes análisis realizados; la segunda es el visualizador de resultados en el cual obtenemos la imagen de los resultados y la tercera es las opciones de ventana, en la cual encontramos los diferentes procedimientos del paquete.

Partes del Visor de resultados

Variables ingresadas

Debemos señalar la variable Género y añadirla, luego señalar la variable estciv y añadirla (Fig.1-30). Una vez añadidas a la casilla de selección hacemos clic en aceptar con lo cual se abrirá la ventana de resultados y nos mostrará la tablas de frecuencias para estas variables.

Antes de analizar los resultados vamos a conocer un poco sobre la estructura de esta ventana y los elementos que la conforman.

LECCIÓN 15 - NAVEGADOR DE RESULTADOS

Navegador de resultados

Básicamente  el navegador de resultados tiene una estructura de árbol, en la cual podremos identificar, los procesos así como las propiedades de cada uno de los procesos.

Estructura del Navegador de resultados de SPSS

Para efectos del curso definiremos proceso a cualquier tipo de análisis que realicemos con el paquete; es decir, que consideraremos como proceso la generación de frecuencias, las tablas de contingencia, la generación de un gráfico, etc.

Si nos fijamos en la figura 35 podremos observar que en este caso tenemos dos procesos, el primero corresponde a el análisis de frecuencias y el segundo a un análisis explorar (estos procesos serán examinados con mayor dedicación en los capítulos posteriores).

Ejemplo del Navegador de resultados

Debajo de cada proceso encontraremos una serie de propiedades que nos permiten describir de forma más explicita el contenido y el objetivo del proceso. Para cada proceso varia sus propiedades, pero hay dos que están presentes en todos los procesos del paquete, los cuales son el Titulo y las notas.

Podemos ver en la gráfica 35 que algunos de los resultados tienen en su izquierda un libro cerrado y otros uno abierto, esto se debe a que el programa nos brinda la posibilidad de ocultar o ver un resultado simplemente haciendo clic en el signo que se encuentra a su izquierda, cuando el signo es (+) nos indica que ese resultado está oculto y si es (–) nos indica que está desplegado o abierto. Nosotros podemos ocultar una propiedad o un proceso, ya que su forma de ejecución es exactamente igual.

Además de esto el navegador también nos permite organizar los resultados a nuestro criterio y es tan sencillo como seleccionar la propiedad o el procedimiento que deseemos reubicar y arrastrarlo hasta la posición deseada. A través del curso utilizaremos constantemente esta ventana y podremos comprender de una mejor manera su beneficio.

Visualizador de resultados

La segunda parte de esta ventana la compone el visualizador de resultados, en ella podremos ver representados todos los resultados de los análisis que hemos realizado con el programa, a su vez, las opciones de ocultar o mostrar del navegador serán ejecutadas en el visualizador; es decir, si nosotros elegimos ocultar no veremos esa información y solo la volveremos a ver hasta que elijamos la opción mostrar en el navegador (Figura 36).

Visualizador de resultados

Adicionalmente, está ventana es el lugar donde podemos acceder a la edición de los objetos creados (Tablas, gráficos, estadísticos, etc). Para poder activar la edición es necesario ubicar el puntero del ratón sobre el objeto que deseamos modificar y hacer doble clic, con lo que se abrirá el editor correspondiente a objeto seleccionado.

LECCIÓN 16 - OPCIONES DEL VISOR

Opciones de ventana

La tercera parte que compone esta ventana es la que corresponde a las opciones, en ella encontramos diferentes funciones que nos permiten realizar algunos procedimientos del paquete. Si nos fijamos en la Figura 37, podremos notar que algunos de los iconos de la barra de herramientas son los mismos que encontramos en la ventan Editor de Datos, aunque también aparecen unos iconos nuevos.

Visor de resultados

Adicionalmente, podemos apreciar que en la barra de menús han desaparecido los elementos correspondientes a Datos y Transformar y en su lugar se encuentran los menús Insertar y Formato. Esto se debe a que los menús Datos y Transformar contiene procedimientos que sólo son aplicables a los datos (registros y variables), cuando están desagrupados. De igual manera los menús Insertar y Formato contienen procedimientos que sólo pueden ser aplicados a los resultados.

Los nuevos iconos que encontramos en la barra de herramientas son:

 Últimos resultados Seleccionar últimos resultados

Como su nombre lo indica, nos permite seleccionar los resultados del último procedimiento ejecutado. Es de bastante utilidad cundo tenemos un número considerable de resultados.

 Designar ventana Designar ventana

Este icono se utiliza cuando tenemos más de una ventana de resultados abierta. Lo que hace es comunicarle al programa que todos los resultados que generemos se deben representar en la ventana designada. Cuando tenemos más de una ventana abierta el programa adhiere los resultados nuevos a la última ventana que se haya abierto, lo cual puede ocasionar confusión y posiblemente pérdida de la información. Para evitarlo debemos activar este icono, en la ventana que deseemos utilizar para los nuevos resultados. Para designar una ventana hacemos clic en el icono de manera que su color desaparezca.

Dentro del menú Insertar (Figura 38) se encuentran los procedimientos salto de página, eliminar salto de página, nuevo encabezado, nuevo título, nuevo título de página, nuevo texto, grafico 2-D interactivo, grafico 3-D interactivo, grafico antiguo, nuevo mapa, archivo de texto y objeto.

Menú Insertar

Menú Formato

Cuando seleccionamos la opción Insertar Objeto, se abre un nuevo cuadro de diálogo, en el que aparecen dos opciones de selección. La primera corresponde a crear nuevo (Figura 40), su función es generar un nuevo objeto proveniente de alguno de los programas que se encuentran instalados en el PC. La segunda opción corresponde a crear desde un archivo (Figura 41), la cual nos permite importar un archivo o un vínculo a este archivo.

Crear Nuevo Objeto

Crear Nuevo Objeto desde archivo

Estas opciones se utilizan cuando necesitamos agregar información a los resultados, o se quiere generar el reporte completo dentro del visor de resultados. A su vez, en el menú Formato se encuentran las opciones Alinear a la derecha. Centrar y Alinear a la izquierda, las cuales se utilizan de la misma forma que en el editor de datos.

Para terminar este capítulo inicial conoceremos la forma de guardar los archivos de las diferentes ventanas.

LECCIÓN 17 - GUARDAR ARCHIVOS

Guardando un archivo

Para guardar un archivo se debes ir al menú Archivo, seleccionar la opción Guardar como y hacer clic en ella. Inmediatamente se abre una ventana de exploración (Figura 42), está ventana es típica de las aplicaciones de Windows, así que no haremos una explicación detallada de ella.

Cuando guardamos archivos en la ventana Editor de Datos (Figura 42) nos aparecen tres opciones en la parte inferior; estas opciones se habilitan cuando estamos guardando en un tipo de formato diferente a *.sav, es decir, en extensiones como Excel, SAS, etc.

guardando

También se puede observar el botón Variables, esta opción abre un nuevo cuadro de diálogo (Figura 43), en donde se puede seleccionar las variables que deseamos guardar. Por defecto todas las variables son seleccionadas. Generalmente se utiliza cuando vamos a guardar un archivo de datos para ser utilizado en una hoja de cálculo.

La otra diferencia que podemos resaltar es la opción Pegar, la cual veremos en casi todos los cuadros de diálogo del programa. Esta opción lo que realiza es pegar los comandos del procedimiento que estamos realizando en la ventana de sintaxis.

La ventana de sintaxis nos permite trabajar los procedimientos del paquete mediante palabras de código, lo que es particularmente ventajoso cuando manejamos análisis continuos; es decir, cada cierto tiempo tenemos que realizar el mismo análisis a una base de datos actualizada. La utilización de la sintaxis reduce el tiempo que se invierte en el procesamiento de los datos y la generación de los reportes o resultados. SPSS nos permite ir más allá y generar procesos que realicen todo el reporte de forma automática, agregándolo simplemente en las tareas programadas del ordenador.

En el siguiente capítulo aprenderemos la forma de crear un archivo de datos ya sea ingresando la información directamente en el editor de datos o mediante la importación de la información desde una fuente de datos externa como una hoja de cálculo.

CAPÍTULO II - LECCIÓN 1 - ARCHIVOS DE DATOS

En los procesos de investigación la información proviene de diferentes fuentes, como lo pueden ser las encuestas, las mediciones o los experimentos. Generalmente esta información es recopilada en diversos programas de computadora que permiten organizarla, de acuerdo a sus características.

SPSS ofrece dos formas diferentes de elaborar archivos de datos, la primera es creándolo en el editor de datos introduciendo directamente la información (Variables y Casos) y la segunda es importando información desde una fuente externa, en donde los datos se encuentran previamente organizados y cuyo formato debe ser compatible con el programa.

Creando archivos de datos

Para generar un archivo de datos en SPSS, es preciso cumplir dos parámetros fundamentales. El primero es tratar de introducir la información de forma numérica; para lo cual es necesario otorgar números de identificación a las variables categóricas o a las que contengan valores perdidos estipulados por el usuario. La segunda es definir las propiedades de las variables (ver capítulo I), de acuerdo a las características de la información que contiene cada variable.

A manera de ejemplo vamos a generar un archivo que contenga la siguiente información.

Datos del ejemplo

Antes de generar el archivo en el programa, se debe otorgar un valor numérico representativo a cada una de las opciones de pertenencia de las variables categóricas, así como a cada uno de los valores perdidos que el usuario desee estipular. No se le asignan valores a las variables donde la información representa magnitudes como la edad, la distancia, el peso o las ventas, ya que sus valores no representan pertenencia si no cantidad.

Variable: Estado civil


Esta variable contiene cinco diferentes categorías, cuatro de ellas representan un estado civil diferente, y la última representan la razón por la que no obtuve información del individuo.

Soltero = 1

Casado = 2

Divorciado = 3

Viudo = 4

No responde =9

 

Variable: Nivel de educación


En esta variable encontramos cinco categorías con un orden lógico, ya que NO pueden existir personas con título universitario sin hacer de antemano la primaria. Teniendo esto en cuenta los valores son:

Primaria = 1

Secundaria =2 

Universidad =3

Postgrado =4

Master =5

 

Datos en el archivo

Después de otorgar los códigos para cada una de las variables (Tabla 4), procederemos a crear el archivo de datos correspondiente. Para ello debemos abrir el programa mediante la ruta Inicio... Programas... SPSS for Windows... SPSS 11.5 para Windows. Al abrir surge el asistente de inicio al que daremos cancelar, con lo cual aparecerá la ventana Editor de datos vacía  (Figura 44), lista para comenzar a generar el archivo.

CAPÍTULO II - LECCIÓN 2 - DEFINIR VARIABLES (PARTE I)

Para empezar a ingresar los datos, SPSS nos ofrece dos posibilidades; la primera es definir las propiedades de las variables antes de introducir los datos y la segunda es definirlas después de ingresar los casos. La definición de las propiedades de las variables se puede emplear como orientación en el ingreso de los casos, por lo que es recomendable utilizar la primera opción.

Para definir las variables se debe seleccionar la pestaña vista de variables en el editor de datos (Figura 45), donde se localizan las propiedades o características. Nos ubicamos en la primera casilla de la columna Nombre y comenzaremos con la definición, cumpliendo con los criterios establecidos por SPSS para las propiedades de las variables (ver capítulo I).

Vista de variables - Ingreso de la información

Lo primero que se debe hacer es definir un nombre para cada variable, cumpliendo con los parámetros necesarios como no superar los ochos caracteres, comenzar con una letra, no tener espacios en blanco, etc. Teniendo esto en cuenta los nombres de las variables quedarán (Tabla 4)

Número de encuesta: id

Estado civil: estciv

Nivel de educación: nivedu

Edad en años: edad

Tipo: Los caracteres que encontramos en las variables corresponden a valores numéricos ya sean representativos de pertenencia o de cantidad; por lo tanto debemos seleccionar el tipo numérica para todas las variables.

Ancho: Es determinado por el número máximo de cifras que contengan los valores de cada una de las variables incluyendo las cifras decimales. En este caso las variables Número de encuesta, estado civil y Nivel de educación cuentan con valores enteros de una sola cifra y la variable edad en años asume valores enteros de dos cifras. Antes de ingresar el ancho de las variables se debe cambiar primero el numero de decimales a cero o de lo contrario aparece el mensaje El número de cifras decimales es demasiado largo para la anchura del campo (Figura 46).

Mensaje de error demaciados decimales

Etiqueta: las etiquetas para las variables serán el nombre que encontramos en la fuente, es decir, (id = Número de encuesta, estciv =Estado civil, nivedu = Nivel de educación, edad = Edad en años).

Valores: Solo se definen valores para las variables categóricas o las que tengan valores perdidos que el investigador quiera estipular (ver capítulo I). En este caso se definen valores a las variables estciv (Figura 47) y nivedu (Figura 48).

Etiquetas de valor para estado civil

Etiquetas de valor para Educación

Es necesario añadir todos los valores y sus etiquetas de valor antes de hacer clic en Aceptar o de lo contrario se perderán la información que no haya sido Añadida. Si se desea modificar alguna etiqueta o algún valor se debe señalar y editar, después de lo cual se activará el botón de Cambiar.

 

Archivo Nuevo Vista de datos

 

CAPÍTULO II - LECCIÓN 3 - DEFINIR VARIABLES (PARTE II)

Perdidos: Dentro de la información solo tenemos una variable con valores perdidos correspondiente a estciv, el cual debemos definir, o de lo contrario será tomado en todos los análisis que realicemos afectando los resultados.

Definición de los valores perdidos

Para definirlo activamos la casilla valores perdidos discretos e ingresamos el valor 9 (Figura 49). Debemos recordar que un valor perdido es una razón por la cual no tengo información. El valor 9 me indica que no tuve información por que el entrevistado no respondió; es aconsejable utilizar valores perdidos que estén separados del rango útil para facilitar su identificación.

Las propiedades columna y alineación son de formato, por lo tanto lo dejamos a preferencia del lector.

Medida: Dentro de nuestras variables encontramos los tres tipos de medida con que cuenta SPSS. En su orden las variables son:

Id: Escala

Estciv: Nominal

Nivedu: Ordinal

Edad: Escala

Una vez terminada la definición de las variables, seleccionamos la vista de datos y comenzamos a ingresar los datos.

Archivo creado

Después de ingresar los datos activamos el icono Etiquetas recuperarcuadro de manera que veremos las leyendas de cada uno de los valores (Figura 50). Por último debemos guardar el archivo, para lo cual vamos al menú Archivo... Guardar como, le otorgamos el nombre y la ubicación y seleccionamos guardar.

CAPÍTULO II - LECCIÓN 4 - IMPORTAR ARCHIVOS

SPSS permite leer información proveniente de diferentes fuentes como lo pueden ser las hojas de cálculo, los archivos planos o de texto e incluso desde bases de datos como Access, FoxPro, o algunas más elaboradas como Oracle. Para importar las bases de datos, SPSS requiere que estas soporten el protocolo ODBC. La estructura utilizada por SPSS para la importación de información esta basada en tres grupos de archivos.

 

Estructura de las fuentes de información

 

Para cada uno de estos tipos de archivo, SPSS tiene establecido un procedimiento diferente para su importación, algunos de ellos se importan de forma directa a través de una ventana de exploración y otros cuentan con un asistente el cual nos guía paso a paso en la definición de los datos. Para efectos de este curso, solo haremos referencia al primero de ellos.

 

Archivos de hojas de cálculo

 

Antes de importar un archivo proveniente de una hoja de cálculo ya sea de Excel o de Lotus, es indispensable comprobar con anterioridad si cumple con las características que SPSS requiere. Estas características son:

Estructura de datos:

Los archivos de SPSS contienen una estructura en sus datos (Ver Capitulo I), en la cual la información, registros u observaciones se encuentra en las filas y las variables en las columnas. Para importar un archivo de Excel es necesario que tenga la misma estructura (variables en columnas y Casos en filas), de lo contrario es necesario adaptar la información.

Títulos:
En SPSS no se manejan los títulos dentro de los Datos, por lo tanto los archivos que se desean importar no deben contener títulos o no importar el rango que comprenda el título.

Rango:
SPSS solo importa los datos que se encuentren dentro de un rango establecido por el usuario. Se incluye el nombre de las variables si estas se encuentran en la primera fila del rango.

Para entender mejor la forma de importar archivos desde Excel vamos a importar la información contenida en el archivo Encuesta.xls, el cual debes descargar desde www.spssparatodos.com. Para efectos del curso asumiremos que ya lo descargaste y se encuentra en  C: \Mis documentos\Encuesta.xls. Antes de extraer la información del archivo comprobaremos si cumple con los requisitos de SPSS, para ello es necesario abrirlo primero en Excel (Figura 52).

 

Archivo visto en Excel

El objetivo que se persigue abriendo el archivo es identificar las características de la información que contiene, para lo cual debemos reconocer la existencia de títulos, filas sin información, la estructura de los datos y el rango de información que se desea importar.

Si nos fijamos en la figura 52, observaremos que en las primeras seis (6) filas, encontramos un título y tres filas sin información; este rango no debe ser importado ya que no incluye información útil para el programa. Ahora  debemos comprobar la estructura de los datos y verificar que las variables se encuentren en las columnas y los casos o registros se ubiquen en las filas. Si nos fijamos en el archivo vemos como en la fila 7 se encuentran los nombre de las variables y cada una de ellas está ubicada en una columna diferente, además las filas que se encuentran debajo de ella corresponden a los casos o registros. Por último debemos reconocer el rango que se puede importar para ello nos paramos en la Fila 7 Columna A y oprimimos las teclas Ctrl. + Fin, con lo cual nos ubicará en la última fila y la última columna con información que para este caso es columna J y la Fila 307.

El rango de información se encuentra establecido desde la primera Columna y Fila con información útil, en este caso A7, hasta la última casilla con información que el investigador desee importar; la cual es para este caso J307.

 

CAPÍTULO II - LECCIÓN 5 - IMPORTAR ARCHIVOS (PARTE II)

Después de comprobar las características del archivo y verificar que cumplen con los requerimientos del programa, debemos cerrarlo, ya que SPSS no permite importar archivos si estos se encuentran en uso. Después de cerrar Microsoft Excel volvemos a SPSS y seleccionamos el menú Archivo... Abrir.. Datos (Figura 53), con lo cual se abre la ventana de navegación (Figura 54). Esta ventana requiere que le especifiquemos tres parámetros, el primero de ellos es la ubicación del archivo dentro de nuestro ordenador o los discos extraíbles (Buscar en); la segunda corresponde al Nombre de archivo y finalmente el Tipo de archivo o extensión a la que corresponde para lo cual cuenta con una lista de formatos o extinciones a los que podemos acceder por medio de este procedimiento. Utilizando esta ventana ubicaremos el archivo Encuesta con el formato Excel (*.xls) que se encuentra en Mis documentos. Una vez ubicado lo seleccionamos y hacemos clic en abrir.

Menú Abrir... Datos

Ubicar archivo Encuesta.xsl

A continuación de seleccionar el archivo en la ventana de navegación se abre el cuadro de dialogo Apertura de fuente de datos de Excel (Figura 55). En este cuadro encontramos las opciones de importación Leer nombre de variables de la primera fila de datos, Hoja de trabajo y Rango.

Apertura de fuente de datos de Excel

Cada una de estas opciones permite restringir la información que será importada. La primera Leer nombre de variables de la primera fila de datos (Figura 55), es determinada por la estructura del archivo de origen. Si nos fijamos en la figura 52, encontraremos que la fila 7 contiene los nombres de las variables; estos nombres deben cumplir ciertas condiciones (ver capítulo I), como no tener más de 8 caracteres, comenzar con una letra y no contener caracteres especiales, si se cumplen estas condiciones SPSS las importará como nombres de variables, de lo contrario las adecua para su importación; es decir, si rebasa los ocho caracteres tomará los primeros ocho caracteres como nombre, los espacios entre las palabras los remplazará por el signo (_) y la variables que comiencen por un número o tengan palabras claves las remplazará con la letra (V) y le asigna un número de acuerdo a la posición en el archivo, por ejemplo a la cuarta variable le asigna el nombre (V4).

La segunda opción (Hoja de trabajo Figura 56), hace referencia a la hoja en la que se encuentra la información de interés, en la parte derecha de esta opción se localiza un icono que despliega una lista en la cual podemos elegir la hoja que deseamos. Por defecto SPSS selecciona la primera hoja del archivo, si la información se halla en otra hoja es necesario definírsela al asistente.

Listado de hojas disponibles

CAPÍTULO II - LECCIÓN 6 - IMPORTAR ARCHIVOS (PARTE III)

La última opción que encontramos (Rango Figura 57), hace referencia al área donde se encuentra la información de interés, si la hoja cuenta con títulos o filas sin información es necesario especificarle al asistente el rango de importación de lo contrario importara la hoja completa creando errores en el archivo resultante (Figura 58). En este caso el rango que obtuvimos es de A7:J307, no se deben ingresar espacios en el rango ya que SPSS no lo reconoce y aparece un cuadro de dialogo especificando que el rango no es válido.

Rango de valores

Error en el rango

Después de ingresar las opciones correctamente hacemos clic en aceptar con lo cual los datos aparecen en el editor de datos (Figura 59). Es importante resaltar que una vez terminemos de importar la información se debe guardar el archivo resultante o de lo contrario podemos perder su contenido.

Resultado de la importación de los datos

Una vez ha sido guardado el archivo, se deben definir las propiedades de las variables de acuerdo con las características de la información. En la figura 60 se puede apreciar que los nombres de las variables ya están establecidos, además SPSS sugiere el tipo de variable al que corresponde. En algunas ocasiones el tipo de variable sugerido no es el apropiado esto se debe a un error de digitación en el cual una letra se introdujo dentro de la información por lo que es importante revisar la información para poder determinar su medida. Una vez se ingresan las propiedades de las variables se completa el archivo de datos SPSS.

Definir las propiedades de las variables del archivo importado

Si la información requerida se encuentra en diferentes hojas de un mismo archivo, es necesario generar un archivo de datos en SPSS por cada hoja de cálculo del archivo original y posteriormente unirlos, ya que este procedimiento solo permite importar la información contenida en una sola hoja por vez.

Bueno y hasta aquí llega el capítulo II, si deseas obtener los tres capítulos finales, es necesario que vayas a la sección Descargas y llenes el formulario.

Espero que este curso haya sido de tu agrado y te invito a que conozcas nuestro Libro Digital descargando el capítulo gratuito en la sección Libro

CURSO DE SPSS NUEVO

1. INICIO DEL PROGRAMA

Capítulo siguiente: 2 - Introducción de variables

Para abrir el programa, ubíquese en INICIO > Programas > SPSS for Windows > SPSS 11.0 for Windows. El archivo ejecutable de SPSS se llama spsswin.exe.

 Seleccione CANCEL en la primera ventana que aparezca. La ventana de fondo es la ventana para la entrada de datos.

 Ubíquese en la esquina inferior derecha de la ventana y haga click en la pestaña Variable view.

 Observará una ventana similar a la anterior, es la ventana de variables, y a diferencia que sus columnas están identificadas, con el propósito de introducir la información que requiere el programa sobre las variables.

2. Introducción de variables

 

Capítulo anterior: 1 - Inicio del programa
Capítulo siguiente: 3 - Entrada de los datos

La información necesaria para identificar la variable es la siguiente:

Name (Nombre de la variable): es un nombre de hasta 8 caracteres que identificará la variable en el programa.

Type (Tipo de variable): indica si la variable es numérica (Numeric), con comas (Comma), con puntos (Dot), notación científica (Scientific notation), fecha (Date), Dólar (Dollar), Moneda (Custom currency), o una cadena de caracteres (String) . 

Width (Ancho): define el máximo número de caracteres que puede contener los valores de la variable.

Decimals (Decimales): define el número de variables que pueden contener los valores de las variables de tipo numérica o similar.

Label (Etiqueta): Permite colocar el nombre completo de la variable

Values (Valores): Se aplica si la variable esta codificada. En esta casilla se coloca los códigos empleados para identificar los diferentes valores de la variable. Por ejemplo, se tiene la variable pertenencia de automóvil, cuyas respuestas son "si" o "no". Si le asignamos el número 1 al "si" y el 2 al "No", en vez de introducir la respuesta tal como se escribe, se registra el número y el sistema lo identifica automáticamente. 

Missing (Valores perdidos): es similar al anterior, solo que los números se asignan para identificar aquellos casos en los que no hubo respuesta o se pierde el valor.

Columns (Columnas): Define el ancho de la columna de la variable en la ventana de datos

Align (Alineación): Alineación de los valores de la variable dentro de la columna en la ventana de datos

Measure (Medida): Define el nivel de medición de la variable en tres tipos:

Escala (Scale): Son valores numéricos que se miden en una escala de intervalos o razón. Ej. Edad, temperatura, etc.

Ordinal: Las valores están representados en categorías con una orden interno:, por ejemplo, malo - regular -bueno

Nominal: Los valores están representados en categorías sin alguna relación entre ellos, por ejemplo: ejecutivo, ama de casa, estudiante

Ejemplo

Como ejemplo, la primera variable que vamos a definir es el número de encuesta, que registrará el número para cada una de las encuestas. La información necesaria se colocará como se indica a continuación:

Name: num_enc

Type: Numeric

Decimals: 0

Label : Número de encuesta

Measure : Scale

El resto de las columnas se deja con los valores predeterminados

Ahora procedemos a guardar la información. Para ello nos ubicamos en Menu y seleccionamos File > Save. Aparecerá una ventana como la que se ilustra. En Nombre del archivo escribimos "Resultados Encuesta Hatillo" y hacemos clic en GUARDAR. Fíjese que la barra de título cambia de Untitled por el nombre que le asignamos

Para Salir del programa, en el menú File > Exit

Ahora repetimos el procedimiento de abrir el programa tal como se explicó anteriormente y nos ubicamos en la ventana de variables.

En esta ocasión procederemos a introducir la variable Primera vez de visita. A continuación la información necesaria.

Name : prima (El nombre puede cambiar a criterio del usuario)

Type : Numeric

Label : Primera vez de visita

En Values, colóquese en la esquina izquierda de la celda y haga click en el cuadrado gris. Aparecerá una ventaba como la que se muestra. En el espacio de Value Coloque el valor 1 y en el espacio Value Label coloque Si, a continuación haga click en ADD. Coloque el número 2 para "No". Al final, pulse OK para volver a la ventana de variables

No modifique el resto de las columnas

Repita el procedimiento hasta completar todas las variables

Al finalizar, guarde los cambios. Puede hacerlo por Menu File > Save o por el icono del diskette ubicado en la barra de herramientas

3. Entrada de los datos

Capítulo anterior: 2 - Introducción de variables
Capítulo siguiente: 4 - Analisis con elaboración de tablas y gráficos

Para abrir la base de datos

             Menu > File > Data.

 Seleccione el archivo en la ubicación correspondiente y pulse Abrir. Fíjese que el archivo sea de tipo *.sav. 

Ubíquese en la parte inferior izquierda de la ventana y haga click en la pestaña Data View. Aparecerá la venta para la introducción de datos. Fíjese que las columnas están identificadas con los nombres de las variables. De esta manera, los casos se registran por filas.

Ahora procedemos a colocar los datos en la columna correspondiente, teniendo en cuenta la codificación empleada, si aplica el caso. 

Al final, se guardan los cambios

Una vez introducidos los datos, se pueden utilizar las diferentes funciones del programa para el análisis de datos y la elaboración de tablas y gráficas.

4. ANÁLISIS CON ELABORACIÓN DE TABLAS Y GRÁFICOS

Capítulo anterior: 3 - Entrada de los datos


Capítulo siguiente: 5 - Funciones especiales

Análisis descriptivo

Uno de los análisis estadísticos más utilizados es el análisis descriptivo de los datos, a través del cual podemos obtener la distribución de frecuencias para datos agrupados; la determinación de medidas de tendencia central (moda, la media y la mediana, etc), de dispersión (varianza, desviación estándar, etc.); cruces de variables; entre otros. En esta oportunidad se explicará la obtención de la distribución de frecuencias

Nos ubicamos en Menu Analyze > Frecuencias. Aparecerá un cuadro de diálogo, en cuya sección izquierda se encuentran la lista de todas las variables empleadas y en la sección derecha las variables que serán seleccionadas para el análisis.

Seleccionamos la variable Primera vez de visita. A continuación pulsamos el botón CHARTS y marcamos con un tick la opción Pie Chart (gráfico de torta), pulsamos OK. Dejamos marcada la opción Display frequency tables y pulsamos OK. Enseguida se abre una nueva ventana

 Esta ventana se denomina Viewer y es el visor de resultados o Outputs del SPSS. En primer lugar aparece la tabla con las frecuencias, seguida de la gráfica correspondiente. Es posible guardar estos resultados, a través de Menu File > Save. Nótese que es un tipo de archivo distinto al de los datos.

 Cruce de variables

Ahora procederemos a realizar un cruce de variables. Nos ubicamos en Menu Analyze > Crosstabs. Aparece un cuadro similar al observado anteriormente. No obstante, se diferencia porque los recuadros que identifican las variables que se colocaran como Filas (Rows) y Columnas (Columns). En este caso, realizaremos el cruce de las variables Edad con Estado civil. Dejamos marcada la opción Display clustered bar charts, para mostrar la gráfica de barras, y pulsamos OK. Se abre la ventana del visor con los resultados

 Gráficos interactivos

Adicionalmente, SPSS incluye funciones para la edición de gráficos. Se encuentra en Menu > Graphs > Interactive. Seleccionemos Bar, para elaborar un gráfico de barras.

 En el cuadro de dialogo, seleccionamos la variable Horario de visita y la arrastramos al recuadro correspondiente, tal como se ilustra. Existe la posibilidad de alternar entre el eje vertical y horizontal, cruzar variables, colocar el gráfico en tres dimensiones, entre otras opciones. Pulsamos Aceptar y observamos el resultado en la ventana del visor de resultados.

4.        Funciones especiales

Capítulo anterior: 4 - Analisis con elaboración de tablas y gráficos

Funciones especiales

1. Select cases (Seleccionar casos)

 Podemos establecer una condición para seleccionar un conjunto de casos que cumplan o no con dicha condición. Para ello pulsamos el icono  que se encuentra en la barra de herramientas, o también Menu Data > Select Cases

 Por ejemplo, supongamos que se desean seleccionar solamente los casos cuyo horario de visita corresponda a la mañana. En tal sentido marcamos, la opción If condition is satisfied y pulsamos e botón IF...

 En el cuadro de dialogo seleccionamos la variable Horario de visita, y hacemos doble clic para que se agregue al recuadro anexo. Terminamos de escribir con "= 1", recordando que ese fue el valor que se le asignó al valor "Mañana" en la ventana de variables, y pulsamos CONTINUE, luego OK.

 Fíjese que en la ventana de datos se tachan los casos que no cumplen con la condición, dejando libres en cambio a aquellos que si la cumplen

 Para deshacer la condición, abrimos nuevamente el cuadro de dialogo de Select cases, marcamos la opción All cases y pulsamos OK

 2. Split file

 Ahora, si lo que se quiere es ordenar los datos bajo un criterio específico podemos usar la función Split file. Pulsamos el botón que se encuentra en la barra de herramientas, o también Menu Data > Split Fle

 Marcamos la opción Organize output by groups y escogemos la variable Horario de vista como criterio de ordenación.. Dejamos marcada la opción Sort the file by grouping variables y pulsamos CONTINUE. Observe como los casos se ordenan según el orden de los valores de la(s) variable(s) especificada(s)

 Para deshacer este cambio, marcamos la opción Analyze all cases, do not create groups

 Con esta función se demuestra la importancia de crear una variable específica para los números de encuesta. De no haberlo hecho, se hubiera perdido el orden original en que se introdujeron los datos y no se pudieran realizar seguimientos de la información

Mayor información

 Para obtener mayor información sobre el funcionamiento del programa sugerimos revisar el tutorial que trae incorporado. Hay que buscarlo en Menu Help >Tutorial.

 

ASIGNACIÓN: Elabore con sus propias palabras un concepto de SPSS y de la misma elabore un resumen de la unidad no mayor de cinco páginas.

Hosted by www.Geocities.ws

1