SEMINARIO DE TRABAJO DE GRADO – TRABAJO 2
Antecedentes de la Investigación
En toda investigación es de suma importancia revisar los trabajos previos realizados, que permitan obtener ciertos aspectos que contribuyan al logro de los objetivos, dentro de ellos se encontraron:
El trabajo de Grado realizado por el ing. Cesas O. Seijas (2001) para optar al Título de Magíster en Ingeniería Eléctrica en la Universidad de Carabobo, Valencia, Venezuela. “Predicción de Series de Tiempo Usando Redes Neuronales Artificiales: Caso de Estudio Series de Tiempo Económicas Venezolanas”. En el se realizaron experimentos sobre series de tiempo económicas demostrando que el modelo basado en RNA y específicamente en RBF supera el modelo estadístico ARIMA, para pronóstico a corto y largo plazo, arrojando resultados más aproximados en valor absoluto y exhibiendo mejor índice en el indicador Matriz de Confusión. De los resultados obtenidos surgió la necesidad de evaluar modelos de pronósticos basados en RNA con series de tiempo económicas multivaluadas.
La publicación realizada por K. R. Müller, A. J. Smola y otros (1997). “Predicting Time Series with Support Vector Machines”. Proceedings of ICANN´97, Springer LNCS 1327, p. 999-1004. El artículo compara las SVM con las RNA de base radial en cuanto a la predicción de series de tiempo se refiere. Discuten el uso de diferentes tipos de funciones de pérdidas en el uso de SVM. Demuestran que ambas aproximaciones producen resultados con excelentes actuaciones con una ventaja para SVM en el régimen de alto ruido para los datos de Mackey- Glass.
La publicación realizada por Rüping Stefan (2002). “MVS Kernels for Time Series Análisis”. CS Department, AI Unit, University of Dortmund, 44221 Dortmund, Germany, E-Mail stefan.rueping@uni-dortmund. Este autor analiza la importancia del problema complejo del análisis de series de tiempo. Establece que las Máquinas de Soporte Vectorial son herramientas que permiten modelar aplicaciones del mundo real que pueden consistir en la predicción de series de tiempo con gran cantidad de datos y de alta dimensionalidad. Este artículo presenta algunas funciones de Kernel y discute sus méritos relativos, dependiendo del tipo de datos utilizados.
El trabajo de Grado realizado por el Ing. Miguel Fasanella Yacer (2004), para optar al Título de Magíster en Ingeniería Eléctrica en la Universidad de Carabobo, Valencia, Venezuela. titulado “Predicción De Series De Tiempo Usando Maquinas Vectoriales De Soporte. Caso De Estudio: Series De Tiempo Económicas Venezolanas”, en donde su objetivo principal fue elaborar un modelo predictivo de series de tiempo univaluadas no lineales económicas y financieras aplicando Máquinas de Vector de Soporte (SVM) consiguió menores errores en la desviación que en el modelo utilizado por Seijas (2004)
La publicación realizada por Kin Keung Lai, Lean Yu, Wei Huang and Shouyang Wang, “Multistage Neural Network Metalearning with Application to Foreign Exchange Rates Forecasting” A. Gelbukh and C.A. Reyes-Garcia (Eds.): MICAI 2006, LNAI 4293, pp. 338 – 347, (2006). Realizan comparaciones entre todos los modelos, empezando desde el pionero en su clase, las redes de inteligencia artificial (1943) pasando por ARIMA y llegando a las redes neuronales. En su estudio, se basaron en resultados empíricos, llegan a la conclusión que los mejores valores obtenidos para la predicción de tasas de cambio de moneda, lo obtienen con un modelo hibrido.
Todos estos trabajos, han planteado de una u otra forma la utilización de Maquinas de Soporte Vectorial y los datos con los cuales ha sido entrenadas han sido valores históricos de la misma variable a estudiar. Este trabajo, planta la utilización de otras variables que influyan en el comportamiento de las cotizaciones de las divisas, en este caso dólar-euro para predecir el valor futuro.
Teorías o referentes teóricos que sustentan la investigación:
Maquinas de Soporte Vectorial
Una Máquina de Soporte Vectorial (SVM por su nombre en ingles Support Vector Machines) aprende la superficie decisión de dos clases distintas de los puntos de entrada. Como un clasificador de una sola clase, la descripción dada por los datos de los vectores de soporte es capaz de formar una frontera de decisión alrededor del dominio de los datos de aprendizaje con muy poco o ningún conocimiento de los datos fuera de esta frontera. Los datos son mapeados por medio de un kernel Gaussiano u otro tipo de kernel a un espacio de características en un espacio dimensional más alto, donde se busca la máxima separación entre clases. Esta función de frontera, cuando es traída de regreso al espacio de entrada, puede separar los datos en todas las clases distintas, cada una formando un agrupamiento.
La teoría de las Máquinas de Soporte Vectorial (SVM) es una nueva técnica de clasificación y ha tomado mucha atención en años recientes. La teoría de la SVM esta basada en la idea de minimización de riego estructural (SRM). En muchas aplicaciones, las SVM han mostrado tener gran desempeño, más que las máquinas de aprendizaje tradicional como las redes neuronales y han sido introducidas como herramientas poderosas para resolver problemas de clasificación. Una SVM primero mapea los puntos de entrada a un espacio de características de una dimensión mayor (si los puntos de entrada están en Â2 entonces son mapeados por la SVM a Â3 ) y encuentra un hyperplano que los separe y maximice el margen m entre las clases en este espacio como se aprecia en la Figura 1.

Figura 1. La frontera de desición debe estar tan lejos de los
datos
de ambas clases como sea.
Predicción financiera con Maquinas de Soporte Vectorial
La predicción de serie de tiempo en campos dinámicos son aportan grandes contribuciones en muchas disciplinas. El hecho de realizar predicciones de series en el tiempo en el campo financiero, ha sido una tarea difícil, las series de tiempo económicas y financieras a analizar son del tipo estocásticas, ya que estas dependen de un término estocástico que representa a todas aquellas variables difíciles de cuantificar o medir, que perfilan el comportamiento de la serie de manera aleatoria. Sin embargo, se han realizado hipótesis de mercado eficientes y al aplicarlas con técnicas de modelaje con la tecnología reciente, hace que los datos en el tiempo en el ámbito financiero, sean predecibles en cierto grado.
Una serie de tiempo esta compuesta desde el punto de vista de los métodos estadísticos por tres partes:
a) componente de tendencia, variación de
largo plazo en el valor medio.
b) componente estacional, comportamiento cíclico o periodo de la serie.
c) componente aleatoria.
La teoría de aprendizaje estadístico trata con la búsqueda de una función f, que mejor aproxime la respuesta del sistema, esta función recibe el nombre de función objetivo, la cual puede ser obtenida de un conjunto de funciones desarrolladas por una máquina de aprendizaje (LM) siglas en ingles.
El método de los vectores soporte (SV) es un método general para la resolución de problemas de clasificación, regresión y estimación. Las Máquinas de Soporte Vectorial (SVM) se basan en el trabajo de V. Vapnik en 1964 sobre la teoría de aprendizaje estadístico, utilizando el principio de inducción de minimización del riesgo estructural como proceso de inferencia. En los años 90 fue generalizado y en la actualidad es objeto de un gran interés.
Las SVM son sistemas de aprendizaje que usan un espacio de hipótesis de funciones lineales en espacios de rasgos de mas alta dimensión, La idea básica es transformar los vectores de los datos de entrada x en una dimensión dada, en vectores de dimensiones más alta z, donde se puede operar en forma lineal.
Términos Básicos
RNA: Las Redes Neuronales
Artificiales (ANNs de Artificial Neural Networks) fueron originalmente una
simulación abstracta de los sistemas nerviosos biológicos, formados por un
conjunto de unidades llamadas "neuronas" o "nodos" conectadas unas con otras.
Estas conexiones tienen una gran semejanza con las dendrítas y los axones en
los sistemas nerviosos biológicos.
El Primer modelo de red neuronal fue propuesto en 1943 por McCulloch y Pitts
en términos de un modelo computacional de "actividad nerviosa". El modelo de
McCulloch-Pitts es un modelo binario, y cada neurona tiene un escalón o
umbral prefijado. Este primer modelo sirvió de ejemplo para los modelos
posteriores de Jhon Von Neumann, Marvin Minsky, Frank Rosenblatt, y muchos
otros.
Una primera clasificación de los modelos de ANNs podría ser, atendiendo a su
similitud con la realidad biológica:
Los modelos de tipo biológico. Este comprende las redes que tratan de
simular los sistemas neuronales biológicos así como las funciones auditivas
o algunas funciones básicas de la visión.
El modelo dirigido a aplicación. Estos modelos no tienen porque guardar
similitud con los sistemas biológicos. Sus arquitecturas están fuertemente
ligadas a las necesidades de las aplicaciones para las que son diseñados.