Enlace Local # 1

Enlace Local # 18

“Estimador de Movimiento de Objetos Articulados por Máxima Verosimilitud”

La literatura profesional en el área de estimación de parámetros de movimiento de objetos articulados a partir de una señal de video monocular se puede subdividir en dos grandes grupos. En el primero se estiman los parámetros a partir de las correspondencias establecidas entre bordes o contornos encontrados en imágenes consecutivas. En el segundo grupo se estiman los parámetros de movimiento minimizando las diferencias de intensidad entre imágenes consecutivas.

En la contribución del Doctor Geovanni Martínez Castillo los parámetros de movimiento se estiman maximizando la probabilidad condicional de las diferencias de intensidad entre imágenes consecutivas. Por eso recibe el nombre de Estimación de Movimiento de Objetos Articulados por Máxima Verosimilitud (en inglés: “Maximum-Likelihood Motion Estimation of Articulated Objects”). La probabilidad condicional depende de los parámetros de movimiento, de las diferencias de intensidad y de la matriz de covarianza del error de intensidad. El error de intensidad se supone depende del ruido generado por la cámara y del error de posición ocasionado por los errores de estimación en imágenes anteriores. La matriz de covarianza se calcula modelando tanto el ruido generado por la cámara así como el error de posición mediante procesos estocásticos.

A diferencia de los estimadores descritos en la literatura profesional, en el estimador de movimiento de objetos articulados por máxima verosimilitud si se consideran los errores de posición originados por los errores de estimación en imágenes anteriores. Esto hace que el estimador por máxima verosimilitud sea más confiable y exacto y que pueda recuperarse con mayor probabilidad de esos errores. Resultados experimentales muestran que haciendo uso del estimador por máxima verosimilitud se logra una reducción de hasta un 35% en la varianza del error de estimación.

El estimador por máxima verosimilitud fue desarrollado y aplicado por primera vez para estimar los parámetros que describen el movimiento tridimensional de la cabeza y los hombros de un ser humano, para la codificación de análisis síntesis basada en objetos articulados. La codificación de análisis síntesis basada en objetos articulados fue el resultado de los estudios de Doctorado que realizara el Doctor Martínez en el Instituto de Comunicación Teórica y Procesamiento de Información (Institut fuer Theoretische Nachrichtentechnik und Informationsverarbeitung) de la Universidad de Hannover (Universitaet Hannover), Alemania. Dicha codificación forma parte de la última generación de codificadores para la compresión de señales de videotelefonía a bajos índices de transmisión (menos de 64 mil bit por segundo).

En la codificación de análisis síntesis basada en objetos articulados cada objeto presente en una escena real se representa mediante tres conjuntos de parámetros: un conjunto de parámetros que describen su forma tridimensional, un conjunto de parámetros que describen su movimiento tridimensional y un conjunto de parámetros de color. Los parámetros de color representan los valores de intensidad y crominancia sobre la superficie del objeto. Únicamente los parámetros de forma y movimiento son transmitidos al receptor. Haciendo uso de técnicas de gráfica por computador el transmisor sintetiza una imagen a partir de los parámetros de forma y movimiento transmitidos. Los parámetros de forma bidimensional y los parámetros de color de aquellas regiones de la imagen que no pudieron ser sintetizadas con suficiente calidad son también transmitidos al receptor. En el receptor también se sintetiza una imagen a partir de los parámetros recibidos. Dicha imagen representa la imagen de salida que se despliega en la pantalla del receptor. Según los resultados experimentales obtenidos durante mis estudios de doctorado, con el codificador basado en objetos articulados se pueden comprimir señales típicas de videotelefonía de 2 millones de bits por segundo a 58 mil bits por segundo, esto es, se pueden lograr factores de compresión hasta de 34:1.

El estimador de movimiento de objetos articulados por máxima verosimilitud también fue aplicado con éxito para estimar los parámetros que describen el movimiento tridimensional del brazo derecho de una persona, para la teleoperación de un robot con aspecto humano denominado ROBONAUT (ROBOtic astroNAUT). Dicho trabajo fue el resultado de los estudios posdoctorales, realizados por el Doctor Martínez en la Universidad de Houston (University of Houston) en colaboracion con el Centro Espacial Johnson de la NASA (NASA-Johnson Space Center).

ROBONAUT esta siendo desarrollado en el Centro Espacial Johnson de la NASA para aliviar el trabajo de los astronautas en la exploración y desarrollo espacial. En este tipo de sistema, el ROBONAUT duplicará (imitará) los movimientos realizados por su operador. Si el operador levanta el brazo derecho, así lo hará el ROBONAUT. Y si el operador toma un taladro y empieza a taladrar una pieza, el ROBONAUT deberá duplicar la acción hasta el último detalle. Para ello, se coloca una cámara de video monocular enfrente del operador. Luego, de la señal de video se estiman por máxima verosimilitud los parámetros que describen el movimiento tridimensional del brazo derecho del operador. Finalmente, los parámetros de movimiento estimados son usados para generar y enviar comandos al ROBONAUT para que el mismo duplique los movimientos realizados por el brazo del operador. Resultados experimentales mostraron un error de posición entre la muñeca derecha del operador y la del ROBONAUT de 0.57 ± 0.31 cm

Pagina_principal_ii

Hosted by www.Geocities.ws