Buscar en este blog

viernes, 4 de enero de 2008

SIMULACIÓN 2

OBJETIVO: Implementar un algoritmo que permita disminuir el tiempo de ejecución de la Simulacion 1 efectuada con los métodos normalizados del Template Matching de las librerías de OpenCV.

PROCEDIMIENTO:

Debido a que la comparación "todas contra todas" aumenta considerablemente el tiempo de ejecución de la Simulación 1, es necesario establecer un intervalo de comparación de imagenes que disminuya considerablemente este tiempo. Entonces, partiendo de las diferencias absolutas calculadas entre cada par ordenado (Ai, Mj) de la Simulación 1, interesa conocer en torno de qué valores estas observaciones o estimaciones se agrupan; para lo cual, se hará uso de las medidas de tendencia central que a continuación se describen:

Media: se obtiene sumando las observaciones y dividiendo esta suma entre el total de ellas en el experiemento.

Moda: es la observación que tiene mayor frecuencia.

Mediana: es el dato que se encuentra exactamente a la mitad del conjunto de observaciones.

Partiendo de los resultados de la simulación 1, se ha calculado la media, moda y mediana de las diferencias absolutas con la finalidad de estabecer los límites superior e inferior para realizar la comparación de imagenes.



El resultado del calculo de la media en cada método fue 24, sin embargo, si alguna de las observaciones en su valor es extremadamente pequeña o grande, la media no será el promedio apropiado para representar la distribución de las observaciones. Por lo anterior, al calcular el valor máximo y mínimo del conjunto de observaciones en cada método, se obtuvo que para los tres métodos analizados 43 es el valor mas grande y 0 el valor mas pequeño. Por lo tanto, 24 si es un valor promedio representativo de cada observación en las distribuciones.

Con relación a la moda se tiene que para el Producto Vectorial y la Suma de las Diferencias al Cuadrado el resultado fue unimodal, es decir, un solo valor que representa la moda para esas distribuciones de datos (30 y 18 respectivamente). Sin embargo, el Coeficiente de Correlación tiene un comportamiento multimodal al presentar 17, 18, 23 y 30 como valores de moda. En total, los tres métodos proporcionan el siguiente conjunto modal: (17, 18, 23, 30); de donde se puede concluir que la moda=30 representa el margen de error mas grande al estimar la correspondencia entre las imagenes, y por lo tanto el valor mas conveniente para el intervalo de comparación de imagenes.

En lo que respecta a la mediana, los tres métodos coincidieron en que el valor al centro de la dirtribución es 25.

Por consiguiente, los resultados anteriores muestran que 24, 25 y 30 son posibles valores para el intervalo de comparación entre imagenes.

Como se mencionó con anterioridad, 30 puede ser el valor mas conveniente para el intervalo de comparación ya que contiene a los límites 24 y 25, pero si se preveé que el intervalo se conforme tomando el valor actual menos 30 y el valor actual mas 30, en total se realizarán 61 comparaciones que aumentarán el tiempo de ejecución de la prueba con relación a las 49 o 51 comparaciones si el intervalo es de 24 o 25 respectivamente.

A continuación se muestran los resultados de la simulación actual considerando vecindades de 24, 25 y 30, con un tamaño de template de 320x370 pixeles.

RESULTADOS:










OBSERVACIONES:
Se puede corroborar en la tabla 1 que a medida que aumenta el tamaño de la vecindad en cada método aumenta el tiempo de ejecución de la prueba, sin embargo, en la gráfica de los resultados de la simulación 2 se observa que el Producto Vectorial Normalizado (CCOEFF_NORMED) tiende a aumentar drásticamente el tiempo de la simulación a medida que aumenta el tamaño de la vecindad, es decir, la diferencia en tiempo entre los límites de 24 y 30 es de 00:13:31 minutos.

Consecuentemente, al analizar el tiempo entre los límites de 24 y 30 para los métodos restantes, se tiene que la Suma de las Diferencias al Cuadrado (SQDIFF_NORMED) aumenta 00:11:54 minutos, mientras que el Coeficiente de Correlación (CCORR_NORMED) aumenta 00:09:46 minutos.

Ante estos resultados se podría pensar que el método que mejor comportamiento presenta con respecto al tiempo de ejecución de la prueba es el Coeficiente de Correlación, al presentar el menor incremento entre los límites de 24 y 30, sin embargo, la tendencia de su gráfica muestra que en limites mayores a 30 su tiempo de ejecución aumentará mas que en la la Suma de las Diferencias al Cuadrado, cuya grafica muestra una distribución mas uniforme.

Para la simulación 2 se ha contemplado el cálculo del error de correspondencia en cada una de las comparaciones (ver resultados simulación 2). La sumatoria de los errores de correspondencia se concentra en la tabla 2, y se puede observar que la tendencia del error de correspondencia es a la baja conforme el tamaño de vecindad aumenta (ver gráfica 2). Adicionalmente, se muestra que la Suma de las Diferencias al Cuadrado (SQDIFF_NORMED) es el método que para cualquier tamaño de vecindad presenta el error de correspondencia mas bajo.

CONCLUSIONES:
Con relación al tiempo de ejecución de la prueba ya se mostró que mientras el tamaño de vecindad sea mayor, mayor también será el tiempo; pero definitivamente la Suma de las Diferencias al Cuadrado (SQDIFF_NORMED) es el método que en vecindades grandes tendrá el tiempo mas pequeño. Además, también ha quedado demostrado a través del calculo del error de correspondencia que la Suma de las Diferencias al Cuadrado es el método que mantiene este error en sus límites mas bajos con respecto de los métodos restantes.

En cuanto al tamaño de vecindad, 30 es la mejor alternativa ya que permite dismunuir el error de correspondencia y junto con el método SQDIFF_NORMED presentarán el tiempo de ejecución mas pequeño si el tamaño de vecindad aumenta.