Unidad 3 > Visión por computadora > La substracción de video

3.4. La substracción de video

Pasamos ahora a describir la segunda parte (instrucciones asociadas a la captura de movimiento). Para comprender el funcionamiento del ejemplo siguiente, debemos avanzar en la explicación del algoritmo de captura por substracción de video. Esta captura, tal como fue explicado al inicio, consiste en comparar dos imágenes mediante una operación de substracción en la que se resta, píxel por píxel, el valor numérico correspondiente al color.

Dicha substracción devuelve valores cercanos o iguales a cero, cuando los colores son iguales o cercanos, y valores de mayor diferencia cuando los colores no coinciden. En la imagen (3.3.) se pueden ver, a su vez, dos imágenes arriba, a la derecha la imagen de referencia, que es la escena sin ningún “sujeto de movimiento” y a la izquierda es la misma escena con una niña. Inmediatamente debajo aparece la imagen que se construye con la substracción (cabe aclarar que a la misma se le aplica una función de valor absoluto, que hace que todos los valores sean positivos).

Puesto que los valores de los píxeles casi nunca son exactamente iguales, sino que en el mejor de los casos son muy cercanos, debido al ruido de captación de la imagen y el de la iluminación, es necesario distinguir entre las pequeñas diferencias (que corresponden al ruido) y las grandes diferencias, que pertenecen al sujeto buscado

 

En la imagen 3.3. se aprecian niveles de gris bajo para el fondo, donde no hubo cambios, y niveles de grises claros (altos) en donde
aparece el sujeto. Para realizar dicha discriminación se usa una función de umbral que a partir de un valor discrimina lo que se encuentra por arriba o abajo del mismo. Lo que supere el valor de umbral es señal (movimiento), lo que esté por debajo será ruido.

 

Con este procedimiento se genera una nueva imagen bitonal, que está en la parte inferior de la imagen, que indica en blanco el movimiento y en negro el resto de la escena.

Luego de estas operaciones el proceso concluye con el análisis de los píxeles blancos para determinar el tamaño y posición del sujeto en la escena.

El proceso de captura de movimiento por substracción de video puede realizarse de dos formas en función de cuál es la imagen de referencia con la que se compara la imagen actual. Al primer método lo llamaremos “captura de movimiento por substracción de video con imagen de referencia”. Debajo puede verse un diagrama en el que se representa el flujo de la información. La “imagen fija”, que figura en el mismo, corresponde a una imagen de la escena sin ningún sujeto.

 

Imagen 3.3.



Fuente: elaboración propia

 

Imagen 3.4. Captura de movimiento por substracción de video con imagen de referencia (fondo) prefijada



Fuente: elaboración propia.

 

El otro método es el que llamaremos “captura de movimiento por substracción de video con imagen retardada” (también podemos llamarla “con delay”). La diferencia con el método anterior consiste en que la imagen que se utiliza para comparar con la imagen actual proviene del mismo flujo de imágenes de la cámara pero con un retardo en el tiempo. De esta manera el fotograma que está actualmente ingresando de la cámara es comparado con uno anterior y deja una cantidad fija de fotogramas de retraso en medio.

 

Imagen 3.5. Captura de movimiento por substracción de video con imagen retardada



Fuente: elaboración propia.

 

En la siguiente tabla se pueden observar algunas de las diferencias entre los dos métodos.