Unidad 3 > Visión por computadora > La substracción de video

3.4. La substracción de video

Pasamos ahora a describir la segunda parte (instrucciones asociadas a la captura de movimiento). Para comprender el funcionamiento del ejemplo siguiente, debemos avanzar en la explicación del algoritmo de captura por substracción de video. Esta captura, tal como fue explicado al inicio, consiste en comparar dos imágenes mediante una operación de substracción en la que se resta, píxel por píxel, el valor numérico correspondiente al color.

Dicha substracción devuelve valores cercanos o iguales a cero, cuando los colores son iguales o cercanos, y valores de mayor diferencia cuando los colores no coinciden. En la imagen (3.3.) se pueden ver, a su vez, dos imágenes arriba, a la derecha la imagen de referencia, que es la escena sin ningún “sujeto de movimiento” y a la izquierda es la misma escena con una niña. Inmediatamente debajo aparece la imagen que se construye con la substracción (cabe aclarar que a la misma se le aplica una función de valor absoluto, que hace que todos los valores sean positivos).

Puesto que los valores de los píxeles casi nunca son exactamente iguales, sino que en el mejor de los casos son muy cercanos, debido al ruido de captación de la imagen y el de la iluminación, es necesario distinguir entre las pequeñas diferencias (que corresponden al ruido) y las grandes diferencias, que pertenecen al sujeto buscado

En la imagen 3.3. se aprecian niveles de gris bajo para el fondo, donde no hubo cambios, y niveles de grises claros (altos) en donde
aparece el sujeto. Para realizar dicha discriminación se usa una función de umbral que a partir de un valor discrimina lo que se encuentra por arriba o abajo del mismo. Lo que supere el valor de umbral es señal (movimiento), lo que esté por debajo será ruido.

Con este procedimiento se genera una nueva imagen bitonal, que está en la parte inferior de la imagen, que indica en blanco el movimiento y en negro el resto de la escena.

Luego de estas operaciones el proceso concluye con el análisis de los píxeles blancos para determinar el tamaño y posición del sujeto en la escena.

El proceso de captura de movimiento por substracción de video puede realizarse de dos formas en función de cuál es la imagen de referencia con la que se compara la imagen actual. Al primer método lo llamaremos “captura de movimiento por substracción de video con imagen de referencia”. Debajo puede verse un diagrama en el que se representa el flujo de la información. La “imagen fija”, que figura en el mismo, corresponde a una imagen de la escena sin ningún sujeto.

Imagen 3.3.

Fuente: elaboración propia

Imagen 3.4. Captura de movimiento por substracción de video con imagen de referencia (fondo) prefijada

Fuente: elaboración propia.

El otro método es el que llamaremos “captura de movimiento por substracción de video con imagen retardada” (también podemos llamarla “con delay”). La diferencia con el método anterior consiste en que la imagen que se utiliza para comparar con la imagen actual proviene del mismo flujo de imágenes de la cámara pero con un retardo en el tiempo. De esta manera el fotograma que está actualmente ingresando de la cámara es comparado con uno anterior y deja una cantidad fija de fotogramas de retraso en medio.

Imagen 3.5. Captura de movimiento por substracción de video con imagen retardada

Fuente: elaboración propia.

En la siguiente tabla se pueden observar algunas de las diferencias entre los dos métodos.

Boletin Board System, eran sistemas de noticias, descarga de archivos y mensajería. Estos sistemas funcionaron desde mediados de la década de 1980 hasta los albores del 2000, cuando fueron totalmente reemplazados por Internet. Si bien, en un principio funcionaban como repositorios de programas e información técnica (electrónica, informática, etc.), rápidamente comenzaron a ser utilizados por el público en general, ávido de la posibilidad de utilizar la mensajería que estos sistemas proveían. La red Fidonet, una de las primeras redes mundiales amateur de distribución de mensajes, fue un claro ejemplo de la necesidad colectiva de conexión y comunicación, presente en los cinco continentes y con "nodos" en prácticamente todos los países del mundo. La red consistía en computadoras con módem de los participantes que se ponían a disposición de la comunidad, y atendían el teléfono de forma automática, en determinados horarios.