6.2. Análisis de la forma de onda digital

A la representación de los sucesivos valores de amplitud en función del tiempo, se la llama representación temporal o forma de onda. En el eje de las ordenadas se representan los cambios de presión sonora/voltaje en valores de amplitud entre un mínimo y un máximo soportados por el sistema. Usualmente la amplitud de una señal se mide en valores normalizados entre -1 y 1, siendo 0 el valor que representa el estado de reposo o silencio también llamado DC (por Direct Current en inglés) en relación con su origen en los sistemas analógicos.

Al trabajar con señales digitales siempre es necesario analizar sus características para poder procesarlas o simplemente reproducirlas de manera adecuada. Se pueden conocer además de su duración, su comportamiento en amplitud, sus cualidades espectrales (componentes en frecuencia), su máxima amplitud en un momento determinado, si fue grabada de manera correcta, etc. A continuación se verán algunas de las técnicas fundamentales disponibles para obtener información sobre las señales digitales de audio.

6.2.1. Amplitud de pico máxima y mínima

De una señal almacenada digitalmente se pueden determinar sus valores máximos y mínimos analizando una cantidad arbitraria de muestras. La amplitud pico es la muestra que contiene el mayor valor de amplitud de la serie, puede ser un valor único o que aparezca repetido en distintos momentos, pero siempre hace referencia al valor máximo que aparece dentro de la cantidad de muestras analizadas. Como la amplitud de la señal se mide desde su estado de reposo (0) hasta su punto máximo de elongación, ya sea positivo (1) o negativo (-1), para determinar la amplitud máxima se toma el valor absoluto de las muestras. La amplitud pico se puede expresar en dBfs o en amplitud normalizada.

Texto aparte

En el audio digital la amplitud máxima que puede tener una señal está definida por la resolución en bits en relación con la SQNR. Es por esta razón que en lugar de emplearse una escala en decibeles ascendente, como en el caso de los dBspl, se emplea una escala descendente que toma como valor de referencia la amplitud máxima que una sinusoide puede adquirir. 0 dBfs es el máximo valor de amplitud soportado por una resolución n de bits y a partir de este la amplitud puede descender hasta el piso de ruido del sistema (tantos dB como la SQNR lo permita).

 

Matemáticamente es importante poder medir las señales periódicas de distintas maneras. Por ejemplo, además de la amplitud pico, dentro de un período se puede medir la amplitud de pico a pico, es decir, la distancia que hay entre el máximo valor positivo y el máximo valor negativo, también se puede medir la potencia según su media cuadrática (como se verá más adelante). Sin embargo, cuando se refiere a la amplitud de una señal acústica generalmente se está refiriendo a su amplitud pico.

 

Analizar la amplitud máxima de una señal es útil para determinar su rango dinámico y poder ajustar proporcionalmente su amplitud. En audio digital, normalizar una señal de audio es un procedimiento que implica determinar la amplitud máxima de la señal y a partir de ella modificar proporcionalmente todos los valores de amplitud, ya sea para atenuar la señal o para amplificarla a un nivel determinado. Un caso particular de normalización, al que comúnmente se refiere simplemente como normalización, implica determinar la amplitud máxima para amplificar la señal al máximo posible sin que ninguna muestra quede fuera de rango. Sin embargo, se puede pretender normalizar distintas señales de audio a un valor de referencia arbitrario, el cual puede atenuar algunas señales y amplificar otras, para luego mezclarlas. Normalizar una señal no es más que escalar su amplitud, es decir, multiplicar la señal por una constante obtenida según el valor de amplitud pico. Para escalar una señal no es necesario determinar el valor máximo, se puede hacer empíricamente subiendo o bajando el volumen, pero normalizar una señal implica tomar un valor como referencia.

En los archivos estéreo o multicanal se normaliza al mayor valor entre todos los canales para evitar que queden muestras fuera de rango. Si se tomara como referencia la amplitud máxima de un solo canal, la cual puede ser menor que en algún otro, al amplificar el resto de los canales podrían quedar muestras fuera de rango o, en el caso inverso, al atenuar el resto de los canales sus señales podrían quedar a cero o un demasiado bajo.

 

6.2.2. Muestras fuera de rango

Cuando la amplitud de una señal muestreada excede los valores máximos que la resolución en bits puede representar, se produce el truncamiento de la señal. Las muestras que quedan fuera de rango pasan a tomar el valor máximo o mínimo. Esto hace que se pierda información que no es posible recuperar luego y, además, cambia las cualidades espectrales de la señal representada, generando distorsión. Temporalmente, la señal se ve con sus picos truncados todos al mismo nivel, espectralmente esta forma de onda genera componentes de ruido que no forman parte de la señal original.

Una manera de detectar muestras fuera de rango es comprobar si existen muestras sucesivas iguales al límite de los valores representables. En un caso extremo como el de una sola muestra a máxima amplitud no es posible determinar si la señal fue truncada o si fue normalizada.

Muchos editores de audio y software para síntesis de sonido representan los valores de amplitud en punto flotante con una resolución de 32 bits por razones de simplicidad y eficiencia. Con esta representación se pueden generar valores que superen el rango -1, 1, pero luego, al exportar la señal en un formato estándar, las muestras que queden fuera de rango serán truncadas. Es posible, sin embargo, guardar los valores de amplitud con una resolución de 32 bits, pero en alguna etapa posterior, según el medio de reproducción usado, debe normalizarse la señal para que no se produzca el truncamiento.

6.2.3. Desviaciones del DC

DC es el acrónimo en inglés de Direct Current que refiere al estado de reposo del sistema. En la representación digital de una señal de audio el DC equivale al silencio, es una señal constante de amplitud cero. Debido al mal funcionamiento de un micrófono, una placa de audio o como resultado del procesamiento de una señal, pueden producirse desviaciones del DC, llamadas en inglés DC offset o DC bias. Estas desviaciones hacen que toda la señal quede desplazada con respecto del cero.

Las desviaciones del DC son indeseables por varias razones. Por un lado, acotan el rango dinámico posible de la señal, si quisiéramos normalizar una señal con DC offset los valores de amplitud pico registrados serían mayores a los de una señal sin corrimiento. Por otra parte, una señal desplazada del punto de reposo genera clicks al ser mezclada con otras señales o al comienzo de su reproducción. En cuanto al funcionamiento de los aparatos eléctricos, una señal con DC offset hace que el sistema no funcione dentro de sus valores de operación, lo que puede deteriorar el equipamiento o la calidad del audio.

Espectralmente una señal con desviación del DC contiene energía en 0 Hz. Temporalmente esto se puede entender como si hubiera un movimiento oscilatorio de frecuencia cero. Incluso debido a oscilaciones de baja frecuencia (próximas a 0 Hz) se produce un desvío del DC que varía lentamente.

Para determinar si una señal está “balanceada” respecto del DC, es decir que no hay desviaciones del DC, lo que se hace es tomar el valor promedio de todas las muestras analizadas, el cual debe ser igual (o muy próximo) a cero. Esto es porque los semiciclos de un movimiento oscilatorio cambian de signo al pasar por el estado de reposo.

Debido a estas características, para eliminar las desviaciones del DC se pueden emplear dos métodos distintos según resulte más conveniente para el procesamiento. Si disponemos de la totalidad de la señal, se puede comprobar si la señal está balanceada obteniendo el promedio de sus valores de amplitud, si este difiere de cero, el valor obtenido se toma como la cantidad de desplazamiento con respecto al DC que debe ser restado a todos los valores de la señal. Otra manera de cancelar las desviaciones del DC, que es útil cuando se producen en partes de la señal, pero no en toda o si estamos procesando sonido en tiempo real, es emplear un filtro pasa altos que atenúe la energía presente cercana a los 0 Hz.

6.2.4. Potencia RMS

La amplitud promedio de una señal se mide como potencia RMS (por Root Mean Square en inglés). En castellano a esta medida se la denomina media cuadrática, sin embargo está muy difundido en ingeniería de sonido, como sucede con la mayoría de los términos que se vienen utilizando, el empleo de su denominación anglosajona. Su nombre es una síntesis de las operaciones matemáticas que se realizan para obtener dicho valor. Su traducción del inglés sería algo así como “raíz cuadrada del promedio de los cuadrados [de las amplitudes]”.

La potencia RMS se emplea en matemáticas e ingeniería eléctrica para calcular la magnitud de un movimiento oscilatorio, el cual contiene tanto valores positivos como negativos. La potencia RMS es una medida estadística útil puesto que refleja de manera más homogénea la relación de energía entre distintas señales sin verse afectada por sus formas de onda particulares.