2.5. Percepción de altura

De manera análoga a la sonoridad, la altura es el atributo perceptual que nos hace diferenciar dos señales de igual sonoridad, pero distinta frecuencia. Si bien se relaciona con la frecuencia, interactúa también con la sonoridad y el timbre de una manera compleja.

2.5.1. Limen de frecuencia

El limen es la DAP (Diferencia Apenas Perceptible) en frecuencia. Se obtiene con juicios de oyentes que son expuestos a estímulos sucesivos de igual frecuencia, uno de ellos queda invariante en frecuencia, mientras que el otro se va modificando gradualmente hasta que el oyente determina que la altura de ambos estímulos es distinta.

Se observó mediante experimentación que la DAP varía de acuerdo con la frecuencia del estímulo invariante. De manera general, para sonidos sinusoidales, la DAP en frecuencia se mantiene cercana a 1 Hz si se usan estímulos por debajo de 1000 Hz y crece gradualmente a partir de allí. Por ejemplo, para diferenciar la altura de dos señales cercanas a 4000 Hz, necesitamos que exista, al menos, una diferencia aproximada de 10 Hz entre ellas. Por encima de 5000 Hz, la DAP aumenta más rápidamente, indicando que necesitamos montos de cambio de frecuencia (DF) aun mayores a 10 Hz para diferenciar la altura de los dos estímulos. Más arriba de los 10000 Hz, nuestra habilidad para discriminar la altura entre señales acústicas de diferentes frecuencias es prácticamente nula.

Usando como estímulo señales con varios parciales ordenados armónicamente (es decir cuyos parciales tienen frecuencias en relaciones de múltiplos enteros del más bajo), nuestra habilidad de discriminación en altura es muy superior, pudiendo detectar diferencias de hasta 0.1 Hz. Esto explica, por ejemplo, que los instrumentos musicales (para música basada en sus comienzos, principalmente en la discriminación de frecuencia), se hayan diseñado para producir sonidos con espectros de tales características.

 

2.5.2. Bandas críticas

A los efectos de analizar el contenido espectral de una señal sonora, el sistema auditivo la divide en regiones llamadas bandas críticas. Esto produce varias consecuencias importantes tanto en la discriminación de estratos sonoros, como en la percepción de la sonoridad de la señal involucrada.

Una banda crítica funciona como una especie de filtro pasa-banda de ancho determinado, que utiliza nuestro sistema auditivo para analizar una región del espectro de la señal sonora.

Existen dos conceptos fundamentales relacionados con las bandas críticas:

Frecuencia Central (FC): la frecuencia que está en el centro de la BC de análisis..
ERB: la extensión de la BC a ambos lados de la FC. Su nombre viene de Ancho de Banda Rectangular Equivalente (del inglés Equivalent Rectangular Band).

Ambas, FC y ERB, se miden en Hz y no son fijas, sino que se desplazan y varían en ancho de acuerdo con su frecuencia central.

El cálculo para la ERB, según Glasberg y Moore (1990), es el siguiente:

ERB = 24.7 (0.00437 f + 1)

donde f es la FC de la banda en Hz

La aplicación de la fórmula anterior a diversas frecuencias produce:

FC=100.00 Hz        ERB = 35.49 Hz
FC =200.00 Hz       ERB = 46.29 Hz
FC =500.00 Hz       ERB = 78.67 Hz
FC =1000.00 Hz     ERB = 132.64 Hz
FC =2000.00 Hz     ERB = 240.58 Hz
FC =5000.00 Hz     ERB = 564.39 Hz
FC =10000.00 Hz   ERB = 1104.09 Hz

Obsérvese que, como era de esperarse, el ERB crece paulatinamente en función de la FC. Tal crecimiento no es proporcional, por ejemplo, en el caso de FC=100 Hz el ERB es igual aproximadamente a un 30 % de FC y, en el caso de FC=10000 Hz, el ERB es igual aproximadamente a un 10 % de FC.

 

Un importante fenómeno de percepción sonora vinculado con las bandas críticas es el llamado enmascaramiento. Cuando dos señales (una llamada señal enmascarada y la otra señal máscara esta última de igual o mayor intensidad que la primera) se presentan simultáneamente, y las frecuencias de ambas caen dentro de la misma banda crítica, la señal Máscara dificulta la audibilidad (“enmascara”) de la señal enmascarada.

En la actualidad se sabe que el enmascaramiento ocurre también fuera de la banda crítica, pero en una proporción menor. También, que no solo se produce entre los distintos componentes de una señal sonora, sino entre señales sucesivas. Tanto el enmascaramientosimultáneo, como sucesivo, son una función de la relación de frecuencia entre la señal máscara y la enmascarada y sus intensidades relativas.

Texto aparte

Las técnicas de compresión de señales digitales de audio denominadas lossy (a pérdida) tales como MPEG Layer 3 (denominada comúnmente MP3) son aplicaciones destacables del fenómeno del enmascaramiento. Básicamente, funcionan con la supresión o representación de menor calidad de aquellos parciales que se encuentren severamente enmascarados, por considerarlos información “redundante”. Naturalmente, esto produce un ahorro de recursos de almacenamiento digital al costo de una disminución de la calidad.

Otro aspecto importante que está relacionado con las bandas críticas es su relación con la percepción de la sonoridad de una señal acústica de espectro complejo y las posibilidades de modificación de esta a través del agregado de más parciales. En general, puede decirse que para una cantidad de energía dada, la sonoridad es mayor si la energía se reparte sobre distintas bandas críticas, en vez de que si se concentra en una sola de ellas.

Lo antedicho tiene muchas e importantes consecuencias en la práctica musical como en la ingeniería de audio. Por ejemplo, que las señales sonoras de banda ancha tienden a percibirse como de mayor sonoridad. Los buenos intérpretes saben sacar partido de esto último cuando, al no poder aumentar más la intensidad, aumentan la sensación de sonoridad a través de producir sonidos más “brillantes” (por ejemplo, de banda más ancha). Otro ejemplo lo constituye la “duplicación en octavas” de una nota, que es mucho más eficaz que la duplicación al unísono por las razones que se explicaron (la duplicación en octavas, reparte la energía en diferentes bandas, mientras que la del unísono no lo hace).

2.5.3. Altura tonal y temperamento igual

La altura tonal ha sido definida como “aquel atributo de la sensación auditiva en términos del cual los sonidos pueden ser ordenados en una escala musical” (American Standards Association, 1960).

Para poder percibir la altura tonal, es necesario que una señal sonora tenga un espectro tónico, en el sentido en que se pueda identificar su altura fundamental. De manera análoga a la sonoridad, las variaciones de altura tonal se perciben como proporcionales a los cambios de frecuencia. Existen, sin embargo, algunas particularidades.

En la notación (y en mucha de la teoría) de la música occidental se asume la llamada “identidad de octava”. Por esta asunción, un sonido cuya frecuencia es del doble o la mitad que la de otro es considerado “el mismo sonido, transportado una octava hacia arriba o hacia abajo”, respectivamente. Este es el origen de las notas musicales y el denominado “temperamento igual”. El temperamento igual consiste en la división de la octava en 12 partes consideradas perceptivamente como iguales. Se toma como referencia el llamado LA Central, o La 440, porque
corresponde a un LA de 440 Hz. Los doce grados cromáticos o doce notas, en notación latina, son:

DO DO# RE RE# MI FA FA# SOL SOL# LA LA# SI

A la diferencia de altura entre dos grados cromáticos sucesivos se la denomina semitono. Por ejemplo, entre DO y DO# hay un semitono y entre DO y SOL hay 7 semitonos.

En virtud de la equivalencia de octava, este sistema es módulo-12, quiere decir que es cíclico, con un ciclo igual a 12. Para obtener la frecuencia de cualquiera de las notas, se puede usar la siguiente ecuación:

f= 440 * 2S/12

En donde f es la frecuencia que se desea obtener y S es la cantidad de semitonos ( grados cromáticos) hacia arriba o hacia abajo del LA central.

La frecuencia de un DO debajo del LA central se obtiene:
f= 440 * 2-9/12 = 440* 2-0.75 =440*0.59946=261.6 Hz

Para hacer referencia a una nota en particular dentro del sistema temperado, se usa su nombre y un índice acústico que indica la octava a la que pertenece. Existen varios índices acústicos, pero uno de los más corrientemente utilizados es el que establece el índice de 4 para el “Do Central” (llamado índice registral internacional). De acuerdo con este índice, el “La 440” (de 440 Hz) se denominaría La4. Pero en la música por computadoras, la Norma MIDI (Musical Instruments Digital Interface), utiliza el índice 5 para indicar el Do central (es decir, usa el llamado índice registral de Riemann).

Actividad 4

Partiendo de un DO5 (de acuerdo con el índice registral internacional), calcule las frecuencias del mismo y de los 11 grados cromáticos que le siguen hasta el DO6.