Reverberación  y procesado espacial

La reverberación es la suma total de las reflexiones del sonido que llegan al lugar del oyente en diferentes momentos del tiempo. Auditivamente se caracteritza por una prolongación, a modo de "cola sonora", que se añade al sonido original. La duración y la coloración tímbrica de esta cola dependen de:

  1. la distancia entre el oyente y la fuente sonora;
  2. la naturaleza de las superficies que reflejan el sonido.

En situaciones naturales hablamos de sonido directo para referirnos al sonido que se transmite directamente desde la fuente sonora hasta nosotros (o hasta el mecanismo de captación que tengamos). Por otra parte, el sonido reflejado es el que percibimos después de que haya rebotado en las superficies que delimitan el recinto acústico, o en los objetos que se encuentren en su trayectoria. Evidentemente, la trayectoria del sonido reflejado siempre será más larga que la del sonido directo, de manera que -temporalmente- escuchamos primero el sonido seco, y unos instantes más tarde escucharemos las primeras reflexiones (early reflections); a medida que transcurre el tiempo las reflexiones que nos llegan son cada vez de menor intensidad, hasta que desparecen. Nuestra sensación, no obstante, no es la de escuchar sonidos separados, ya que el cerebro los integra en un único percepto, siempre que las reflexiones lleguen con una separación menor de unos 50 milisegundos. Esto es lo que se denomina efecto Haas o efecto de precedencia
 

Cuando manipulamos un reverberador artificial, los principales parámetros son:

Tiempo de decaimiento: se define como el tiempo que tarda el sonido reverberado en disminuir 60 dB (a menudo se denomina TR60). Las salas grandes tienen tiempos largos (un segundo o más), mientras que las habitaciones de una casa tienen tiempos muy cortos (menos de medio segundo).

Retardo de las primeras reflexiones: en salas grandes las primeras reflexiones tardan en llegar más tiempo que en salas pequeñas, pudiendo sonar incluso como una especie de eco.

Intensidad de las primeras reflexiones: está determinada por la distancia del oyente y de la fuente sonora respecto a las superficies reflectantes. Si el oyente o la fuente sonora están junto a ellas las primeras reflexiones sonarán con mucha intensidad.

Manipulando los 3 parámetros anteriores podemos crear la sensación de tamaño del recinto, y de posicionamiento de fuente y oyente dentro de él. Pero además, podemos crear diferentes sensaciones relacionadas con los materiales de las paredes, suelo y techo con parámetros tales como:

Tipo de reverberación: una reverberación tipo hall nos proporciona una coloración diferente que una de tipo plate, o de tipo room. Otros tipos de reverberación como las gete-reverbs o las reverbs no lineales (en las que la intensidad de las reflexiones no se va atenuando a medida que pasa el tiempo) pueden alterar poco la coloración, pero en cambio provocar sensaciones extrañas (ya que son "anti-naturales").

Densidad de las reflexiones: aumenta en función de la cantidad de trayectorias reflejadas que lleguen al oyente (debido a que hay muchas superficies reflectantes (paredes con angulaciones cambiantes, objetos interpuestos en la trayectoria del sonido, paredes de materiales poco absorbentes...).

Absorción selectiva de determinadas frecuencias: puede simularse aplicando una determinada ecualización; la absorción está directamente relacionada con los materiales de las superficies reflectantes (una pared de hormigón reflejará muchas más altas frecuencias que una cortina gruesa, por ejemplo).

Es importante remarcar que cuando uno empieza a utilizar reverberaciones suele hacer un abuso de ellas. La mejor manera de evaluar su efectividad consiste en ajustar el equilibrio entre sonido seco y sonido reverberado (dry/wet) según cremoas apropiado, y a continuación eliminar la reverberación; si "aparecen" detalles o instrumentos que en la mezcla no se oían quiere decir que seguramente estábamos a punto de sobre-reverberar. Para hacer este tipo de escucha es importante configurar el mezclador de manera que en dos canales tengamos la señal seca, en los dos contiguos la señal reverberada, y que el procesador nos entregue 0% de señal original y 100% de procesada.

En los últimos años han aparecido equipos e incluso programas que permiten simular el posicionamiento de una fuente sonora no sólo en un espacio acústico y en un eje horizontal, sino también en el eje vertical, así como simular con credibilidad trayectorias de la fuente dentro de ese espacio. Asímismo, es posible codificar fácilmente una mezcla en formatos envolventes multicanal (Surround).
 

Procesado de dinámica

El margen dinámico de nuestro oído y el que se puede generar a partir de instrumentos acústicos puede alcanzar los 130 dB SPL. En cambio, los dispositivos de grabación no tienen tanto margen: los magnetofones de cinta apenas superan los 60 dB, las tarjetas de sonido domésticas apenas superan los 80 dB, tan sólo algunos de los equipos digitales profesionales permiten una dinámica de 120 dB... Por tanto, en algunas situaciones en la que necesitemos grabar instrumentos acústicos (especialmente una orquesta) necesitaremos comprimir su dinámica (o aprendernos la partitura para subir o bajar faders según haya momentos ppp o fff). Básicamente un compresor atenuará en una determinada proporción (ratio) la intensidad de la señal cuando ésta supere determinado umbral (threshold). Si a partir de determinado nivel no se permite que aumente la intensidad en absoluto, estaremos utilizando un limitador en lugar de un compresor. El limitador es de utilidad cuando resulta imprescindible que una señal de audio no supere un determinado umbral (por ejemplo, en transmisión de televisión, o en grabación digital -aunque en este caso el propio dispositivo de grabación ya realiza la limitación, con los desagradables resultados que todos conocemos-).

Las utilidades más habituales y obvias de los compresores se centran en situaciones en las que es necesario minimizar los cambios de nivel debidos a variaciones de la distancia entre el micro y la fuente sonora, o cuando es necesario grabar sobre un soporte que no permite tanta dinámica como la fuente original -y protegernos contra las saturaciones-, o cuando es necesario suavizar los ataques de fuentes sonoras intensas, o cuando es necesario conseguir una sensación de alta intensidad sonora sin llegar a saturar y distorsionar la grabación (por ejemplo en emisoras comerciales de FM, o en spots publicitarios). Cuando utilizamos la compresión hay que pensar que el nivel de salida del compresor puede ser menor que el de entrada, por tanto tendremos que compensar la salida añadiendo una ligera amplificación. Para eso utilizaremos el parámetro output gain. Por último, hay que ajustar los parámetros de ataque y liberación del compresor: el primero determina el tiempo que el compresor tardará en entrar en acción cuando se haya superado el umbral; el segundo determina el tiempo que el compresor tardará en dejar de actuar cuando la señal haya bajado por debajo del umbral. Hay que vigilar el ajuste de ambos ya que un ataque demasiado corto provocará una pérdida de transitorios en los ataques -y por tanto apagará el sonido, perderá "pegada"- o puede generar "clicks", pero si es demasiado largo es probable que la energía de los transitorios origine una alteración grande de nivel. Si el tiempo de liberación es demasiado corto y la razón de compresión es grande puede aparecer el efecto de "bombeo": la subida abrúpta de graves justo cuando deja de comprimir -porque aún queda un cierto nivel de señal en la cola del sonido, y ésta ya no está siendo comprimida-; si es demasiado largo, puede estar comprimiéndose un ataque que no lo necesita, con la consiguiente pérdida de definición. El oído es quien nos tiene que guiar en última instancia a la hora de ajustar esos parámetros.

Un tipo de compresión que cada vez se utiliza más es la compresión por bandas, de manera que sólo se aplica a determinadas frecuencias (por ejemplo a los graves, o a los 7KHz para reducir la sibilancia o siseo de una voz). Aunque no nos extenderemos en ellos, los reductores de ruido de cinta (Dolby B y C, Dolby SR y  DBX) son sistemas de compresión/expansión selectiva por bandas de frecuencia.

Las puertas de ruido "cierran" el paso de toda señal que no supere un determinado umbral fijado por el usuario. Son muy útiles en situaciones de "directo" en las que hay multitud de micrófonos que pueden captar lo mismo que el principal, y tratamos de que la señal sólo entre por el principal (por ejemplo, en un coloquio en el que casi seguro que sólo habla una persona al mismo tiempo). También nos ayudan a "recortar" todos aquellos ruiditos no deseados que se han colado en una grabación (toses, respiraciones, rozamientos de ropas, ruidos de ambiente), siempre que no se mezclen con la señal principal.
 
Los expansores de dinámica actúan de manera inversa a los compresores. A partir de un determinado umbral expanden el margen dinámico en una proporción fijada por el usuario. Su utilidad puede revelarse especialmente en situaciones en las que la señal original tiene una dinámica demasiado reducida (por ejemplo, en la escucha de un disco de vinilo) y nos interesa tratar de ampliarla un poco, o también puede ayudarnos a restaurar señales grabadas con bajo nivel (aunque necesitaremos aplicar otros procesos adicionales, ya que el expansor por sí solo no bastará).

Cuando necesitemos utilizar varios tipos de procesadores de dinámica hemos de actuar en primer lugar contra los ruidos indeseables (con una puerta de ruido, por ejemplo). Después podemos poner el compresor. Finalmente, a diferencia del uso de otros procesos (reverberación, retardos), no suele tener mucho sentido combinar señal procesada en dinámica con señal seca.

La normalización consiste en transformar la amplitud de la señal tomando un determinado valor como máximo y reajustando en la correspondiente proporción toda la señal. Así, cuando normalizamos a 0, si el valor máximo que tenemos en nuestro archivo es de -10 dB estaremos amplificando toda la señal esa magnitud. El problema más habitual con la normalización es la existencia de ruido de fondo, el cual, mientras está a una amplitud baja no se percibe tan molesto como cuando es amplificado en exceso (la explicación es psicoacústica). A veces será preferible normalizar a menos de 0 dB, o comprimir un poco y aprovechar la ganancia de salida del compresor para aumentar el nivel definitivo. Aumentar la ganancia y normalizar son dos maneras de referirse a una misma operación, aunque en muchas ocasiones empleamos la expresión "normalizar" sólo cuando normalizamos a 0 dB de la escala digital.
 
 

Transformaciones tímbricas basadas en retardos: delay, flanger, chorus...

Eco/Retardo

Cuando las reflexiones de un sonido llegan con retardos superiores a 50 milisegundos respecto de la fuente original aparece lo que denominamos eco. En otros tiempos el efecto de eco se conseguía gracias a los 2 cabezales (grabación y reproducción) de un magnetofón. Inyectando un sonido, grabandolo y reproduciéndolo inmediatamente obtendremos un retardo cuyo tiempo estará determinado por la distancia entre los cabezales y por la velocidad de la cinta (puede oscilar entre 66 i 266 milisegundos). Actualmente los ecos se consiguen mediante retardos digitales (delays) que nos permiten tiempos desde una milésima de segundo hasta 3 ó 4 segundos.

Además del tiempo de retardo, es posible manipular parámetros como:

Regeneración: la señal retardada vuelve a retardarse, con una regeneración al 100% la señal no deja nunca de sonar.

Múltiples líneas de retardo (multi-tap delay): es posible retardar de maneras diferentes pero simultáneas una misma señal (por ejemplo, una línea atenúa progresivamente la señal retardada, otra hace un número fijo de retardos, con una dinámica creciente, y otra hace lo mismo pero con una dinámica y una distribución de tiempos de retardo aleatorias.

Panoramización: permite hacer sonar las repeticiones alternativamente en uno u otro lado del espacio acústico, o ir desplazándolas progresimente en una determinada dirección.

Los retardos no sólo se utilizan para simular eco:

    • Con un retardo muy corto (< 30 milisegundos) y una cierta realimentación alteraremos claramente la tímbrica. El sonido se hará metálico y adquirirá resonancias muy definidas en determinadas frecuencias. Incluso podemos simular acordes a partir de esta opción.
    • Con un retardo entre 20 y 80 milésimas afectamos principalmente a la presencia del instrumento, ya que nos aprovechamos del efecto Haas para "sumar" perceptualmente dos sonidos iguales (y físicamente separados en el tiempo), de manera que podemos generar la sensación de sonido más "grueso", o de multiplicación de instrumentistas.
    • Con retardos mayores de 80 o 100 milisegundos el efecto principal que obtenemos es de tipo rítmico, por tanto -al menos en el caso de músicas con ritmos marcados- hay que ajustar el tiempo de retardo al tempo de la música, para lo cual existen tablas muy útiles o puede valernos la fórmula:

Tiempo de Retardo = 60000 / (BPM x R),
donde R es 1 si el retardo va a negras, 2 si es a corcheas, 4 si es a semicorcheas, etc. Por ejemplo, a 100 BPM y 4/4, si queremos un retardo a semicorcheas (R=4) necesitamos un tiempo de 150 milisegundos.

Flanger
 
Se trata de un filtrado periódico (en forma de peine) de una serie de frecuencias determinada por el tiempo de retardo (por ejemplo, con uno de 0.5 milisegundos realzaremos 2KHz y sus armónicos), aunque explicarlo con palabras es poco efectivo. El origen del flanger es mecánico (hay quien se lo atribuye a George Martin y a John Lennon): si al grabar una cinta en un magnetofón presionamos con el dedo de vez en cuando y con fuerza variable la bobina que entrega cinta originamos micro-frenazos que alteran la señal original. Si grabamos simultáneamente en 2 magnetofones, y en uno aplicamos el "flanging" manual mientras que en el otro no, generaremos el barrido característico del efecto de flanger.

El flanger proporciona efectos más llamativos cuanto más rico (armónicamente hablando) sea el sonido. Cuando le añadimos feedback lo equiparamos a un chorus.
 

Chorus

Se utiliza para "engrosar" la señal, o para simular la existencia de varios instrumentos sonando al unísono. En esta situación, un intérprete puede atacar con cierto retraso  y con cierta desafinación respecto a otro intérprete; eso es lo que trata de simular, de manera compacta, este efecto. Dado que su funcionamiento es similar al del flanger (sólo que la señal que sale se filtra y se realimenta) los parámetros de control también son similares.
 

Distorsión

Transforma en cuadradas las ondas de la señal de entrada. Eso origina que el resultado tienda a ser desagradable y rasposo (ya que la cuadratura de la onda implica que aparezcan armónicos impares).
 

Excitador

También denominado enhancer. Genera armónicos pares -a menudo medios/agudos- de la señal de entrada, de manera que contribuye a hacer más presente esa señal en una mezcla sin necesidad de subir su nivel. También puede utilizarse para generar subarmónicos con el fin de realzar instrumentos de tesitura grave, o de proporcionarles más cuerpo. Finalmente puede utilizarse satisfactoriamente en restauración sonora de vinilos o de grabaciones defectuosas.
 

Transpositor

Inicialmente las transposiciones mecánicas se basaban en alterar la velocidad de reproducción de una cinta respecto de su velocidad en el momento de la grabación (reproduciendo al doble obtenemos una transposición de octava hacia arriba), pero también se alteraba la tímbrica ya que esta transformación no preserva las estructuras de formantes propias de muchos instrumentos (por ejemplo la voz) y de ahí los conocidos efectos de "pitufo" o de "ogro", en los que la voz así procesada poco tiene que ver con la original. Muchos transpositores digitales aún operan en base a esa idea de alterar la velocidad de reproducción, aunque en los últimos años van apareciendo más equipos y programas capaces de transponer, incluso en tiempo real, sin alterar en exceso las características del instrumento. Las utilidades de un "pitch-shifter" comprendend: desafinar ligeramente un instrumento (por ejemplo, convertir un piano "soso" en un "honky-tonk"), engrosar su sonido -con la ayuda adicional de un pequeño retardo-), crear imágenes estéreo a partir de una fuente mono, corregir algunas alturas equivocadas en una interpretación por otra parte valiosa, crear armonías paralelas, o deformar sonidos "naturales" u "originales" para crear nuevos timbres (películas como La caza del Octubre Rojo, Full Metal Jacket, o Terminator 2 contienen interesantes ejemplos de uso del transpositor).

La manipulación de un transpositor implica básicamente escoger un intérvalo de transposición (o varios, en el caso de necesitar crear acordes). Manipulando otros parámetros como el tiempo de retardo y el grado de realimentación podemos llegar a generar arpegios y otros efectos musicales.
 

Transformaciones tímbricas basadas en la estructura de los sonidos. Filtrado.

El dispositivo más utilizado para transformar el timbre de un sonido es el ecualizador. Un ecualizador permite modificar la señal de entrada de manera tal que determinados componentes de su estructura o espectro salen de él atenuados o amplificados. Un ecualizador permite, como máximo, manipular 3 parámetros:

  1. Frecuencia de actuación o central: para determinar sobre qué zona del espectro queremos actuar;
  2. Anchura de banda o factor Q: para determinar la región en torno a la frecuencia central (cuanto más estrecha más precisa será la modificación -pero seguramente será menos evidente-);
  3. Nivel de atenuación/amplificación: para determinar la magnitud en dB que necesitamos realzar o atenuar la banda sobre la que actuamos.

Un ecualizador puede ser:

  • Paramétrico: si permite manipular los tres parámetros anteriores;
  • Semiparamétrico: si la Q está prefijada y sólo podemos alterar los otros dos parámetros (habitual en muchas mesas de mezclas);
  • Gráfico: si consta de un número fijo de frecuencias (8, 15, 31) de actuación, con una Q fija, de manera que tan sólo permite modificar el nivel de atenuación/amplificación (con 31 bandas y una Q de tercio de octava puede ser el típico ecualizador utilizado para ajustar tonalmente una sala).

Las transformaciones que podemos conseguir con un ecualizador no son excesivamente drásticas, aunque nos pueden ayudar a atenuar determinadas frecuencias molestas o exageradamente presentes, a realzar determinadas características tímbricas de una fuente sonora, o, en última instancia, a compensar determinadas deficiencias microfónicas o perceptuales (aunque no debemos poner muchas esperanzas en que nos arregle una deficiente toma microfónica). La EQ no se debe utilizar por rutina o sistema sino en función de los objetivos sonoros o musicales (claridad, equilibrio tonal, énfasis en determinados componentes, etc.).

En una mezcla es importante tratar de plantear siempre en primer lugar una ecualización destructiva (en la que se atenúan determinadas zonas para conseguir el deseado equilibrio tonal) antes que una constructiva (en la que una amplificación excesiva puede originar un aumento del ruido); en lugar de amplificar lo que queremos resaltar podemos obtener el mismo efecto atenuando todo aquello que no nos interesa resaltar. En cambio, en grabación, si es necesario ecualizar deberemos preferir antes una EQ constructiva (que siempre permita volver a atenuar en mezcla) antes que una destructiva (si hemos atenuado algo, difícilmente vamos a conseguir que "reaparezca"); ahora bien, hay que conocer en qué zonas se mueve la energía de los instrumentos para no cometer el error de enfatizar zonas vacías que lo único que hará será aumentarnos el ruido de la grabación. También es importante ecualizar "contextualizadamente", es decir, teniendo presente el resto de fuentes sonoras que van a sonar al tiempo que aquella que tratamos de ecualizar: un instrumento ecualizado puede sonar fantástico cuando lo escuchamos "solo", y en cambio, en la mezcla en la que está incorporado, ser un factor de ensuciamiento o de desequilibrio. La ecualización debe permitirnos también asentar los instrumentos en un espacio espectral "vertical", de forma que cada uno de ellos ocupe un "nicho ecológico" propio y no exista una feroz competencia entre varios.

Junto a los ecualizadores los filtros son otra herramienta importante para alterar la estructura tímbrica de un sonido (de hecho los ecualizadores no son más que filtros especiales). Un filtro nos permite eliminar una determinada banda o margen de frecuencias en torno, por encima, o por debajo, de una cierta frecuencia de trabajo o frecuencia de corte.

Los filtros más habituales son:

  • Pasa-banda: dejan intacta la señal que se halle en torno a una determinada frecuencia central;
  • Pasa-bajos: dejan intacta la señal que exista por debajo de una determinada frecuencia de corte;
  • Pasa-altos: dejan intacta la señal que exista por encima de una determinada frecuencia de corte (por ejemplo, el filtro de 80/100 Hz que habitualmente llevan las mesas de mezcla);
  • Filtros de rechazo de banda o notch: eliminan la señal que se halle en torno a una determinada frecuencia central;
  • Filtros en escalón o shelving: atenúan o amplifican la señal a partir de una determinada frecuencia de corte, pero sin ser tan abruptos como los pasa-altos y pasa-bajos (los controles de graves y agudos de los amplificadores domésticos y algunas secciones de los ecualizadores de una mesa de mezclas suelen ser de tipo escalón);

Además de estas herramientas básicas es necesario tener presente las herramientas de transformación de la estructura tímbrica a partir de procesos de análisis y síntesis, como por ejemplo los porgramas Soundhack, SMSTools, Lemur, etc. Con esta clase de herramientas podemos operar drásticas transformaciones impensables sólo con ayuda de filtros tradicionales. Es posible obtener más información sobre esta clase de aplicaciones a partir de estas páginas:

CTI Music at Lancaster University
Mac programs for computer music
Digital Sound Page
HitSquad