Compresión

Existen dos tipos de razones por las que la industria de los media recurre al proceso del nivel de intensidad de audio y como consecuencia se crea una tensión hacia su incremento paulatino. Unas se deben a la muy asilvestrada calidad de los dispositivos comerciales, así como a las condiciones de escucha en que nos obligamos a consumir productos audiovisuales. Las otras se relacionan con distintas cuestiones de naturaleza psicoacústica. Una forma de evaluar la calidad de un instrumento reproductor de sonido es la medida en que su empleo proporciona una experiencia de escucha coincidente con la realidad. Cuanto más difícil resulta distinguir entre fuente sonora real y virtual, mayor se considera la calidad del equipo. En términos generales, a mayor calidad, mayor fidelidad, o incluso mejor, precisión, lo que en definitiva está en relación directa con la cantidad de detalles que los micrófonos son capaces de captar y los altavoces, de reproducir. Algo que en el estudio de grabación se escucha con todo detalle no es igualmente apreciable en un pequeño receptor de radio o de televisión, aunque tampoco lo es en los altavoces de un equipo convencional de alta fidelidad ni en los de un teléfono móvil o cualquier otro producto de audio del mercado. En esencia, la diferencia de calidad está en la capacidad de precisión en los límites dinámicos; en lo más fuerte y en lo más flojo que los sistemas de grabación pueden registrar y los de reproducción, reproducir. Sensibilidad y precisión van unidas de la mano : si la sensibilidad a las vibraciones mecánicas de las membranas y los circuitos transductores de los micrófonos es esencial para la precisión de los registros analógicos o digitales, la sensibilidad de membranas y otros componentes de los altavoces a la información registrada o generada en vivo es esencial para la precisión con que sus movimientos provocarán las variaciones de presión aérea que estimulan el oído y llamamos sonidos. En virtud de las diferencias de sensibilidad y precisión entre los distintos equipos de audio disponibles en el mercado, el rango de variación de las condiciones de escucha de cada uno de los posibles consumidores de un cierto producto audiovisual es enorme. Por ello, los productores involucrados en empresas y procesos de producción cuyo objetivo es el acceso a grandes audiencias, se sienten obligados a tener en consideración esa gran variabilidad. Algunos, incluso, con el objetivo de asegurarse de que cualquier consumidor escucharía todos los detalles de una grabación en el mayor número de escenarios posible y así alcanzar su más amplia difusión, han llegado a acudir a los estudios con altavoces de calidad mínima, para conectar a la salida de los instrumentos profesionales durante la última fase de los procesos de mezclas y masterización y así constreñir el resultado final de su trabajo a la escucha del producto en esas condiciones límite. Esa forma de proceder, supuestamente orientada a la facilidad del acceso de los productos audiovisuales a un mayor número de personas, también contribuye en su uniformización, porque el sacrificio de la expresividad de los contenidos sonoros reduce dramáticamente el campo de posibilidades formales.

Conviene además poner en cuestión si la constricción de los niveles de intensidad es una estrategia conveniente al objetivo que se desea cumplir, es decir, esa mayor accesibilidad de los productos audiovisuales. De entrada, las características sonoras originales se ven seriamente alteradas por esos procesos, con lo que ya solo por ello sería discutible que realmente se facilitara el acceso de los productos a la mayoría. Por otra parte, las prácticas de retocado dinámico tienden a hacer inútiles los equipos de buena calidad y así contribuyen en desincentivar su compra, lo que necesariamente debe traducirse en el aumento de la diferencia de precios entre los equipos de mala y buena calidad. A la larga, todo ello junto podría llegar, no tan solo a un incremento insoportable de los niveles de audio, sino también, a substanciarse en una disminución de las exigencias estéticas de la población. Desgraciadamente, el peligro es aún mayor, pues la automatización del comportamiento de los niveles de intensidad de sonido supone un aprendizaje de la inconsciencia de la escucha e, incluso, una vuelta de tuerca en el estímulo de la inconsciencia pura en todos los dominios de la experiencia cotidiana. Si la calidad de los recursos técnicos empleados en la toma y la reproducción electrónicas de sonido no es altísima o, en el caso de que sí, el ajuste de volumen es comparable al de la fuente real, del sonido de un instrumento musical, de la voz de un cantante o de un locutor, acostumbramos a escuchar solo aquellos componentes considerados de interés significativo. Habitualmente, la información sin interés sufre un proceso de ocultación, de manera que no se acostumbra a percibir en toda su dimensión. No es que esos contenidos no formen parte indisociable de los sonidos instrumentales, de la propia voz, o de cualesquiera sonidos que nos atraigan la atención. Una razón de que ello ocurra así es que los pequeños errores y otras informaciones generalmente consideradas irrelevantes o indeseadas quedan muy corrientemente enmascaradas por la información significativa, de niveles de intensidad de sonido sensiblemente superiores. A lo largo de la historia nos hemos aplicado en el aprovechamiento de aquellas características sonoras de apariencia más adecuada a la naturaleza de nuestro sentido del oído. Por otra parte, conviene tener muy en cuenta que la integración cognitiva de las informaciones suministradas por la percepción tiende a redirigir la atención sólo a lo que interesa en función del contexto particular de escucha y que, de resultas de ello, la imagen de cualquier información procedente de los sentidos llega a la consciencia profundamente retocada, ya no únicamente por las características psicofísicas del sistema nervioso, que actúa a modo de filtro, sino también por el propio sistema cognitivo, cuya arquitectura, a lo largo de la historia de las sociedades humanas, ha venido siendo directamente condicionada por los usos sociales y culturales. Sin embargo, en ocasiones, cuando los medios técnicos lo permiten y el nivel de intensidad de sonido de esa información tradicionalmente de relevancia para la integración de los discursos sonoros se hace suficientemente baja o nula, como ocurre en las pausas y las respiraciones, o cuando los niveles de intensidad de sonido crecen más allá de su nivel original, como por ejemplo a causa de la mediación de instrumental electrónico, los sonidos tradicionalmente ajenos al foco de interés pueden ponerse de manifiesto y ello acostumbra a resultar un inconveniente grave para la mayoría de los productos audiovisuales. Todo el mundo ha comprobado alguna vez que tales cosas ocurren al accionar sin demasiada atención la perilla del volumen de un equipo de sonido. Si el volumen sube mucho, la reacción habitual a la desnaturalización del sonido consiste en devolver el comando a su posición anterior. Pero el control manual no siempre es tan fácil. Por ello, el proceso automático de la intensidad de sonido tiene ya muchas décadas de historia. Cuando el volumen se experimenta demasiado bajo, conviene incrementar el nivel, mientras que si está muy alto, es necesario bajarlo. La necesidad de constreñir los límites de volumen es muy habitual. El método más extendido entre los procesos de constricción de los márgenes dinámicos con la finalidad de adecuar la señal de audio a las características de los altavoces y los equipos de sonido, consiste, en términos generales, en la limitación progresiva de las zonas próximas a los puntos donde se excede un nivel que se fija arbitrariamente como umbral, y en la ganancia del nivel de intensidad de la señal a lo largo de toda su duración. De esa forma, es posible conseguir que el nivel de la señal no sobrepase el valor umbral, al tiempo que aumenta sus mínimos y, con ello, la probabilidad de que la señal entera supere un cierto valor arbitrario. Esa transformación, unas veces llevada a cabo tanto por circuitos de hardware y otras, por algoritmos especiales, recibe el nombre de compresión, ya que de la distancia entre los niveles máximo y mínimo a lo largo de la duración, al ser menor que la de la señal original, se dice que está comprimida.

Así es como los sonidos de nivel original inferior al que podría estimular el movimiento de las membranas de unos altavoces mediocres, por medio del incremento automatizado de su nivel de intensidad, terminan también siendo reproducidos sin problema.

Similarmente, se aplica compresión cuando a causa de algún tratamiento electrónico, como por ejemplo la manipulación de los controles de ganancia, el nivel de intensidad puede crecer más allá del máximo codificable por los sistemas de audio. Si eso ocurriera, las partes de la señal que excedieran ese valor resultarían mutiladas. Sería algo parecido a lo que ocurre cuando por un tubo cilíndrico rígido se intenta hacer pasar una figura que excede su diámetro en algún punto de su contorno. Si se consiguiera embutir la figura en el tubo y así hacerla pasar, al llegar al otro extremo, solo aquellas partes que no excedieran el diámetro conservarían la forma original. Las que la excedieran quedarían completamente recortadas y adquirirían la forma de la pared que no habría permitido su paso sin deformación. La profunda alteración de la composición interna de los sonidos debida al recorte de sus puntos más energéticos se traduce en una transformación del sonido que, si, como es bien sabido fue a veces deseada en tiempos de la tecnología analógica, con los equipos digitales casi siempre es desagradable a la mayoría de personas. Si así ocurre, se dice que el sonido está saturado. Con una compresión automática o un proceso dinámico de la misma familia, como la limitación, que dificulte o impida la superación del umbral superior, desaparece la saturación y, con ella, los efectos añadidos indeseables.

La compresión se ha revelado útil en muchas situaciones; por ejemplo, cuando el nivel de intensidad de sonido ambiental es alto, como en el interior de la cabina de un automóvil, donde la escasa audibilidad de los sonidos de nivel de intensidad similar al del sonido ambiental obliga al conductor a accionar la perilla del volumen para incrementarlo y así escuchar en condiciones. Sin embargo, al llegar pasajes fuertes, el sonido alcanza niveles atronadores, y surge nuevamente imperiosa la necesidad de perder un tiempo precioso en la manipulación de la perilla de volumen, esta vez, en el sentido contrario. Es peligroso e incómodo. Igualmente ocurre en el interior de un avión, en una oficina donde varias personas a un tiempo usan el teléfono, imprimen documentos, o conversan entre ellas, en un taller con máquinas en funcionamiento, en un bar, cualquier otro espacio público donde coexista una densa población de sonidos o incluso por la noche, cuando no es deseable subir demasiado el volumen de los equipos de sonido, a menos que el descanso del vecindario no sea una prioridad. En todas esas ocasiones y en otras cualesquiera de índole comparable, la compresión parecería indicada.

Sin embargo, los circuitos y los algoritmos de compresión, que no se caracterizan por su inteligencia, como no distinguen entre las señales de interés y las completamente irrelevantes, al procesar señales irrelevantes de baja intensidad incrementan el nivel de la misma forma que si tuvieran interés, con lo que aquellos sonidos indeseados pero antes ocultos brotan de súbito y contaminan la experiencia de la escucha hasta el punto de dificultar su disfrute.

Un remedo a esa nueva situación consiste en impedir el paso de los pasajes de señal de audio que no superan un determinado umbral antes de someter el material sonoro a compresión, de manera que los materiales ruidosos demasiado bajos, como el ruido de fondo o el soplo de las cintas magnéticas, nunca llegan a ser comprimidos. Para eso son las puertas de ruido, que se emplean en el bloqueo de la información indeseada en contextos donde el nivel mínimo de las informaciones de interés se mantiene suficientemente alto con respecto del de las que no tienen ninguna significación. No debería escapársele a nadie que esas herramientas destruyen detalles importantes de los discursos sonoros -el musical, particularmente-, cuando en los niveles de audio bajos coexisten elementos con significación estética o de otra índole, ya que, como la distinción es sólo cuantitativa y no cualitativa, igual que en la compresión, no tienen en cuenta la naturaleza de lo que eliminan.

Los efectos de la compresión se complican con el empleo de compresores multibanda, que en lugar de afectar por igual a todo el espectro de los sonidos, los comprimen de distinta forma según sus bandas espectrales. Es cierto que estos equipos han ido obteniendo paulatinamente mejores prestaciones : más rango dinámico, respuestas de frecuencia más planas, menos distorsión y saturación. Sin embargo, el atributo quizá más apreciado de las grabaciones de los años 60, la plenitud y lo compacto de las envolventes del sonido, no tienen nada que ver con la trasparencia de las tecnologías que se empleaban entonces. De hecho, el gran rango dinámico, la limpieza y la baja distorsión de los nuevos equipos no es demasiado conveniente a según qué productos musicales, como el rock, donde, a falta de otras transformaciones que los compensen, lo compacto del sonido y su plenitud quedan muy afectadas por la transparencia y la precisión, que, además, dan paso a la emergencia de los accidentes técnicos, incluso estéticos, antes enmascarados por el soplo de las cintas y la propia distorsión. Es posible en todo ello encontrar explicaciones a la preferencia del público y los músicos por el vinilo sobre el CD en la primera época de la era digital. Mientras que la saturación de la continuidad analógica fue un efecto muy apreciado por su sintonía estética con ciertos contextos musicales, como el de la música rock, y buscado activamente por los músicos pop rock hasta el punto de llevar a la industria a concebir circuitos que la simularan, así como a considerar la construcción de amplificadores a válvulas en la madurez de la era del transistor, la saturación de la discontinuidad digital, excepto en el glitch y otros estilos del noise, ha sido por muchos considerada especialmente extraña al discurso musical y muy desagradable. ¿Será que, de alguna manera, el oído distingue en clave estética lo que creemos infinitamente suave de lo claramente fragmentario o será, más bien, que para cada época tecnológica surgen formas distintas de aprovechamiento estético de los límites? En la mayoría de textos dedicados a la guerra del volumen, la compresión y otras preparaciones de los productos musicales para su consumo masificado, intriga el contraste entre la positividad en las valoraciones de la saturación analógica con la negatividad que se atribuye a la saturación digital. Si la esencia de una es la suavidad, la de la otra es la aspereza; pero las bellezas de Sculpture de Silence, Corneille, de Jean Arp, y de Nu descendant un escalier, de Marcel Duchamp, no son comparables ni parece haber razón objetiva en la preferencia de la una por la otra. Siento con particular convicción que las preferencias individuales dependen en enorme medida de los consensos culturales con los que cada uno se relaciona. Sospecho que, como mínimo, existen tantos estilos musicales que aprecian la tan denostada saturación digital como los que, en su momento, buscaron la saturación analógica. La búsqueda estética de situaciones límite, como la saturación, donde la aspereza intrínseca de la discretización se manifiesta en toda su crudeza, parece plenamente congruente con el espíritu de la era digital. De manera similar podría argumentarse acerca de la coherencia del gusto por la saturación analógica con la naturaleza del medio tecnológico del que depende.

A pesar de que la eliminación de efectos secundarios debidos a la compresión y la máxima transparencia del sonido son objetivos fundamentales del diseño de las generaciones de compresores multibanda posteriores al cambio de milenio, de su empleo excesivo e indiscriminado pueden surgir nuevos y muy diversos artefactos y aberraciones. Se trata de recortes agresivos de la forma de onda, aparición de componentes de frecuencia fantasmas, compresiones y limitaciones excesivamente rápidas. Todo ello puede dar lugar a extrañas sensaciones, como pérdida de la profundidad espacial, aumento de la densidad de sonido, inconsistencia tímbrica, reducción excesiva del panorama estereofónico y una larga retahíla de efectos que es ahora ocioso enumerar. En realidad, no siempre es la compresión en sí lo que arruina los sonidos. El espectro, una de las propiedades físicas que se traducen en las sensaciones de coloración de los sonidos y que, por tanto, intervienen en su distinción y reconocimiento, sufre afectaciones muy variadas según las bandas espectrales sobre las que actúa la compresión, de manera que los sonidos pueden ser percibidos con coloraciones aberrantes o inconsistentes, especialmente en aquellas zonas de la señal donde, a causa de superar el umbral de compresión, el procesado de rango dinámico inicia o termina su transformación. La limitación, por su parte, si es rápida, lo que se resuelve en una actuación excesivamente agresiva sobre los picos de la señal, genera componentes espectrales nuevos y especialmente aparentes en las bandas medias y altas del espectro sonoro. Esos errores, además, se acumulan si los sonidos que los contienen son sometidos a procesos de transmisión de datos, especialmente, si la tasa de transferencia de los algoritmos de codificación es baja. En esas condiciones, la señal se puebla de elementos extraños.

Ya cuando los primeros compresores fueron diseñados, era de esperar que su acción tuviera gran influencia sobre el comportamiento dinámico de los productos audiovisuales, tanto localmente como a lo largo de toda su duración. También llamado dinámica, el comportamiento dinámico es la forma que a lo largo de un tiempo dado toman los niveles de intensidad de un sonido o un conjunto de ellos. Es claro que el contenido del que los sonidos son vector -melodías, secuencias de acordes, textos, entonaciones, palabras, sílabas, etc.- constituye por sí solo estímulo suficientemente evocador de recuerdos e impresiones que, a su vez, suscitan emociones. Aunque fuertemente dependientes de la historia particular de los individuos y las comunidades, cualquiera que no esté al caso de ese detalle puede, sin embargo, en función de la dinámica, intuir hasta cierto punto el sentido emocional de una dicción o interpretación musical. En realidad, eso también llega a ocurrir con independencia del contenido y la naturaleza de los discursos sonoros. Supongamos un recitado o una interpretación musical que dan comienzo en el silencio casi absoluto, aumentan paulatinamente el nivel durante un cierto tiempo y terminan, ya profiriendo un fuerte grito, ya produciendo una última nota con gran intensidad y violencia. El estado de tensión o relajación y la interpretación emotiva de un oyente al término de un pasaje semejante son esencialmente distintos de los suscitados por otro pasaje que hubiera empezado violentamente y terminara en un sonido difícilmente distinguible del inevitable sonido ambiental. Lo mismo cabe decir de unidades sonoras que tienen lugar en tiempos más cortos, como una frase corta o apenas una palabra, un reducido grupo de notas, incluso una sola, también una sílaba, que, articulados en una u otra forma dinámica, no son igualmente interpretados. Entre el comportamiento continuamente ascendente y el continuamente descendente cabe una infinidad de posibilidades gramaticales y sintácticas que se traducen a su vez en infinidad de expresividades y apoyos emotivos distintos, fácilmente distinguibles. Aceptado, pues, que la dinámica determina sustancialmente la canalización de las emociones y los afectos, es fácil entender que al ser comprimida, también estos últimos deberían experimentar alteraciones. De hecho, son importantes. La reducción de las diferencias dinámicas entre pasajes de distinta importancia dificulta la distinción de las gramáticas basadas en la oposición entre la tensión y la relajación, un elemento fundamental de muchos discursos musicales. En esencia, se reduce el factor sorpresa. Tanto la variabilidad de las expresiones emocionales como la posibilidad de distinción entre ellas quedan restringidas tras la compresión de la dinámica y como consecuencia, también el efecto dramático y emocional de la música. Así, desprovista de la emoción por el empleo indiscriminado de las técnicas de compresión, la música deja de ser un objeto distinguido al que prestar atención, para convertirse en un elemento más del fondo sonoro; una especie de masaje o baño de espuma totalmente en consonancia con la elementalidad de los contenidos de los productos de consumo mayoritario. Además, como también incrementa los niveles medios de intensidad de los contenidos sonoros que la sufren y así los elementos poco energéticos tienden a ser enmascarados, la compresión dinámica contribuye a elevar el umbral de la diferencia entre lo relevante y lo irrelevante. Con ello, la población de candidatos a la eliminación de los discursos sonoros deviene cada vez mayor, y, a fin de cuentas, la compresión termina beneficiando la paleta de posibilidades expresivas y emotivas asociables a niveles altos, es decir, las directamente relacionables con aspectos diversos de la violencia. En el lado opuesto de la ecuación, la desaparición paulatina de las posibilidades de expresión de la delicadeza conduce a su expulsión, quién sabe si definitiva, de los contenidos sonoros mediáticos. En conjunto, el proceso, que, a pesar de su acción continua, es de difícil apreciación unitaria porque lleva décadas en funcionamiento, contribuye a la larga en el empleo de más compresión, lo que nuevamente exige mayor elevación de los niveles medios de intensidad de sonido. Emerge claramente de esta situación el fantasma de una realimentación positiva.

El bucle, que según este modelo incompleto se genera de una forma completamente impersonal y, en principio, sin intervención de voluntades interesadas, estaría de por sí servido. Sin embargo, por desgracia, este último aspecto no es del todo ajeno a la problemática que tratamos. La escucha se experimenta más cómodamente cuando los niveles de intensidad son fuertes. Muchos insisten en que su experiencia mejora al aumentar el nivel de intensidad y existen razones para pensar que, aunque es posible argumentar lo contrario, en cierta manera, su sentimiento no carece de fundamento psicoacústico. Se entiende bien al considerar en conjunto las curvas isofónicas, introducidas al comienzo de este capítulo, que señalan los niveles de intensidad que para todo el espectro audible producen la misma sensación de volumen que un tono de 1000 Hz a una intensidad dada. Ello define una medida de la sensación de nivel de intensidad, la sonoridad, que recibe el nombre de Phon. Así, por ejemplo, la curva isofónica del umbral de audibilidad corresponde a una sonoridad de 0 Phon para todas las frecuencias, mientras que la del umbral de dolor es 120 Phon, también para todas las frecuencias. De la forma del umbral de audibilidad se deduce que el oído es muchísimo más sensible a los sonidos cuyo espectro es especialmente energético en la banda de 2000 a 4000 Hz. Formulado de manera inversa, escuchamos mal los sonidos cuyos contenidos predominantes de frecuencia quedan fuera de esa franja. El oído funciona a modo de filtro de las frecuencias que no están contenidas en ella.

Si se invierte la curva, es fácil ver que en el umbral de audibilidad el oído parece recortar las frecuencias bajas y permitir pasar las frecuencias altas. Los filtros que presentan ese comportamiento reciben el calificativo de pasa-altos.

El aparato auditivo se comporta también como un filtro en el umbral del dolor, pero a ese volumen, su forma no es igual que la anterior.

Es mucho más plana, lo que significa que el filtrado es mucho menos acusado, aunque se aprecia con claridad que las frecuencias de aquella franja especial continúan favorecidas. Esta forma se parece más a un tipo de filtro denominado resonante, porque, más que impedir el paso a unas frecuencias, enfatiza el paso de una determinada banda.

Si la curva de respuesta a las frecuencias es plana en el umbral de dolor, mucho más lo es por debajo de él, concretamente a 100 Phon.

La curva isofónica a esa intensidad subjetiva es casi plana entre 20 y 1000 Hz, lo que significa que, muy distintamente a lo que ocurría en el umbral de audibilidad, los sonidos de 100 dB se escuchan igual de fuertes si pertenecen a esa banda de frecuencias. Más allá, la sensibilidad del oído crece y luego vuelve a disminuir, como en todas las otras curvas isofónicas. De manera similar a los casos anteriores, es posible invertir la curva con el propósito de imaginar la forma del filtro que el oído realiza en la proximidad de los 100 dB.

De la inspección del umbral de audibilidad y las otras curvas isofónicas puede deducirse una explicación a lo que es una experiencia corriente : cuando la música no está muy fuerte es mucho más fácil identificar los sonidos con componentes en esa banda de frecuencias donde la sensibilidad es mayor y mucho más difícil apreciar los detalles de los sonidos con componentes espectrales no contenidos en ella. Los graves se distinguen especialmente mal. Si uno desea escucharlos, está obligado a realizar un esfuerzo, como cuando se intenta distinguir una figura en el horizonte. La curva isofónica más plana es la correspondiente a los 100 dB. Es a ese nivel de intensidad cuando la percepción de todos los componentes de frecuencia es más equilibrada y, por tanto, más cómoda. Se trata del punto donde el esfuerzo para distinguir todos los detalles del sonido se minimiza y la sensación de fidelidad es máxima. Sin embargo, dado el daño que el sistema auditivo puede sufrir a causa de la exposición constante a ese nivel, a fin de establecer un estándar en los estudios de mezcla y masterización, la Society for Motion Picture and Television Engineers (SMPTE), sugiere un nivel de intensidad de sonido cercano a 83 dB para la escucha óptima.

Aunque efímera, pues el alto nivel de intensidad desencadena muy pronto respuestas protectoras, a la larga igualmente fatigantes, esa liberación del esfuerzo, junto a la plenitud de la precisión en la experiencia de la escucha, podría hallarse en el fundamento por el que tan a menudo al escuchar música, sin ser verdaderamente conscientes de la situación, muchos sientan la necesidad de subir el volumen de sus equipos de sonido. No en vano, uno de los placeres más inmediatos que la música proporciona radica en la escucha confortable de la miríada de detalles que hacen del interior del sonido un mundo apasionante y lleno de misterios. Otro nada desdeñable es su poder embriagador, que también parece aumentar con el volumen. Pero sería erróneo creer que todo el mundo responde positivamente a la embriaguez o a la plenitud de la escucha. El goce musical es una cuestión compleja donde intervienen demasiados factores como para pretender controlarlo por medio de la acción sobre un reducido conjunto de variables. Sin embargo, parte importante de la industria discográfica sufrió en los años setenta una alucinación que, a pesar de los esfuerzos por rectificar, cincuenta años después sigue afectando a muchos. Si bien hay ingenieros de mezclas y masterización muy preocupados por la pérdida de calidad del sonido y el cansancio con que la compresión de los productos musicales amenazaría a los oyentes, muchos son aún rehenes de la idea de que su trabajo consiste en la búsqueda de un equilibrio entre la calidad y la presión del mercado. Desde el punto de vista de la investigación estética, que la presión del mercado pueda tener como consecuencia la disminución de la calidad de un producto cultural y, en especial, artístico, parece una idea aberrante. Debería ser al revés. Sin embargo, en esta paradoja se percibe claramente el grado de contaminación de pragmatismo que la actividad cultural ha sufrido en el camino a su transformación en industria cultural, un invento de dudoso diseño, cuyos efectos más evidentes han sido la uniformización de los hechos culturales, la dispersión y el deterioro de su potencial social, así como la rendición de la cultura al poder económico. La volatilización del apoyo del poder político a la cultura en beneficio de la influencia del poder económico es síntoma al tiempo que metáfora de la evolución del equilibrio que entre esas fuerzas viene dándose desde el cambio de milenio -y también antes- en todas las áreas de la realidad humana. Se desvanece así el sueño de una creación concebida como ejercicio y pedagogía de la libertad, para dar paso a la imagen asfixiante de una creatividad eternamente dependiente y a la merced de los caprichos de quienes antepusieron el sacrificio de su propia libertad a un dudoso imaginario de dominio.

De acuerdo a las necesidades de algunas músicas populares, como la rock y también la pop, la latina o la electrónica, donde el alto nivel de intensidad de sonido es un factor estético importante, con la estabilización de las tecnologías y de las industrias de la publicación del sonido, fue creciendo entre los productores el sentimiento de la necesidad de que sus discos y sus apariciones en público sonaran más fuerte que las de los demás. Ya en los primeros tiempos, muchos buscaron la manera de suscitar el interés de los programadores de las cadenas radiofónicas en el aumento del volumen durante los procesos de adecuación de las mezclas finales al consumo, que el mundo profesional latino ha consentido en identificar con el anglicismo de “masterización”, de dudosa belleza y procedente del término “mastering”. Ese interés, que contribuyó en el estado actual de desarrollo de las tecnologías del proceso del rango dinámico y llegó a comprometer la calidad técnica de los productos a cambio de conseguir la atención de las audiencias, afectó también a detalles estéticos importantes, como la dinámica general de las piezas, las expresividades óptimas preceptivas y hasta su duración. Esto último fue porque las dinámicas mayores, que en los discos requerían surcos más anchos donde codificar las diferencias de potencial análogas a las variaciones de presión sonora, determinaban entre ellos una separación, que, de mantenerse invariable, hubiera obligado a las superposición de las espiras. Como consecuencia, se impuso la reducción de la capacidad de almacenamiento de sonido en el que fuera producto estrella del mercado discográfico durante décadas : el pequeño disco de 45 rpm. No satisfechos con someter los materiales originales al tratamiento electrónico de sonido, algunos productores introdujeron técnicas propias de la orquestación con la finalidad de incrementar la sensación subjetiva de nivel de intensidad, lo que en Motown, en esa época la mayor compañía independiente de grabación estadounidense y, probablemente, del mundo, llamaban nivel aparente. En esencia, dichas técnicas, se basaron en la interpretación de las melodías al unísono por grupos instrumentales de tamaño variable, secundados por dos bajos que las tocaban en quintas y procesadas en su totalidad por una cámara de reverberación. Así se construían masas sonoras imponentes. Si la cámara de reverberación contribuía en aumentar el nivel medio de la amplitud de sonido, los bajos creaban una sensación envolvente vinculada a la manifestación aparente de un componente grave inexistente en la grabación, pero que al fin al cabo se hacía real, en virtud de una propiedad psicoacústica conocida como reconstrucción de la fundamental. Según el contenido armónico de un acorde, el oído humano puede escuchar frecuencias inexistentes porque, no siendo resultado de ninguna estimulación mecánica, se manifiestan a la conciencia a causa de la respuesta de la circuitería del sistema nervioso central a determinados estímulos. El efecto es empíricamente conocido, al menos, desde el Renacimiento, y se trata de un recurso ampliamente empleado en la literatura musical para órgano, con el objetivo de introducir coloraciones tímbricas y, también, de enfatizar la sensación de volumen en los pasajes más impresionantes. Si en el caso del órgano, la reverberación es consecuencia del espacio donde suena -de preferencia, alguna iglesia-, la estimulación simultánea de dos o más tubos de órgano como consecuencia a la pulsación en el teclado correspondiente a una única nota puede generar la sensación de una nota supernumeraria inexistente en el estímulo.

A juzgar por buena parte de las publicaciones especializadas , el nivel de los cedés viene aumentado sin descanso desde finales de los años 80. Es cierto que no hay acuerdo en todos los datos que refrendan ese hecho. Por ejemplo, mientras unos dicen que el rango dinámico ha disminuido, otros opinan que ese valor se ha mantenido estable hasta nuestros días. Por una cuestión de escala temporal, es difícil valorar el rango dinámico. Eso lo convierte en un parámetro algo ambiguo. Sin embargo, la tendencia al incremento bruto del nivel de intensidad de sonido está clara para todo el mundo. Entre los años 70 y la actualidad, el nivel de intensidad medio de las grabaciones se ha incrementado en 5 dB. Podría argumentarse que el nivel no es la sonoridad, pero las estadísticas acerca de ella son totalmente coherentes con los datos anteriores. Continuamos subiendo. Me contaba Jordi Salvadó que en una ocasión que tuvo que sonorizar a un directo de un amigo común, la manager le exigía más nivel. Cuando él le explicaba que la sala ya no podía soportar niveles más altos, que se generarían ondas estacionarias y que la distorsión armónica del equipo sería insoportable, la mujer insistía : “Puedo hablar y entender perfectamente lo que la gente me dice. Normalmente no puedo en los conciertos. Este concierto requiere un nivel que no permita hablar a la gente”. Más tarde, en sus esfuerzos infructuosos por incrementar la presión, llegaba a argumentarle que el nivel debía ser tal que dolieran los oídos. No es un caso aislado. El dolor de oídos no es siempre considerado un factor negativo. No son raros los conciertos donde alcanzar el umbral del dolor es un factor apreciado por el público y los organizadores. A finales de octubre de 2009, al terminar la primera campaña de toma de sonido en el Trapecio Amazónico para Sonidos en Causa, los integrantes de la Orquesta del Caos, en esa época, Carlos Gómez y yo, fuimos invitados por Lidia Blanco, entonces directora del Centro de Formación de AECID en Cartagena de Indias a asistir a la gala popular de un concurso de vestidos en la Plaza de Toros de la ciudad. Estaba claro que se trataba de un evento cultural importante, donde es de suponer que no se había escatimado medios y recursos para que fuera un éxito. El tránsito desde el exterior de la Plaza a la zona de seguridad que nos habían asignado estaba atestado de gente. Caben unas 15000 personas en esa plaza. Difícil saber cuántas había en esa ocasión, porque el ruedo estaba lleno y las plazas se contabilizan por asientos. Pongamos unos cuantos miles. En un extremo de la arena, aunque sin llegar a tocar la valla, prolongada hasta el centro de la plaza por la pasarela y conformando así una cruz, el escenario, como es costumbre en los eventos masivos, aparecía flanqueado por altísimas y amenazadoras torres negras de altavoces, en este caso, algo anticuados y sin marca aparente. Era una P. A. en toda regla, que, ya al entrar, aunque inactiva, prometía todo tipo de excesos. Por eso, en cuanto me vi confinado junto a las autoridades y el jurado en un reducido recinto a menos de 15 metros de una de las columnas de altavoces y no demasiado cerca de la pasarela, me eché a temblar. Estuve un buen rato buscando la mejor forma de huir de aquello, pero no era posible : por motivos de seguridad era mejor que no nos aventuráramos más allá del vallado, nos aseguraron los guardias. ¿Qué hacíamos allí, en pleno ruedo y casi entre bastidores, si una perspectiva general y elevada hubiera sido mucho más apropiada a las tareas del jurado? No estaba claro, pero lo cierto es que por algún motivo alguien había tomado la decisión y allí estábamos. O bien nadie había tenido en cuenta la proximidad de los altavoces o bien ello había sido considerado positivo.