Hoja de ruta

Tras la irrupción ya antigua de las tecnologías electrónicas en la creación artística, en esta etapa de sedimentación escucho quizá demasiado a menudo que, como todas las señales propias del multimedia son actualmente procesadas por los mismos recursos tecnológicos o similares, deberían ser tratadas de la misma forma y compartir enfoques metodológicos; hasta propiciar propuestas estéticas en las que ambos medios se condicionen mutuamente ¿Pero es eso lo correcto en todos los casos?

En particular, la búsqueda de sincronía entre señales visuales y acústicas es corriente en muchos clips audiovisuales. Pero en general, se establecen paralelismos que me llaman la atención por su falta de naturalidad : los tiempos de lectura de los media no coinciden, pero en el caso de la visión y la audición, es tan groseramente evidente como que es imposible no darse cuenta. Se trata de tiempos paralelos, no idénticos. Seguramente, las lecturas que se realizan a través de canales perceptivos distintos tienen lugar en virtud de procesos neurales que, separados en el espacio, si se considera una escala suficientemente pequeña, se influencian mutuamente. El yo que escucha no coincide en el tiempo con el yo que ve. Compiten. No existen al mismo tiempo. Conmutan. Uno y otro tan sólo llegan a comunicarse, muy rápidamente, si se quiere, y están obligados a expresarse conjuntamente porque comparten los mismos recursos expresivos, es decir, la totalidad de un sistema motor cuyas manifestaciones no pueden sino considerarse suma o acuerdo entre todas las entidades que compiten por la atención consciente, que está hecha, entre otras cosas de voluntad y tiempo. La comunicación entre esas estructuras debe darse, pues, a través de memorias tampón que den carácter al estado instantáneo de la consciencia.

De forma progresiva, los ordenadores nos han ido facilitando el proceso simultáneo de ambos ámbitos. Quizá la similitud de las manipulaciones nos haya llevado a pensar que se trata de lo mismo. Desde luego que son señales muy parecidas ; quizá en algunos casos, como ocurre con el ruido blanco, puede que la naturaleza informacional de las señales sea intercambiable a cierto nivel. Que eso justifique la similitud de las herramientas con las que las manipulamos no dice nada acerca de como las percibimos : es evidente que si trasladamos una señal visual al dominio acústico, la imagen sonora poco tiene que ver con la visual. Igualmente ocurre en el caso inverso. Las experiencias son radicalmente distintas.

Como sentimiento general, observo que la tendencia a fundir las prácticas de la creación visual con las de la creación acústica va en detrimento de la excelencia en uno u otro medio. Desde la época de la popularización de los medios analógicos para la producción videográfica, si el creador procede del contexto visual, tiende a tratar negligentemente las cuestiones sonoras. No ha ocurrido con la misma frecuencia que la procedencia del contexto sonoro afecte la calidad de la metodología del trabajo visual. Pero como quizá sí en la misma proporción, no creo que sea por la excelencia del mundo del sonido. Tengo la sensación de que para explicar esa distancia es bueno recordar algunos aspectos de la historia del desarrollo de las tecnologías dedicadas al proceso de estas dos señales tan diferentes y tan complementarias.

En los años 80 y 90, los dispositivos de producción audiovisual de fácil acceso para la mayoría de artistas ofrecían unas pobrísimas especificaciones técnicas para el sonido. Su uso implicaba un paso atrás tecnológico de importancia para cualquiera que hubiera educado su oído en el contexto de la música electroacústica. Por ejemplo, los aparatos u-matic de baja banda sólo permitían reproducción de audio a través de dos vías. Los proyectos para más vías de audio implicaban el uso de tecnologías de sincronización que complicaban enormemente su puesta en escena. Lo mismo cabe decir de las bajas relaciones señal/ruido gue los aparatos ofrecían. Por otra parte, el acceso directo a las máquinas se encontraba generalmente blindado por la castrante y corporativa figura del técnico montador -algo también corriente en muchos estudios de creación de sonido y sempiterno en los de creación musical tradicional.

En mi caso, a pesar de tenerlo bastante fácil y no faltarme el interés, todas esas restricciones frenaron mi entrada en el terreno de la creación visual. Como realizador, tan sólo llevé a cabo algunos documentales. Como músico, participé en muchos más, pero sin tener otro papel que el puramente creativo en el dominio sonoro, de manera que, por la presencia del técnico, así como por la existencia de a-prioris imaginarios como la necesidad del ahorro del tiempo de estudio, nunca pude llevar a cabo el nivel de control sobre el audio que a mí me hubiera gustado.

Es normal que hasta ahora las herramientas informáticas para uno y otro dominio hayan sido casi intercambiables. El estado de evolución del hardware no facilitaba la aplicación de tècnicas demasiado avanzadas de inteligencia artificial capaces de aprovechar creativamente las características psicofisiológicas y psicológicas de alto nivel de los dominios perceptivos de la visión y la audición. Por ello, la manipulación de la información se limitaba a los niveles estructurales más bajos. Pero a medida que las herramientas de creación emulen con progresiva eficacia la experiencia humana, quizá vaya desapareciendo ese espejismo de sincronía entre los mundos perceptivos que paralelamente al desarrollo tecnológico se ha ido asentando como categoria en nuestros imaginarios culturales. Quizá ese adaptar la mente a lo digital haya sido una etapa necesaria para comprenderlo suficientemente y conseguir, por fin, que la creación de ese ser digital que ahora nos constriñe contribuya verdaderamente en el desarrollo de la mente. Esa carrera loca hacia la sincronía perfecta toca también a su fin, precisamente, porque ahora es fácil para cualquierca comprobar que, por más cercanos que ajustemos los tiempos, sólo oímos los sonidos al mismo tiempo que vemos las imágenes cuando el proceso que su comprensión requiere es escaso. Cuando más proceso requiera la lectura de un producto audiovisual, mayor será la separación temporal de esas consciencias perceptivas. Y es que somos, cada uno, como sugiere Minsky, una auténtica sociedad de sociedades. ¿Era posible verlo de otro modo?

Esto evoca y puede dar sentido a una idea formal, aplicable en algún contexto de creación multimedia, que exploraría un gradiente de coincidencia entre eventos de dominios perceptivos distintos que tomaría valores entre dos límites inalcanzables : la sincronía total y la separación infinita de tiempos. Quizá un día haga una obra así.

Las relaciones entre imagen y sonido no sólo tienen lugar en el espacio-tiempo físico. En realidad, como objetos perceptivos que son, sus relaciones se dan más allá de la mecánica. Ocurren en la conciencia, por eso, esas relaciones deben ser más intensas en los aspectos matéricos y en el contenido, que también se relaciona con el tiempo, ya que su transmisión ocurre en el dominio de la narrativa, que es el de la memoria, la experiencia del tiempo, nuevamente, una parte de la consciencia.

¿Tiene la consciencia a su vez integrantes especializados o se trata de un todo que recibe las informaciones directamente de las unidades de proceso específicas de cada canal perceptivo?

En el terreno del conflicto entre imagen y sonido presenta, en relación a todas las consideraciones anteriores, una serie de cuestiones que sobre las que me gustaría trabajar, alguna de las cuales quizá formara parte importante de un texto definitivo :

Cuestiones :

¿Es posible la definición de un frame sonoro? Dicho de otra manera, ¿tiene sentido? Un frame de cine o de video ya es una imagen con una cantidad enorme de información. Pero, ¿cuánta información de audio se necesita grabar para obtener muestras que juntas dan la sensación de que se está oyendo como ocurre algo? Como se ve, no estoy hablando del grano clásico de la síntesis granular clásica; se trataría de una unidad mínima de duración de señal sonora en cuyo interior se identificaría la presencia de partes relacionadas con fuentes de sonido reales. La mínima duración de un sonido que permite la identificación de su contenido puede ser muy corta. Quizá tendemos a pensar que los frames de imagen contienen más información que los granos clásicos de audio. Pero si se toma un grano de 40 milisegundos de un entorno sonoro, se identifican bastantes cosas en él al iterarlo. En realidad, ocurre igualmente con la imagen. No podemos acceder la consciencia de una serie de objetos que se hallan en un frame de imagen de 40 milisegundos si no es repitiéndolo durante un tiempo mínimo. ¿Por qué entonces tendemos a hablar de la música como el arte del tiempo? ¿No necesitamos un tiempo mínimo de lectura de una imagen para percibirla como estimuladora de consciencias estéticas?
Si vivimos la experiencia perceptiva como un todo (la caricia del aire en la piel, el sonido y el movimiento de las hojas del árbol), ¿por qué tan a menudo la experiencia de las obras de arte sonoras rechaza la introducción de materiales perceptivos ajenos al sonido, especialmente, los visuales electrónicos? ¿Es esta sensación una variable personal o hay algún elemento objetivable?
Si tan importante es la pulsación en la música electrónica de discoteca, ¿por qué las imágenes que se proyectan simultáneamente, a pesar de que manifiestamente los realizadores lo intentan, no acostumbran a seguir ritmos tan claros y coincidentes con la pulsación omnipresente? Es más, ¿por qué la gente que baila en esos entornos apenas sigue verdaderamente el ritmo de la música?
En el supuesto de que el aparato consciente no trabaje igual la imagen que el sonido, ¿qué características diferenciales deberán tener los softwares de generación de imagen y sonido, cuando la tecnología posibilite la implementación de algoritmos verdaderamente complejos y sofisticados de inteligencia artificial?