Introducción
El término efecto cóctel fue acuñado por un científico cognitivo británico, Colin Cherry, en la década de 1950. Estaba interesado en entender cómo la gente escuchaba, realizando algunos experimentos. En su primer experimento, reprodujo a través de unos auriculares dos mensajes diferentes superpuestos, grabados con la voz de la misma persona. Se pidió a los participantes que escucharan atentamente e intentaran escribir uno de los mensajes en un papel. Si se concentraban lo suficiente, los participantes solían tener éxito.
Definición del efecto fiesta de cóctel:
El efecto fiesta de cóctel es el fenómeno de poder centrar la atención auditiva en un estímulo concreto mientras se filtra una serie de otros estímulos, de la misma manera que un asistente a una fiesta puede centrarse en una sola conversación en una sala ruidosa.
Psicología del efecto cóctel
Imagínese en una fiesta con decenas de personas alrededor intentando hablar con los demás. Hay una serie de voces superpuestas hablando, la música sonando, vasos de bebida tintineando y demás. Entre esa cacofonía de sonidos hay un amigo que habla frente a ti, no mucho más fuerte que el propio ruido de fondo. Hay algo en el habla humana, en el sistema auditivo y en el sistema de procesamiento del lenguaje de alto nivel que te permite conjurar una atención altamente selectiva hacia tu amigo, permitiéndote escucharle hablar, como si silenciaras todo lo que hay de fondo. Ocurre de forma tan natural y sutil que es posible que ni siquiera se aprecie la presencia de un procesamiento fuera del mundo que el cerebro está realizando para hacerle entender el discurso de su amigo en tales eventos.
Este efecto, conocido como el efecto de la fiesta de cóctel, se conoce desde hace tiempo y la mecánica exacta de cómo el cerebro humano se las arregla para lidiar con él ha desconcertado a los científicos durante varios años. Sin embargo, años de contemplación y el aumento de la potencia de cálculo han permitido algunos avances sorprendentes en este ámbito. Por ejemplo, tomemos este experimento.
¿Cómo funciona el efecto de la fiesta de cóctel para los ordenadores?
Digamos que una fiesta de cóctel en la que usted y otra persona están tomando al mismo tiempo, tiene dos micrófonos mantenidos a cierta distancia el uno del otro. Ambos micrófonos grabarán las voces de ambos. Escuchar sólo una voz, al menos para que lo haga un ordenador, puede parecer un trabajo extremadamente difícil de hacer. Pero la cuestión es la siguiente. Uno de los micrófonos, que está más cerca de ti, graba tu voz ligeramente más alta y ligeramente más débil en el otro micrófono. Si estas dos grabaciones se hacen pasar por una sola línea de código muy inteligente, el código puede producir casi con toda claridad dos archivos con tu voz limpia en un archivo y la de la otra persona en el segundo. Esta única línea de código es el algoritmo Cocktail party, cuyo nombre genérico es – Análisis de Componentes Independientes (ICA). ICA es un caso especial de algo llamado Separación Ciega de Fuentes (BSS) o Separación Ciega de Señales. Implica un alto nivel de álgebra lineal y utiliza algo llamado descomposición de valor singular.
Mira una demostración reproduciendo las entradas del micrófono y la salida del código. Un ejemplo de efecto Cocktail party a continuación:
Esta demostración formaba parte del curso de aprendizaje automático para principiantes del que hablaba ayer.
Ahora bien, esto mismo se puede extender a más número de fuentes y todas ellas se pueden separar también. Pero por lo que tengo entendido, se necesitaría n número de micrófonos para separar n número de voces (Sí, es correcto). Aquí tienes una demostración con tres micrófonos y tres voces mezcladas.
Puedes probar tú mismo una versión extendida de un sencillo ICA aquí. (Enlace)
Otras versiones del efecto Cocktail Party
Un enfoque similar puede ser utilizado en imágenes también. Por ejemplo, si alguna vez has intentado hacer una bonita foto de una puesta de sol desde la ventana del hotel, o una foto de un bonito vestido dentro del escaparate de cristal de una tienda, y has acabado con una foto que contiene molestos reflejos, debes tener en cuenta esto. El artículo del MIT que describe en detalle este método está enlazado aquí. Y un ejemplo pictórico tomado del paper se muestra a continuación.
Vea cómo la entrada se toma de la imagen de la izquierda. En realidad la entrada eran dos imágenes de este tipo. Una con reflexión aumentada y otra disminuida, al igual que las grabaciones de audio. Logrado en el caso de la captura de la imagen, mediante el uso del filtro polarizado. Es decir, sólo la parte donde se muestra el cuadro. La salida da dos imágenes, una del reflejo y de la pintura subyacente.
En una aplicación similar, se puede utilizar para eliminar el ruido de las fotografías, o de una grabación de audio. O en una aplicación muy diferente, se puede utilizar un enfoque similar para detectar factores ocultos en datos financieros.
Imagen destacada: Mark Probst, Flickr (Link)
0 comentarios