Introduction
Le terme effet cocktail party a été inventé par un cogniticien britannique Colin Cherry, dans les années 1950. Il cherchait à comprendre comment les gens écoutaient, en menant quelques expériences. Dans sa première expérience, il a fait passer dans un casque deux messages différents qui se chevauchaient, enregistrés avec la voix de la même personne. Il a demandé aux participants d’écouter attentivement et d’essayer d’écrire l’un des messages sur papier. S’ils mettaient suffisamment de concentration, les participants réussissaient généralement.
Maintenant, si quelqu’un vous demande de décrire l’effet cocktail party. La définition formelle de l’effet cocktail party est la suivante:
Définition de l’effet cocktail party:
L’effet cocktail party est le phénomène consistant à pouvoir focaliser son attention auditive sur un stimulus particulier tout en filtrant un ensemble d’autres stimuli, de la même manière qu’un fêtard peut se concentrer sur une seule conversation dans une pièce bruyante.
Psychologie de l’effet cocktail
Imaginez-vous dans une fête avec des dizaines de personnes autour qui essaient de se parler. Il y a un certain nombre de voix qui se chevauchent en parlant, la musique qui joue, les verres de boisson qui s’entrechoquent et quoi encore. Parmi cette cacophonie de sons, un ami parle devant vous, à peine plus fort que le bruit de fond lui-même. Vous pouvez tout de même distinguer ce qu’il dit.
Il y a quelque chose dans la parole humaine, le système auditif et le système de traitement du langage de haut niveau qui vous permet de conjurer une attention hautement sélective envers votre ami, vous laissant l’écouter parler, comme si vous mettiez tout en sourdine en arrière-plan. Cela se produit si naturellement et d’une manière si subtile que vous pourriez même ne pas apprécier la présence d’un traitement hors du commun que votre cerveau effectue pour vous faire comprendre le discours de votre ami lors de tels événements.
Cet effet, connu sous le nom d’effet cocktail, est connu depuis longtemps et la mécanique exacte de la façon dont le cerveau humain parvient à le gérer a déconcerté les scientifiques pendant plusieurs années. Cependant des années de contemplation et l’augmentation de la puissance de calcul ont permis des percées étonnantes dans ce domaine. Comme disons, prenez cette expérience par exemple.
Comment l’effet cocktail fonctionne-t-il pour les ordinateurs ?
Disons qu’un cocktail où vous et une autre personne prenez en même temps, dispose de deux microphones maintenus à une certaine distance l’un de l’autre. Les deux microphones vont enregistrer vos deux voix. Pour n’écouter qu’une seule voix, du moins pour qu’un ordinateur le fasse, cela peut sembler un travail extrêmement difficile à réaliser. Mais voici le problème. Un microphone, qui est plus proche de vous, enregistre votre voix légèrement plus forte et légèrement plus faible dans l’autre microphone. Si ces deux enregistrements passent par une seule ligne de code très intelligente, le code peut presque très clairement produire deux fichiers avec votre voix propre dans un fichier et celle de l’autre personne dans le second fichier. Cette ligne de code unique est l’algorithme Cocktail party, son nom générique étant – Analyse en Composantes Indépendantes (ACI). L’ICA est un cas particulier de ce qu’on appelle la séparation aveugle des sources (BSS) ou la séparation aveugle des signaux. Elle implique un haut niveau d’algèbre linéaire et utilise quelque chose appelé la décomposition en valeurs singulières.
Voir une démonstration jouant les entrées du microphone et la sortie du code. Un exemple d’effet Cocktail party ci-dessous :
Cette démonstration faisait partie du cours d’apprentissage automatique pour débutants dont je parlais hier.
Maintenant, cette même chose exacte peut aussi être étendue à un plus grand nombre de sources et toutes ces sources peuvent être séparées aussi. Mais d’après ce que je comprends, il faudrait n nombre de microphones pour séparer n nombre de voix (Oui, c’est exact). Voici une démonstration avec trois microphones et trois voix mélangées.
Vous pouvez essayer vous-même une version étendue d’un ICA simple ici. (Lien)
Autres versions de l’effet Cocktail Party
Une approche similaire peut également être utilisée sur des images. Par exemple, si vous avez déjà essayé de prendre une belle photo de coucher de soleil depuis la fenêtre d’un hôtel, ou une photo d’une jolie robe à l’intérieur de la vitrine d’un magasin, et que vous vous êtes retrouvé avec une photo contenant des reflets gênants, vous devez considérer ceci. L’article du MIT qui décrit cette méthode en détail est lié ici. Et un exemple imagé tiré de l’article est présenté ci-dessous.
Voyez comment l’entrée est tirée de l’image de gauche. En fait, l’entrée était deux images de ce type. Une avec une réflexion accrue et une autre avec une réflexion diminuée, tout comme les enregistrements audio. Accompli dans le cas de la capture d’image, en utilisant un filtre polarisé. C’est-à-dire, juste la partie où la peinture est affichée. La sortie donne deux images, une du reflet et de la peinture sous-jacente.
Dans une application similaire, on peut l’utiliser pour supprimer le bruit des photos, ou d’un enregistrement audio. Ou dans une application très différente, une approche similaire peut être utilisée pour détecter des facteurs cachés dans des données financières.
Crédit de l’image vedette : Mark Probst, Flickr (Lien)
Share the Knowledge
.
0 commentaire