Contrairement aux visioconférences, où les participants peuvent se mettre en sourdine, les réunions physiques sont plus complexes du point de vue acoustique. En raison d’un manque de contrôle sur les sons environnants, on est obligé de se mettre dans l’ambiance des échanges. Pourtant, il arrive parfois qu’on ait besoin d’identifier et d’isoler la voix d’une personne parlant dans une pièce bondée. « Si je ferme les yeux et que dix personnes parlent dans une pièce, je n’ai aucune idée de qui dit quoi et de l’endroit exact où chacune d’entre elles se trouve. C’est extrêmement difficile à traiter pour le cerveau humain. Jusqu’à présent, cela a également été difficile pour la technologie », a expliqué Malek Itani, étudiant en doctorat à l’Université de Washington et co-auteur d’une nouvelle étude publiée récemment dans la revue Nature.
Des robots microphones mobiles
L’étude en question, dévoilée dans un communiqué, décrit l’invention d’un haut-parleur intelligent équipé de micros auto-déployables pour isoler acoustiquement une zone spécifique dans une pièce. Grâce à son algorithme avancé, le dispositif, que ses inventeurs ont baptisé « essaim acoustique robotique », est en mesure « de suivre les positions de plusieurs personnes qui parlent dans une pièce et de séparer leur discours ». Concrètement, les robots peuvent se déplacer sur une table et mettre en sourdine la voix d’une ou de plusieurs personnes et séparer les conversations simultanées. Au total, le système se compose de sept mini robots à roues qui font office de microphones.
Une précision remarquable
Ces micros mobiles se déploient automatiquement à partir d’une station de charge et se dispersent dans l’espace disponible pour former une sorte de réseau auto-optimisé. Cela permet un meilleur contrôle de l’audio. L’essaim a été testé dans différents environnements avec des groupes de trois à cinq personnes qui parlaient. Les chercheurs ont constaté que les robots pouvaient distinguer différentes voix à moins de 50 cm les uns des autres avec une précision de 90 %. Par contre, leur rapidité laisse à désirer. En effet, le système prend 1,82 seconde pour traiter trois secondes d’audio, ce qui est assez lent pour les communications en temps réel telles que les visioconférences.
De nombreuses utilisations possibles
Quoi qu’il en soit, les chercheurs avancent qu’il existe de nombreuses possibilités d’utilisation de leur technologie. Celle-ci pourrait par exemple être utilisée dans les maisons intelligentes pour faire la distinction entre la voix d’un être humain et celle d’un assistant intelligent. Elle pourrait également permettre de contrôler vocalement un appareil connecté dans un environnement bondé. L’équipe est consciente du fait que les robots sont susceptibles de représenter un danger s’ils tombaient entre les mains d’individus malintentionnés. Pour cette raison, les appareils se servent de leurs microphones pour naviguer au lieu d’une caméra. De plus, leurs lumières clignotent quand ils sont actifs. Plus d’infos : nature.com.
Que pensez-vous de cette invention ? N’hésitez pas à partager votre avis, vos remarques ou nous signaler une erreur dans le texte, cliquez ici pour publier un commentaire .