Comment Alexa écoute les mots de réveil

Alexa écoute toujours mais n’enregistre pas continuellement. Il n’envoie rien aux serveurs cloud jusqu’à ce qu’il vous entende dire le mot de réveil (Alexa, Echo ou Computer). Mais écouter les mots de réveil est plus difficile que vous ne le pensez.

Le matériel Echo n’est pas si intelligent. Sans Internet, toute demande ou question que vous posez échouera. En effet, vos commandes sont envoyées vers le cloud pour interprétation et décisions. Amazon ne veut pas que toutes les conversations que vous avez devant un haut-parleur intelligent soient enregistrées, mais uniquement les commandes que vous donnez au haut-parleur intelligent. Pour cette raison, l’entreprise utilise un mot de réveil pour attirer l’attention du haut-parleur intelligent. Pour ce faire, Amazon utilise une combinaison de microphones affinés, d’une mémoire tampon courte et d’un entraînement par réseau neuronal.

Microphones à réglage précis Identifiez votre voix

Amazon Echo dot 3 avec l'anneau LED bleu clair allumé.La LED bleu clair fera toujours face à la direction de votre voix.

Les haut-parleurs de l’assistant vocal, comme Echo et Echo Dot, ont généralement plusieurs microphones intégrés. L’Echo Dot, par exemple, en a sept. Ce tableau donne aux appareils plusieurs capacités, allant de l’audition des commandes prononcées à distance à la séparation du bruit de fond des voix.

Ce dernier est particulièrement utile pour la détection des mots de réveil. À l’aide de ses multiples microphones, l’Echo peut localiser votre emplacement par rapport à l’endroit où il est assis et écouter dans cette direction tout en ignorant le reste de la pièce.

  Comment obtenir un mélangeur de volume pour les onglets Chrome

Vous voyez cela en action chaque fois que vous utilisez le mot de réveil. Placez-vous à côté d’un écho ou d’un point d’écho et prononcez le mot de réveil. Remarquez que l’anneau s’allume en bleu foncé, puis en bleu plus clair lorsqu’il tourne et «pointe» vers vous. Maintenant, déplacez plusieurs pas sur le côté et dites à nouveau le mot de réveil. Remarquez que les lumières bleu clair vous suivent.

Savoir où vous êtes permet à l’appareil de mieux se concentrer sur vous et couper les bruits venant d’ailleurs.

Une mémoire courte empêche le haut-parleur de tenir trop

Les appareils Echo ont beaucoup de stockage, mais ils n’en utilisent pas beaucoup. Selon Rohit Prasad, vice-président d’Amazon et scientifique en chef d’Alexa Artificial Intelligence, an Echo ne peut stocker physiquement que quelques secondes d’audio.

En réduisant sa capacité, Amazon vous offre non seulement plus de confidentialité (c’est un endroit de moins où votre voix est stockée), mais empêche également Echo d’écouter des conversations entières, limitant son objectif à trouver le mot de réveil.

Imaginez que vous ayez une cassette de trois secondes et un magnétophone. Supposons qu’après avoir atteint la fin, la bande revienne au début encore et encore. Si vous commencez à enregistrer une conversation, tout ce que vous avez dit il y a quatre secondes sera effacé et immédiatement enregistré. C’est ce que fait un Amazon Echo.

Il enregistre en continu mais efface tout ce qu’il vient d’enregistrer en même temps. Cette courte durée d’attention signifie que tout ce qu’il peut entendre est le mot «Alexa» et pas beaucoup plus. Cependant, trois secondes suffisent pour que ce mot soit enregistré, examiné et appliqué de manière appropriée.

  Comment obtenir la couleur de la barre des tâches avec le thème Lumière sur Windows 10 1903

Neural Net Training aide à la correspondance de modèles

Un organigramme des couches de l'algorithme Amazon.Une représentation des couches utilisées par les algorithmes d’Amazon.

Enfin, Amazon dépend de formation réseau neuronal pour apprendre à l’Echo comment faire correspondre les motifs. Tout comme les autres formes d’apprentissage automatique, Amazon entraîne ses algorithmes en l’alimentant instance après instance du mot Alexa (ou Computer, ou Echo, selon le mot de réveil que l’entreprise forme).

L’idée est de couvrir chaque inflexion et accent, mais aussi le contexte. Amazon veut que votre Echo reconnaisse la différence lorsque vous lui parlez, lorsque vous en parlez ou, peut-être, lorsque vous parlez à une personne nommée Alexa. Les micros directionnels aident également à atteindre cet objectif.

Avec chaque mot que l’Echo entend, il fait passer l’audio à travers des couches d’algorithmes. Chaque couche est conçue pour éliminer les faux positifs, à la recherche de sons similaires ou d’indices de contexte. Si une vérification de couche réussit, le mot passe au suivant. Enfin, lorsque l’appareil local décide qu’il a entendu le mot de réveil, il commence à enregistrer et à transmettre l’audio aux serveurs cloud d’Amazon. Amazon utilise quatre algorithmes: un pour chaque mot de réveil (Alexa, ordinateur, Echo) et un pour Alexa Guard, qui traite des sons spécifiques, tels que le bris de verre, comme un mot de réveil.

Mais même lorsqu’une correspondance se produit, Amazon effectue toujours des vérifications plus compliquées. Avez-vous remarqué que lorsque quelqu’un prononce le mot Alexa dans une émission télévisée ou dans une publicité, cela n’obtient généralement pas de réponse de votre Echo? C’est parce qu’Amazon effectue également une vérification du cloud.

  Comment éviter le glisser-déposer accidentel avec le pavé tactile sous Windows 10

Cloud Checks élimine certains faux positifs

Un homme d'Alexa commercial regarde sa brosse à dents Echo illuminée.Ce publicité hilarante d’Alexa ne réveillera pas votre Echo.

Lorsque les entreprises font des publicités mettant en vedette Alexa, elles peuvent soumettre l’audio à Amazon. La société exécute l’audio via des algorithmes de correspondance de modèles similaires utilisés pour identifier le mot de réveil. Une fois que cette instance exacte est entièrement cataloguée, elle est ajoutée à une base de données.

Dans le cadre du processus de connexion au cloud, votre Echo inclut des informations sur le mot de réveil qu’il a entendu et vérifie cette base de données. Chaque fois qu’il trouve une correspondance, Amazon demande à votre Echo d’ignorer le mot de réveil, d’arrêter et de supprimer tout audio enregistré.

De plus, Amazon vérifie les instances du mot de réveil prononcées simultanément. Toutes les entreprises ne soumettent pas l’audio à Amazon, c’est pourquoi l’entreprise a proposé une nouvelle solution de sauvegarde. Après avoir vérifié la correspondance de la base de données, la société compare l’empreinte du mot de réveil à toute autre instance entrant en même temps. Il est peu probable que deux personnes qui disent Alexa simultanément sonnent exactement de la même manière, donc s’il y a une correspondance, Amazon sait qu’il s’agit probablement d’une publicité ou d’une émission de télévision et ignore la demande.

Malgré tous les contrôles, des faux positifs se produisent encore. Vous pouvez écouter ce que votre Echo a enregistré à Hub de confidentialité d’Amazon, et vous trouverez probablement au moins un faux positif dans le groupe. Mais la technologie est continuellement améliorée et, à terme, Amazon aimerait qu’elle fonctionne sans un mot de réveil du tout.