Nous avons naturellement tendance à accorder notre confiance aux contenus des enregistrements vidéo et audio. Cependant, l’avènement de l’intelligence artificielle (IA) permet de recréer avec une précision étonnante le visage ou la voix de n’importe qui. Il en résulte ce que l’on appelle un « deepfake », une forme d’usurpation d’identité qui peut être exploitée à des fins diverses, allant des mèmes à la désinformation, en passant par des contenus pornographiques.
Un simple coup d’œil aux deepfakes de Nicholas Cage ou au message d’intérêt public (PSA) deepfake de Jordan Peele suffit à démontrer que nous sommes face à une technologie nouvelle et déroutante. Bien que ces exemples soient relativement inoffensifs, ils soulèvent des questions importantes quant à l’avenir. Pouvons-nous encore nous fier aux vidéos et aux enregistrements audio? Comment tenir les individus responsables de leurs actions à l’écran? Sommes-nous préparés à la prolifération des deepfakes?
Les Deepfakes : Une Technologie Récente, Facile à Utiliser et en Pleine Expansion
Bien que la technologie deepfake n’ait que quelques années d’existence, elle a connu un essor fulgurant, devenant à la fois fascinante et inquiétante. Le terme « deepfake », apparu pour la première fois sur un fil de discussion Reddit en 2017, désigne la recréation de l’apparence ou de la voix d’une personne grâce à l’intelligence artificielle. De manière surprenante, il est désormais possible pour presque n’importe qui de créer un deepfake avec un ordinateur personnel, des logiciels appropriés et quelques heures de travail.
Croyez-le ou non, l’image de gauche est le résultat d’un deepfake.
Comme toute nouvelle technologie, les deepfakes sont souvent mal compris. La vidéo de « Pelosi ivre » en est un parfait exemple. Les deepfakes, construits par l’IA, sont conçus pour usurper l’identité de personnes. Or, la vidéo de « Pelosi, la tête dans le seau » (qualifiée à tort de deepfake) n’est en réalité qu’une vidéo de Nancy Pelosi dont la vitesse de lecture et la tonalité ont été modifiées pour simuler un discours balbutiant.
C’est là la principale différence entre un deepfake et une création en CGI (images de synthèse) comme celle de Carrie Fisher dans Star Wars: Rogue One. Alors que Disney a investi des sommes considérables pour étudier le visage de Carrie Fisher et le recréer manuellement, un simple passionné muni d’un logiciel deepfake peut réaliser le même travail gratuitement en une seule journée. L’IA rend ce type de création incroyablement simple, abordable et convaincante.
Comment Créer un Deepfake
À l’instar d’un élève en classe, l’IA doit « apprendre » à effectuer la tâche qui lui est confiée. Elle y parvient grâce à un processus d’essais et d’erreurs basé sur la force brute, appelé apprentissage automatique ou apprentissage profond. Par exemple, une IA conçue pour terminer le premier niveau de Super Mario Bros jouera encore et encore jusqu’à ce qu’elle trouve la meilleure stratégie pour gagner. La personne qui conçoit l’IA doit fournir les données initiales, ainsi que quelques « règles » à suivre lorsque les choses dérapent. Ensuite, l’IA prend le relais et fait le reste du travail.
Le principe est le même pour la recréation de visages via un deepfake. Bien entendu, recréer des visages est différent de terminer un jeu vidéo. Si nous voulions créer un deepfake de Nicholas Cage animant l’émission de Wendy Williams, voici ce dont nous aurions besoin :
- Une vidéo cible : Actuellement, les deepfakes fonctionnent mieux avec des vidéos cibles claires et nettes. C’est pourquoi certains des deepfakes les plus réussis concernent des personnalités politiques, souvent filmées immobiles sur un podium sous un éclairage uniforme. Ainsi, nous aurions besoin d’une vidéo de Wendy assise immobile en train de parler.
- Deux ensembles de données : Pour obtenir des mouvements de la bouche et de la tête précis, nous aurions besoin d’un ensemble de données du visage de Wendy Williams et d’un ensemble de données du visage de Nicholas Cage. Si Wendy regarde vers la droite, il nous faudrait une photo de Nicholas Cage regardant vers la droite. Si Wendy ouvre la bouche, il nous faudrait une photo de Cage ouvrant la bouche.
Une fois ces éléments réunis, nous laissons l’IA faire le travail. Elle essaiera de créer le deepfake encore et encore, apprenant de ses erreurs à chaque tentative. Simple, n’est-ce pas? Eh bien, la vidéo du visage de Cage sur Wendy William …