Nous avons tendance à faire confiance au contenu des enregistrements vidéo et audio. Mais avec l’IA, le visage ou la voix de n’importe qui peut être recréé avec une précision extrême. Le produit est un deepfake, une usurpation d’identité qui peut être utilisée pour des mèmes, de la désinformation ou du porno.
Un regard sur le Nicholas Cage deepfakes ou Jordan Peele deepfake PSA indique clairement que nous avons affaire à une nouvelle technologie étrange. Ces exemples, bien que relativement inoffensifs, soulèvent des questions sur l’avenir. Pouvons-nous faire confiance à la vidéo et à l’audio? Pouvons-nous tenir les gens responsables de leurs actions à l’écran? Sommes-nous prêts pour les deepfakes?
Les Deepfakes sont nouveaux, faciles à fabriquer et se développent rapidement
La technologie Deepfake n’a que quelques années, mais elle a déjà explosé en quelque chose à la fois captivant et troublant. Le terme «deepfake», qui a été inventé sur un fil Reddit en 2017, est utilisé pour décrire la recréation de l’apparence ou de la voix d’un humain grâce à l’intelligence artificielle. Étonnamment, à peu près n’importe qui peut créer un deepfake avec un PC de merde, des logiciels et quelques heures de travail.
Croyez-le ou non, l’image de gauche est le deepfake.
Comme pour toute nouvelle technologie, il existe une certaine confusion autour des deepfakes. La vidéo «ivre Pelosi» est un excellent exemple de cette confusion. Les Deepfakes sont construits par l’IA et sont faits pour se faire passer pour des gens. La vidéo «dunk Pelosi», qui a été qualifiée de deepfake, n’est en fait qu’une vidéo de Nancy Pelosi qui a été ralenti et corrigé de la hauteur pour ajouter un effet d’élocution.
C’est aussi ce qui différencie Deepfakery de, disons, la CGI Carrie Fisher dans Star Wars: Rogue One. Alors que Disney a dépensé des tonnes d’argent pour étudier le visage de Carrie Fisher et le recréer à la main, un nerd avec un logiciel deepfake peut faire le même travail gratuitement en une seule journée. L’IA rend le travail incroyablement simple, bon marché et convaincant.
Comment faire un Deepfake
Comme un élève dans une salle de classe, l’IA doit «apprendre» à accomplir la tâche prévue. Il le fait grâce à un processus d’essais et d’erreurs par force brute, généralement appelé apprentissage automatique ou apprentissage en profondeur. Une IA conçue pour compléter le premier niveau de Super Mario Bros, par exemple, jouera au jeu encore et encore jusqu’à ce qu’elle trouve le meilleur moyen de gagner. La personne qui conçoit l’IA doit fournir des données pour démarrer les choses, ainsi que quelques «règles» lorsque les choses tournent mal en cours de route. En dehors de cela, l’IA fait tout le travail.
Il en va de même pour les récréations faciales deepfake. Mais, bien sûr, recréer des visages n’est pas la même chose que battre un jeu vidéo. Si nous devions créer un deepfake de Nicholas Cage hébergeant l’émission Wendy Williams, voici ce dont nous aurions besoin:
Une vidéo de destination: pour le moment, les deepfakes fonctionnent mieux avec des vidéos de destination claires et propres. C’est pourquoi certains des deepfakes les plus convaincants sont des politiciens; ils ont tendance à rester immobiles sur un podium sous un éclairage constant. Donc, nous avons juste besoin d’une vidéo de Wendy assise immobile et en train de parler.
Deux ensembles de données: pour que les mouvements de la bouche et de la tête soient précis, nous avons besoin d’un ensemble de données du visage de Wendy Williams et d’un ensemble de données du visage de Nicholas Cage. Si Wendy regarde vers la droite, nous avons besoin d’une photo de Nicholas Cage regardant vers la droite. Si Wendy ouvre la bouche, nous avons besoin d’une photo de Cage ouvrant la bouche.
Après cela, nous laissons l’IA faire son travail. Il essaie de créer le deepfake encore et encore, apprenant de ses erreurs en cours de route. Simple, non? Eh bien, une vidéo du visage de Cage sur Wendy William