Tout sur la reconnaissance faciale pour les entreprises
La reconnaissance faciale transcende le simple domaine de l'informatique, s'affirmant comme un outil d'une grande valeur commerciale.
Parmi les expressions les plus en vogue de cette décennie, figure incontestablement la reconnaissance faciale.
Cette branche de l'apprentissage automatique permet de détecter et d'identifier les visages humains, une prouesse qui, jusqu'à récemment, s'avérait extrêmement complexe pour les ordinateurs. Cette avancée a ouvert un horizon de possibilités et de défis captivants pour les entreprises, les gouvernements et les particuliers.
Si vous êtes un chef d'entreprise et que vous vous interrogez sur la nature et l'utilité de cette innovation, cet article est pour vous. Nous allons explorer l'histoire de la reconnaissance faciale, son évolution, ses applications actuelles, les controverses qu'elle suscite, son déploiement et bien d'autres aspects.
À l'issue de cette lecture, vous aurez acquis une compréhension solide de la technologie de reconnaissance faciale et de ses implications pour le monde des affaires.
Entamons notre exploration !
Évolution de la reconnaissance faciale
Malgré l'engouement médiatique actuel, la technologie de reconnaissance faciale n'est pas une nouveauté absolue. Le premier jalon significatif dans la détection des visages fut le Cadre de détection d'objets Viola-Jones, publié en 2001. Conçu initialement pour l'identification d'objets génériques dans des images, il fut rapidement adapté à la détection faciale avec un succès notable. Sa popularité tenait principalement à sa rapidité d'exécution ; bien que la phase d'entraînement soit extrêmement lente, le processus de détection était d'une rapidité impressionnante.
Dès 2001/2004, un ordinateur personnel moyen équipé de cet algorithme pouvait traiter une image de 300 pixels X 300 pixels en seulement 0,07 seconde (voir détails ici). Bien qu'inférieurs aux performances humaines, les taux de précision, atteignant 90%, étaient déjà remarquables.
Les avancées majeures ont véritablement émergé dans la décennie 2010-2020, avec l'avènement des Réseaux neuronaux convolutifs comme méthode de référence pour la détection faciale. Cette évolution a été rendue possible grâce à la puissance de calcul brute et aux capacités de stockage colossales mises à disposition par le cloud computing via les fournisseurs d'infrastructure en tant que service (IaaS). Pour la première fois, les ordinateurs ont surpassé les humains en matière de reconnaissance faciale, notamment lorsqu'il s'agissait de traiter un grand nombre de visages aléatoires.
Source : medium.com
Comment fonctionne la reconnaissance faciale ?
La reconnaissance faciale est un processus complexe, articulé en plusieurs étapes et faisant appel à divers sous-systèmes spécialisés.
Voici une explication détaillée des différentes étapes :
Détection/Suivi : Cette phase, qui intervient en début de traitement, a pour rôle d'identifier et de suivre les visages présents dans une image ou une séquence vidéo. Une fois cette étape validée, il est établi qu'un visage est présent dans les données d'entrée et que son traitement peut être poursuivi. Le suivi peut également viser des zones spécifiques, des caractéristiques particulières ou des expressions du visage, si cela s'avère nécessaire.
Alignement : La reconnaissance faciale est rendue plus complexe par le fait que les visages, qu'ils soient présents dans des images ou des vidéos, ne respectent aucune norme. Les personnes peuvent être en gros plan ou en plan large, cachées derrière un obstacle, ou bien présentées de profil. L'alignement du visage intervient pour déterminer la position des lignes du visage dans l'image/vidéo et délimiter les contours des différents traits.
Source : csc.kth.se
Extraction des caractéristiques : Comme son nom l'indique, cette phase du processus (qui marque le début de la reconnaissance proprement dite) consiste à extraire les caractéristiques individuelles du visage, telles que les yeux, le nez, le menton, les lèvres, etc. Cette extraction produit des données exploitables par les algorithmes lors de l'étape suivante. À ce stade, l'ordinateur a collecté suffisamment d'informations pour différencier un visage de manière univoque.
Correspondance/Classification des caractéristiques : Les données issues de l'extraction des caractéristiques sont comparées à celles d'une base de données pour déterminer l'identité de la personne. Cette phase peut également être une classification lorsque l'algorithme est amené à catégoriser les visages plutôt que de les identifier individuellement.
Au terme de ce processus, il est établi si le visage examiné figure ou non dans la base de données utilisée pour la comparaison. Le résultat final peut inclure des étiquettes, comme celles que nous rencontrons sur Facebook.
Source : versdatascience.com
Considérations de déploiement : côté serveur ou côté client
La reconnaissance faciale peut s'opérer aussi bien côté serveur que côté appareil avec lequel l'utilisateur interagit. Par exemple, lorsque vous téléchargez une photo sur Facebook, les algorithmes sont exécutés côté serveur. En revanche, un système d'identification qui utilise votre visage pour déverrouiller un appareil fonctionne côté client. Alors, quelle option est la plus avantageuse ?
En réalité, il n'y a pas de solution idéale unique. Les déploiements côté serveur et côté client présentent des atouts propres, et en pratique, les entreprises tendent vers une approche hybride. Il est recommandé d'entraîner les modèles côté serveur, où les données d'entraînement et les ressources de traitement sont illimitées. Une fois entraînés, ces modèles peuvent être intégrés et déployés côté client, ce qui améliore la rapidité du système tout en préservant la confidentialité de l'utilisateur.
Un traitement exclusif côté serveur engendre un délai qui peut être problématique, voire inacceptable dans certains cas. Inversement, tout traiter côté client peut limiter la performance des modèles.
Quelle est la précision de la reconnaissance faciale ?
La notion de précision est complexe dans le contexte de la reconnaissance faciale, car il s'agit d'un problème aux contours flous, où les données d'entrée peuvent être altérées par de nombreux facteurs (faible luminosité, visage partiellement caché par des cheveux, qualité de l'appareil photo, etc.) et même des données trompeuses. Les réseaux neuronaux employés doivent donc être adaptés au problème à résoudre, ce qui limite leur portée. Ainsi, un système de reconnaissance faciale industriel peut afficher une précision de 100 %, mais la même technologie peut chuter à 20 % de précision lorsqu'elle est confrontée à l'identification de visages sur une photo de foule.
Dans une étude, un algorithme spécifique de reconnaissance faciale a atteint une précision de 98,52 %, dépassant les 97,53 % de précision obtenue par des humains dans le même test. Dans une autre étude réalisée dans le domaine de la médecine légale, la combinaison du jugement humain et des algorithmes a produit les meilleurs résultats dans certains cas.
En résumé, pour des applications ciblées et bien définies, la reconnaissance faciale est l'outil le plus performant dont nous disposons.
Où la reconnaissance faciale est-elle utilisée ?
En peu de temps depuis le développement d'algorithmes fiables, la reconnaissance faciale a trouvé des applications d'une utilité et d'un intérêt considérables. Certaines sont spectaculaires, tandis que d'autres sont si subtilement intégrées à notre quotidien qu'il est rare que nous prenions conscience de leur présence.
Facebook est probablement l'exemple le plus connu de l'utilisation de la reconnaissance faciale. Dès que vous téléchargez une photo, le réseau social est capable de détecter les visages. Alors qu'il y a quelque temps, vous deviez taguer vos amis manuellement, Facebook est désormais capable de le faire automatiquement.
Source : labnol.org
Une nouvelle fonctionnalité intéressante de Facebook est la capacité de notifier les utilisateurs lorsque des photos où ils apparaissent sont publiées par d'autres, même s'ils n'y ont pas été tagués.
Snapchat exploite massivement la détection et la reconnaissance des visages pour de nombreuses fonctionnalités, notamment les filtres ludiques qui rencontrent un tel succès.
Source: gistreel.com
Pour que ces filtres fonctionnent correctement, les contours et les traits du visage du sujet doivent être détectés avec une grande précision, sans quoi les superpositions n'apparaîtraient pas réalistes. Il en va de même pour la fonction Face Swap, également populaire sur Snapchat. Pour explorer plus en profondeur les capacités de reconnaissance faciale de Snapchat, vous pouvez consulter cet article.
Uber est confronté depuis un certain temps à des problèmes de confidentialité et de sécurité, et la reconnaissance faciale fait partie des nouvelles solutions adoptées par l'entreprise. Uber a mis en place une fonctionnalité qui permet de vérifier l'identité de ses chauffeurs partenaires grâce à la reconnaissance de leur visage. L'entreprise a indiqué sur son blog qu'après avoir testé plusieurs fournisseurs de technologies de reconnaissance faciale, elle a opté pour l'API Microsoft Face en raison de sa grande qualité. Il est intéressant de noter que cette vérification d'identité en temps réel fonctionne bien en basse luminosité et permet de détecter la présence de lunettes.

La reconnaissance faciale ayant fait ses preuves, il est fort probable qu'elle remplace bientôt d'autres méthodes d'identification dans les établissements scolaires, les hôpitaux, les bibliothèques, etc.
La prévention de la criminalité dans le commerce de détail est une application logique de la reconnaissance faciale. Le commerce de détail perd chaque année environ 45 milliards de dollars à cause du vol à l'étalage et d'autres formes de délinquance. Des entreprises comme FaceFirst aident les commerçants à utiliser la reconnaissance faciale pour identifier les récidivistes et alerter les agents de sécurité.

Les forces de l'ordre commencent également à tirer parti de la reconnaissance faciale. Au Royaume-Uni, par exemple, la police du sud du Pays de Galles utilise des caméras montées sur des véhicules pour faciliter la surveillance des foules.
Source : theconversation.com
Bien que cette nouvelle capacité conférée à la police ait suscité de vifs débats sur la vie privée des individus, la police estime que cette technologie l'aidera à mieux appréhender les malfaiteurs. Comme l'a déclaré Richard Lewis, chef de police adjoint de la police du sud du Pays de Galles, au Financial Times :
Si vous identifiez une personne ayant commis une infraction [précédemment], vous lui indiquez clairement : nous savons que vous êtes là, alors tenez-vous bien.
Le secteur de la santé a récemment vu une application inattendue de la reconnaissance faciale, qui a permis d'aider à détecter une maladie génétique rare appelée syndrome de DiGeorge.
Le syndrome de DiGeorge touche environ un enfant sur 6 000 et entraîne des malformations dans plusieurs parties du corps. Le dépistage de cette maladie est plus difficile dans les pays les plus pauvres, qui n'ont pas les ressources pour recourir à des méthodes de diagnostic onéreuses. La reconnaissance faciale, avec une précision de 96,6 %, offre un nouvel espoir aux personnes atteintes du syndrome de DiGeorge.

Dans le secteur aérien, l'adoption de la reconnaissance faciale s'accélère et devrait bientôt remplacer les cartes d'embarquement traditionnelles. Il existe déjà des résultats limités mais encourageants pour aider à identifier les passagers au moment où ils quittent le pays. La Transport Security Administration (TSA) des États-Unis a d'ailleurs élaboré un plan pour une utilisation généralisée de la biométrie basée sur la reconnaissance faciale.
Utilisations controversées de la reconnaissance faciale
La technologie est une source de pouvoir, mais son utilisation, à bon ou à mauvais escient, dépend de nous. Il n'est donc pas surprenant qu'une technologie aussi puissante et transformatrice que la reconnaissance faciale soit employée de manière à susciter des préoccupations en matière de droits humains et d'éthique.
L'exemple le plus frappant d'utilisation controversée de la reconnaissance faciale est l'immense système de surveillance chinois, qui utilise près de 200 millions de caméras pour surveiller ses 1,4 milliard de citoyens.
Source : sbs.com
Le système suit les individus et évalue leurs actions, en actualisant en permanence un indicateur appelé score citoyen. Bien qu'un système de surveillance étatique puisse avoir une certaine utilité (pour le suivi des personnes ayant des dettes, par exemple), beaucoup y voient l'avènement du futur dystopique imaginé par George Orwell, où les gouvernements ont un pouvoir illimité sur les individus et où la vie privée devient une notion obsolète.
Le second exemple d'utilisation discutable de la reconnaissance faciale vient également (sans surprise) de Chine. Cette fois, c'est le système scolaire qui a recours à la reconnaissance faciale pour s'assurer que les élèves restent "attentifs" pendant les cours. Ce nouveau système, bien qu'il ne soit pas encore généralisé, remplace les cartes d'identité, les cartes de bibliothèque, les systèmes de présence, etc. en se basant sur le visage de l'élève pour l'identification.
Source : businessinsider.com
Le plus troublant est que ce système surveille également le niveau d'attention des élèves, l'utilisation des téléphones portables, etc., et alerte l'enseignant lorsque certains seuils sont dépassés.
Bien que la vidéosurveillance fondée sur la reconnaissance faciale ne soit pas l'apanage de la Chine, les États-Unis ont entrepris des démarches pour l'utiliser afin de réduire la violence armée dans les écoles. Cependant, c'est la Chine qui semble aller le plus loin dans cette direction.
Comparaison des API de reconnaissance faciale populaires
Quelles sont les options disponibles en matière de reconnaissance faciale ? Dans cette section, nous allons examiner les solutions courantes et comparer leurs caractéristiques.
Avant de commencer, il convient de rappeler que ces API évoluent très rapidement. Il est possible que vous tombiez sur des articles de blog indiquant qu'une API n'a pas telle ou telle fonctionnalité. Il est donc important de ne pas se fier aveuglément à ces informations, mais d'analyser les besoins de votre entreprise, d'examiner les fonctionnalités proposées et de tester les différentes solutions avant de prendre une décision.
OpenCV
La recherche en intelligence artificielle est un gouffre sans fond. L'entraînement et l'optimisation d'un système de reconnaissance faciale sont des tâches complexes qu'il est préférable de confier à des entreprises disposant de ressources financières importantes et d'équipes de recherche étoffées. Cependant, si vos besoins sont simples et que vous souhaitez garder un contrôle total (et si vous êtes prêt à assurer la maintenance du système avec une petite équipe d'ingénieurs), OpenCV pourrait bien être une solution adaptée à votre situation.
Il s'agit d'une bibliothèque open source de vision par ordinateur remarquablement précise et disponible pour toutes les plateformes de programmation. Voici un exemple instructif qui montre comment créer un système de détection de visage avec Python et OpenCV en seulement 25 lignes de code !
Vous pourriez trouver des articles affirmant qu'OpenCV ne fait pas de reconnaissance faciale. C'est un mensonge. Voici une preuve du contraire. OpenCV peut être un excellent choix pour votre entreprise si vos besoins sont simples et spécifiques.
Amazon Rekognition
Rekognition est un service robuste proposé par AWS, l'un des principaux fournisseurs de services cloud. C'est un service puissant, entièrement géré, dédié à la plateforme AWS. Si vous utilisez déjà AWS pour vos déploiements, Rekognition est probablement la meilleure option.

Voici quelques-unes des fonctionnalités intéressantes proposées par Rekognition :
- Analyse en temps réel (lorsque vous téléchargez une image ou une vidéo sur S3)
- Analyse faciale approfondie (sexe, couleur des cheveux, expression faciale, yeux ouverts ou non, etc.)
- Suivi des trajectoires (capturer les mouvements d'objets identifiés dans les vidéos)
- Détection de scène et d'activité (intérieur/extérieur, "faire du football", etc.)
- Modération des contenus dangereux (nudité, par exemple)
Le principal avantage de Rekognition est aussi son principal inconvénient : il est difficile, voire impossible, de l'utiliser avec des services non-AWS.
Kairos
Contrairement à Rekognition, Kairos vous donne accès à l'IA par le biais d'une API, ce qui vous offre un contrôle total sur vos données et vos serveurs. Kairos se positionne comme un service axé sur la confidentialité et critique ouvertement Amazon et les autres entreprises qui collaborent avec le gouvernement (c'est également l'avis de l'ACLU).

Kairos traite aussi bien les images que les vidéos, et possède toutes les fonctionnalités intéressantes que vous attendez d'une API de reconnaissance faciale moderne. Si vous n'avez pas besoin des fonctionnalités plus poussées de Rekognition, et que vous gérez déjà vos propres données, il n'y a aucune raison de vous en soucier !
Kairos offre un déploiement sur site pour les entreprises soucieuses de la confidentialité qui ne veulent même pas transmettre leurs données pour traitement. Le prix varie en fonction de votre cas d'utilisation et peut s'avérer assez élevé.
Google Cloud Vision
Google a choisi de différencier ses services de reconnaissance faciale pour les images et les vidéos. L'API dédiée aux images s'appelle Cloud Vision, tandis que le service axé sur les vidéos s'appelle Video Intelligence.

Alors que le service dédié aux images est assez similaire à ce que propose AWS, le service vidéo offre une fonctionnalité intéressante de catalogage et de recherche. Cela peut s'avérer utile pour les entreprises disposant de grandes archives vidéo qu'elles souhaitent analyser ou parcourir.
Cela dit, Video Intelligence n'offre pas de fonctionnalités de reconnaissance faciale au moment de la rédaction de cet article, et celles-ci semblent être proposées uniquement dans Cloud Vision. Le suivi d'objets et la détection de texte sont également en version bêta, ce qui place Google un cran en dessous d'Amazon en termes de fonctionnalités.
API Visage Azure
Microsoft, qui prend désormais ses offres cloud plus au sérieux que ses offres de bureau (enfin !), propose une excellente solution avec l'API Visage Azure. Cette API offre toutes les fonctionnalités attendues (détection, identification, regroupement de visages, recherche de visages similaires, analyse des émotions, etc.) et fonctionne aussi bien avec les vidéos.
Il convient de mentionner qu'Azure propose également un service de vision par ordinateur personnalisé service, qui vous permet d'utiliser vos propres données d'entrée et de créer des modèles en fonction de vos besoins.
Tout comme le service de Google, un espace de test est disponible directement sur la page d'accueil, ce qui rend le test de l'API ludique et intuitif !

Existe-t-il des différences significatives entre les principaux services de reconnaissance faciale gérés ? Pas vraiment. La concurrence est intense dans ce domaine, et de nouvelles fonctionnalités sont déployées à un rythme effréné. Si vous êtes déjà lié à un écosystème spécifique, il est logique d'utiliser son propre service de reconnaissance faciale. Dans le cas contraire, vous préférerez peut-être opter pour un autre fournisseur si vos besoins sont particuliers (contrôle de vos données, besoin d'une simple détection, etc.).
Systèmes de reconnaissance anti-faciale
Tout comme certains chercheurs consacrent leur vie à perfectionner la technologie de reconnaissance faciale, d'autres sont occupés à mettre au point des techniques pour la tromper. Un développement intéressant dans ce domaine est celui des lunettes anti-reconnaissance faciale, qui paraissent tout à fait normales pour l'œil humain, mais qui ont la capacité de tromper les systèmes de reconnaissance faciale les plus sophistiqués.
Source : digitaltrends.com
Ces lunettes ne sont pas encore commercialisées, mais les chercheurs affirment qu'elles peuvent être facilement imprimées en 3D.
Un autre développement intéressant a été le lancement sur Kickstarter des lunettes ekō. Bien que ce produit soit désormais abandonné, il reposait sur une idée d'une simplicité remarquable : des lunettes de soleil classiques à 45$ qui reflétaient simplement la lumière, ce qui avait pour effet de désorienter les caméras et les appareils de vidéosurveillance.
</p