Numériser et convertir des images en texte

Photo of author

By pierre



Avec l’amélioration constante de la qualité des capteurs, les smartphones sont devenus de véritables outils de numérisation, capables de capturer des textes imprimés de manière nette et lisible. Après avoir exploré les meilleures applications pour numériser des photos sur Android, l’étape suivante logique est l’utilisation de la reconnaissance optique de caractères (OCR). L’OCR permet à votre appareil de convertir des images en texte modifiable. Voici notre analyse des 9 meilleures applications OCR disponibles pour Android.

Méthodologie de test

Nous avons effectué nos tests sur un Samsung Galaxy S8 équipé d’Android 7.0. Pour assurer la cohérence, nous avons photographié la couverture du « Seigneur des Anneaux », une page au hasard du même ouvrage (la page 200) et une page du roman graphique « The Killing Joke ». Les clichés ont été réalisés avec l’application appareil photo par défaut, puis analysés avec les applications OCR. Voici les conclusions de notre évaluation.

1. Text Scanner [OCR]: Le summum de la performance OCR

Text Scanner [OCR] propose sa propre application photo, mais son utilisation n’est pas obligatoire. L’importation d’images depuis votre galerie est tout aussi simple. L’atout majeur de Text Scanner [OCR] est sa capacité à identifier et à numériser le texte sans intervention de l’utilisateur. L’application détermine automatiquement la zone de texte, et le fait avec une grande précision.

L’application a extrait le texte avec une fidélité remarquable (aucune erreur de ponctuation), a correctement identifié le contenu de la couverture et a isolé la zone de texte de la bulle de dialogue du roman graphique avec très peu d’erreurs. Alors que d’autres applications confondaient des éléments graphiques avec du texte, Text Scanner [OCR] a livré une performance précise et autonome. Aucune des autres applications testées n’a atteint un tel niveau de précision.

2. Office Lens: Un champion dans sa catégorie

Office Lens, développé par Microsoft, est un acteur majeur dans le domaine de l’OCR. Bien qu’il n’ait pas tenté d’extraire le texte du roman graphique ou de la couverture, il a excellé lors de la numérisation du livre. L’application a numérisé la page en entier, en incluant sous forme d’images les éléments qu’elle n’a pas pu convertir en texte. Le résultat est un document entièrement formaté, nécessitant peu de retouches, et prêt à être modifié. L’exportation est possible vers plusieurs applications, avec une intégration optimale dans les logiciels Microsoft tels que MS Word ou OneNote.

3. OCR Text Scanner: Fidèle à sa promesse

OCR Text Scanner promet une précision de numérisation entre 95% et 100%, une performance que seul Text Scanner [OCR] a réussi à atteindre lors de nos tests. L’application s’approche cependant de cet objectif. Elle n’a numérisé que quelques mots du titre du livre, en ignorant ceux en gras. Il est nécessaire de sélectionner manuellement la langue et la zone de numérisation. Chaque opération de numérisation est précédée d’une publicité (que l’on peut ignorer après 5 secondes). La page convertie était relativement précise, avec quelques rares erreurs. La page de la bande dessinée a été également bien interprétée. La possibilité de modifier le document après la numérisation, pour corriger les erreurs ou ajouter des informations, est un avantage. Tous les résultats sont sauvegardés au format .txt.

4. OCR Pro: Efficace mais limité

OCR Pro a une limitation majeure : elle ne peut pas importer d’images depuis la galerie. L’application requiert de prendre des photos au moment de la numérisation. Les résultats sont précis, en particulier pour le texte. Bien que la précision soit un facteur essentiel, la possibilité d’utiliser des images de la galerie est un avantage important. L’absence de cette fonctionnalité réduit la praticité de l’application.

7. Text Fairy: Une performance honnête

Text Fairy est une application sincère et simple. Elle commence par préciser ses limites, notamment la gestion du texte manuscrit ou des « lettres ornées ou colorées ». Contrairement à d’autres applications, Text Fairy utilise l’application photo par défaut du système.

L’application vous demande de télécharger les packs linguistiques requis au premier lancement. Après la numérisation, il faut sélectionner la zone de texte. L’application demande ensuite si le texte est sur une ou deux colonnes, puis analyse le contenu. Les résultats sont généralement précis pour un texte noir sur fond blanc, mais l’application a eu des difficultés avec le roman graphique.

6. CamScanner: Des performances OCR décevantes

CamScanner est une application de numérisation très populaire, souvent mentionnée dans les comparatifs. Cependant, elle s’avère peu performante en matière d’OCR. L’application propose une option d’inscription facultative au premier lancement. L’OCR est disponible, mais la modification ou le partage du contenu nécessitent un abonnement premium. Les tests effectués ont montré des résultats insatisfaisants. La reconnaissance était confuse, certains textes ignorés, et cela pour les trois supports de test. L’importation depuis la galerie nécessite de passer par un bouton « Paramètres », puis de sélectionner l’option « Reconnaissance OCR ».

Nous avons également testé la numérisation avec l’application photo de CamScanner, mais les résultats étaient tout aussi décevants, voire parmi les moins bons de tous nos tests.