Guide étape par étape pour mettre en surbrillance et supprimer les doublons dans Google Sheets
Identifier et Supprimer les Doublons dans Google Sheets : Guide Complet
Deux méthodes simples permettent de repérer les données dupliquées dans Google Sheets : l'utilisation de la fonction COUNTIF et le nettoyage des données.
À Propos de Google Sheets
Google Sheets est un tableur gratuit, accessible via le cloud, proposé par Google. Il s'inscrit dans sa suite bureautique, conçue pour rivaliser avec Microsoft Office. Google Sheets est un outil puissant pour préparer des données, réaliser des calculs complexes et bien plus.
Il sert à modifier, organiser et stocker des informations de manière efficace. Ce programme est intégré à la suite de productivité Google Docs, qui comprend Google Drive, Google Sheets et Google Slides.
Un avantage majeur de Google Sheets, contrairement à Excel, est sa capacité à faciliter la collaboration en temps réel entre plusieurs utilisateurs.
Google Sheets a simplifié la création de bases de données grâce à une interface intuitive et des outils pratiques d'organisation des données.
Son utilisation augmente la productivité et permet un gain de temps considérable. Les utilisateurs n'ont plus à craindre la perte de données cruciales, car la plateforme est basée sur le cloud.
Google Sheets est l'un des tableurs et bases de données les plus populaires. Il est accessible sur tous les systèmes d'exploitation courants, aussi bien sur ordinateur que sur mobile.
Comment Google Sheets Simplifie la Création de Bases de Données ?
La création de bases de données était traditionnellement un processus complexe et chronophage. Cependant, l'évolution des technologies, notamment l'arrivée de Google Sheets, a grandement simplifié cette démarche. Le logiciel offre une multitude de fonctionnalités, comme l'ajout de graphiques, de formules et d'images.
De nombreuses entreprises l'adoptent pour la gestion et le stockage de données en temps réel, en remplacement de bases de données coûteuses comme PostgreSQL, MySQL ou SQL Server. Les petites structures privilégient souvent les feuilles Google en guise d'alternative.
Google Sheets ne se substitue pas à un système complet de gestion de base de données. Toutefois, il s'avère particulièrement efficace pour les petites entreprises et les projets nécessitant une gestion rigoureuse de leurs opérations financières.
Il propose une série de fonctionnalités sophistiquées accessibles gratuitement, comme l'API Google Sheets, le script Apps, les déclencheurs de formulaire, les déclencheurs temporisés et ImportXML.
Les utilisateurs du script d'application peuvent se connecter à diverses bases de données grâce au service JDBC intégré, compatible avec MySQL, Microsoft SQL Server et d'autres systèmes.
En exploitant toutes ses capacités, les entreprises peuvent réduire leurs dépenses en matière de systèmes de gestion de données.
Examinons maintenant l'impact des valeurs dupliquées dans une base de données.
Impact des Valeurs Dupliquées dans une Base de Données
La présence de doublons dans une base de données peut nuire à l'analyse ou à la création de rapports.
Dans certains cas, les doublons peuvent fausser les données, menant à des interprétations erronées. Dans d'autres cas, ils peuvent rendre les données plus difficiles à utiliser et à comprendre.
Il est donc essentiel de prendre conscience des effets potentiels des doublons et de prendre les mesures nécessaires pour les prévenir ou les atténuer.
Comment Mettre en Évidence les Doublons dans une Colonne Unique ?
Cette section détaille les méthodes permettant de repérer et d'éliminer les doublons dans vos feuilles Google.
La formule de base pour mettre en évidence les doublons est :
=COUNTIF(plage, critère)
Voici un guide pas à pas pour son utilisation :
Dans le menu supérieur, sélectionnez "Format", puis "Mise en forme conditionnelle".
Un panneau de mise en forme conditionnelle apparaîtra à droite.
Après avoir défini la plage de cellules concernée, dans la section "Règles de format", choisissez l'option "La formule personnalisée est".
Dans ce champ, entrez la formule :
=COUNTIF($G$6:$G$14,G6)>1
Remplacez la cellule G par la colonne de votre choix pour repérer les doublons.
En validant, les doublons de la colonne seront mis en surbrillance.

Vous pouvez modifier la couleur de surbrillance ou d'autres options de mise en forme, comme illustré ci-dessous :

Nous avons vu comment mettre en évidence les doublons dans une seule colonne. Voyons maintenant comment procéder sur plusieurs colonnes.
Comment Mettre en Évidence les Doublons dans Plusieurs Colonnes ?
Le processus est similaire à celui décrit précédemment, à l'exception de la formule et de la plage de cellules.
Prenons un exemple pour mieux comprendre.
Sélectionnez "Mise en forme conditionnelle" dans le menu "Format". Les options apparaîtront à droite.
Spécifiez la plage de cellules dans la section "Appliquer à la plage".
Dans la section "Règles de format", utilisez la formule suivante pour mettre en évidence les doublons dans plusieurs colonnes :
=COUNTIF($F$6:$I$8,F6)>1
Cette formule est très simple à implémenter. Elle ne requiert que la spécification de la plage de cellules concernée.
Après application, les doublons des quatre colonnes seront mis en surbrillance.
Dans cet exemple, la couleur de surbrillance a été changée en bleu.

Voyons maintenant comment mettre en évidence les doublons dans les lignes.
Comment Mettre en Évidence les Doublons dans les Lignes ?
L'identification de lignes dupliquées est légèrement différente de celle des colonnes dupliquées.
Nous ne reprendrons pas toutes les étapes car elles sont identiques, à l'exception de la formule.
Prenons un exemple.
Définissez la plage de cellules concernée dans la section "Appliquer à la plage" des options de mise en forme conditionnelle.
Dans la section "Formule personnalisée est", saisissez la formule :
=COUNTIF(ARRAYFORMULA($A$3:$A$10&$B$3:$B$10&$C$3:$C$10),$A3&$B3&$C3)>1
Bien que la formule paraisse complexe, elle fait simplement référence aux numéros de cellule de début et de fin des lignes où vous souhaitez repérer les doublons.
Le résultat sera affiché comme ci-dessous après application de cette formule.
La couleur de surbrillance peut être modifiée dans le même menu que pour la surbrillance des doublons dans les colonnes.

Comment Mettre en Évidence les Doublons selon des Critères Spécifiques ?
Pour mettre en évidence les doublons en fonction de critères spécifiques, utilisez l'opérateur étoile ("*") pour indiquer à la fonction COUNTIF de lier les deux plages définies et d'afficher le résultat.
La syntaxe de la formule serait :
=(COUNTIF(Plage,Critère)>1) * (Nouvelle Condition)
Prenons un exemple.
Critères : Vous souhaitez mettre en évidence toutes les lignes dupliquées, tout en laissant intactes les premières occurrences.
Voici comment procéder dans Google Sheets. Toutes les étapes sont identiques aux approches précédentes, à l'exception de la formule.
La formule à utiliser est la suivante :
=COUNTIF(ArrayFormula($A$3:$A3&$B$3:$B3&$C$3:$C3),$A3&$B3&$C3)>1
Cette formule fait référence aux numéros de cellule de début et de fin.
La feuille Google ci-dessous montre que les premières entrées "Apple" et "Orange" sont ignorées, et que les suivantes sont mises en surbrillance.

Nous avons vu comment mettre en évidence les doublons dans les lignes, les colonnes, et selon des critères spécifiques. Voyons maintenant comment les supprimer rapidement.
Comment Supprimer Rapidement les Doublons ?
Sélectionnez la base de données ou la colonne dont vous souhaitez supprimer les doublons. Dans le menu supérieur, choisissez "Données", puis "Nettoyage des données" et "Supprimer les doublons". Validez en cliquant sur "OK".

Une fenêtre contextuelle s'affichera pour choisir des alternatives et confirmer la suppression des doublons.
Une option "Données comme ligne d'en-tête" est également disponible. Cochez cette case si votre feuille comporte une ligne d'en-tête afin que Google Sheet l'ignore lors de la suppression des doublons.

Après avoir confirmé vos choix et cliqué sur "Supprimer les doublons", les doublons seront éliminés, et le statut suivant sera affiché.

Comment Créer une Liste Unique ?
Extrayons une liste distincte d'une base de données contenant de nombreux doublons.
La formule est très simple à comprendre et à utiliser.
Reprenons l'une de nos feuilles de calcul Google précédentes.
La syntaxe pour créer une liste unique est :
=unique(plage de début: plage de fin)
Dans l'exemple ci-dessous, la formule est appliquée dans la colonne D, la plage de cellules dont nous souhaitons extraire les données uniques est définie. Le résultat est affiché dans la colonne D après exécution.

Comment Supprimer les Espaces Blancs dans Google Sheets ?
Il est fréquent de rencontrer des espaces excessifs dans les cellules, lorsque l'on travaille sur une feuille Google avec du texte ou des données numériques. C'est souvent gênant.
Voyons comment se débarrasser de ces espaces supplémentaires.
Utilisons la feuille Google ci-dessous pour supprimer ces espaces.

Sélectionnez la colonne ou l'ensemble de données contenant des espaces supplémentaires. Dans le menu "Données", choisissez "Nettoyage des données" et "Supprimer les espaces blancs".

Après avoir sélectionné "Supprimer les espaces blancs", le résultat s'affichera comme ci-dessous. La colonne est désormais débarrassée des espaces indésirables.

Derniers Mots
La duplication des données est une perte de temps inutile et peut engendrer des problèmes et erreurs coûteuses.
Si votre feuille Google est de petite taille, vous pouvez les repérer manuellement. Mais si vous avez de nombreuses feuilles, cela serait très long et sujet aux erreurs. Les techniques présentées dans ce guide vous aideront à identifier les doublons et à les supprimer en une seule fois.
N'hésitez pas à consulter la foire aux questions sur Google Sheets.