Comment supprimer des données redondantes sous Linux avec Fdupes



La présence de fichiers dupliqués est une nuisance pour tout utilisateur. Ils gaspillent de l’espace de stockage et compliquent l’organisation du système. Heureusement, sous Linux, il existe une solution efficace pour éliminer ces données superflues : l’outil Fdupes.

Installation de Fdupes

Fdupes est un utilitaire en ligne de commande de premier plan pour la déduplication sous Linux. Il permet d’identifier les doublons dans un répertoire donné, de localiser leur emplacement exact et de les transformer en liens symboliques, qu’ils soient physiques ou logiques. Cette approche permet de libérer de l’espace tout en conservant l’accès aux fichiers, mais en utilisant des liens au lieu de copies.

Fdupes est simple à installer et bénéficie d’un support étendu dans la plupart des distributions Linux, y compris FreeBSD. Pour l’installer, ouvrez un terminal et utilisez la commande appropriée à votre distribution.

Ubuntu

sudo apt install fdupes

Debian

sudo apt-get install fdupes

Arch Linux

Fdupes est disponible dans le dépôt « Community » d’Arch Linux. Cependant, ce dépôt n’est pas activé par défaut. Pour installer Fdupes, il faut d’abord modifier le fichier de configuration Pacman.conf.

Ouvrez le fichier avec l’éditeur de texte Nano :

sudo nano /etc/pacman.conf

Dans ce fichier, supprimez les « # » devant les lignes relatives à « Community ». Assurez-vous qu’il n’y ait plus aucun « # », sinon le dépôt ne fonctionnera pas. Une fois les modifications terminées, enregistrez avec Ctrl+O et quittez avec Ctrl+X.

Synchronisez le nouveau dépôt avec Pacman :

sudo pacman -Syy

Maintenant que le dépôt « Community » est synchronisé, vous pouvez installer Fdupes avec la commande :

sudo pacman -S fdupes

Fedora

sudo dnf install fdupes

OpenSUSE

sudo zypper install fdupes

Recherche de doublons

Avant de supprimer les doublons, Fdupes doit les localiser. Le paramètre « -r » permet de lancer une recherche récursive, c’est-à-dire dans tous les dossiers et sous-dossiers de votre système, accélérant considérablement le processus.

Voici comment rechercher et traiter les doublons à différents emplacements de votre ordinateur Linux.

Recherche dans le répertoire personnel

Le répertoire personnel (/home/) est un lieu de stockage privilégié. Les fichiers s’y accumulent et les doublons y sont fréquents. Pour les identifier, ouvrez un terminal et lancez Fdupes en ciblant votre répertoire personnel.

fdupes -r ~/

Pour analyser le répertoire personnel d’un autre utilisateur, utilisez :

fdupes -r /home/nom_utilisateur/

Après l’analyse, Fdupes affiche une liste des doublons. Pour enregistrer cette information, redirigez la sortie vers un fichier texte dans le dossier Documents.

fdupes -r ~/ >> ~/Documents/fdupes-scan-home.txt

Ou pour un autre utilisateur:

fdupes -r /home/nom_utilisateur/ >> ~/Documents/fdupes-scan-home-user.txt

Analyse du système de fichiers racine

Fdupes peut analyser n’importe quel emplacement, pas seulement le répertoire personnel. Si vous souhaitez rechercher des doublons dans le système de fichiers racine, voici comment procéder.

Dans un terminal, basculez vers le compte root. Cette action est nécessaire car la plupart des emplacements du système de fichiers ne sont pas accessibles à un utilisateur normal.

sudo -s

Ou :

su -

En tant que root, lancez l’analyse avec Fdupes :

fdupes -r /

Vous pouvez également cibler un emplacement spécifique avec :

fdupes -r /emplacement/sur/votre/pc

Pour exporter les résultats dans un fichier texte :

fdupes -r / >> /home/nom_utilisateur/Documents/fdupes-scan.txt

Ou pour un emplacement spécifique:

fdupes -r /emplacement/sur/votre/pc >> /home/nom_utilisateur/Documents/fdupes-scan.txt

Suppression des données redondantes

La recherche des doublons n’est que la première étape. Il faut ensuite les traiter pour libérer de l’espace. Fdupes facilite cette opération en remplaçant les fichiers dupliqués par des liens symboliques, sans rien supprimer physiquement.

Fdupes prend en charge deux types de liens : les liens physiques (hard links) et les liens logiques (soft links). Les liens physiques sont préférables car ils sont indiscernables des fichiers originaux. Cependant, les liens logiques sont également une option. Pour dédupliquer, utilisez les commandes suivantes dans un terminal.

Attention : Ne remplacez pas des fichiers systèmes sans bien comprendre les risques !

Remplacement par liens physiques

fdupes -rH /home/nom_utilisateur/

Pour les doublons dans tout le système:

sudo -s
fdupes -rH /emplacement/du/fichier

Remplacement par liens logiques

fdupes -rS /home/nom_utilisateur/

Ou pour l’ensemble du système:

fdupes -rS /emplacement/du/fichier