La présence de fichiers dupliqués est une nuisance pour tout utilisateur. Ils gaspillent de l’espace de stockage et compliquent l’organisation du système. Heureusement, sous Linux, il existe une solution efficace pour éliminer ces données superflues : l’outil Fdupes.
Installation de Fdupes
Fdupes est un utilitaire en ligne de commande de premier plan pour la déduplication sous Linux. Il permet d’identifier les doublons dans un répertoire donné, de localiser leur emplacement exact et de les transformer en liens symboliques, qu’ils soient physiques ou logiques. Cette approche permet de libérer de l’espace tout en conservant l’accès aux fichiers, mais en utilisant des liens au lieu de copies.
Fdupes est simple à installer et bénéficie d’un support étendu dans la plupart des distributions Linux, y compris FreeBSD. Pour l’installer, ouvrez un terminal et utilisez la commande appropriée à votre distribution.
Ubuntu
sudo apt install fdupes
Debian
sudo apt-get install fdupes
Arch Linux
Fdupes est disponible dans le dépôt « Community » d’Arch Linux. Cependant, ce dépôt n’est pas activé par défaut. Pour installer Fdupes, il faut d’abord modifier le fichier de configuration Pacman.conf.
Ouvrez le fichier avec l’éditeur de texte Nano :
sudo nano /etc/pacman.conf
Dans ce fichier, supprimez les « # » devant les lignes relatives à « Community ». Assurez-vous qu’il n’y ait plus aucun « # », sinon le dépôt ne fonctionnera pas. Une fois les modifications terminées, enregistrez avec Ctrl+O et quittez avec Ctrl+X.
Synchronisez le nouveau dépôt avec Pacman :
sudo pacman -Syy
Maintenant que le dépôt « Community » est synchronisé, vous pouvez installer Fdupes avec la commande :
sudo pacman -S fdupes
Fedora
sudo dnf install fdupes
OpenSUSE
sudo zypper install fdupes
Recherche de doublons
Avant de supprimer les doublons, Fdupes doit les localiser. Le paramètre « -r » permet de lancer une recherche récursive, c’est-à-dire dans tous les dossiers et sous-dossiers de votre système, accélérant considérablement le processus.
Voici comment rechercher et traiter les doublons à différents emplacements de votre ordinateur Linux.
Recherche dans le répertoire personnel
Le répertoire personnel (/home/
) est un lieu de stockage privilégié. Les fichiers s’y accumulent et les doublons y sont fréquents. Pour les identifier, ouvrez un terminal et lancez Fdupes en ciblant votre répertoire personnel.
fdupes -r ~/
Pour analyser le répertoire personnel d’un autre utilisateur, utilisez :
fdupes -r /home/nom_utilisateur/
Après l’analyse, Fdupes affiche une liste des doublons. Pour enregistrer cette information, redirigez la sortie vers un fichier texte dans le dossier Documents.
fdupes -r ~/ >> ~/Documents/fdupes-scan-home.txt
Ou pour un autre utilisateur:
fdupes -r /home/nom_utilisateur/ >> ~/Documents/fdupes-scan-home-user.txt
Analyse du système de fichiers racine
Fdupes peut analyser n’importe quel emplacement, pas seulement le répertoire personnel. Si vous souhaitez rechercher des doublons dans le système de fichiers racine, voici comment procéder.
Dans un terminal, basculez vers le compte root. Cette action est nécessaire car la plupart des emplacements du système de fichiers ne sont pas accessibles à un utilisateur normal.
sudo -s
Ou :
su -
En tant que root, lancez l’analyse avec Fdupes :
fdupes -r /
Vous pouvez également cibler un emplacement spécifique avec :
fdupes -r /emplacement/sur/votre/pc
Pour exporter les résultats dans un fichier texte :
fdupes -r / >> /home/nom_utilisateur/Documents/fdupes-scan.txt
Ou pour un emplacement spécifique:
fdupes -r /emplacement/sur/votre/pc >> /home/nom_utilisateur/Documents/fdupes-scan.txt
Suppression des données redondantes
La recherche des doublons n’est que la première étape. Il faut ensuite les traiter pour libérer de l’espace. Fdupes facilite cette opération en remplaçant les fichiers dupliqués par des liens symboliques, sans rien supprimer physiquement.
Fdupes prend en charge deux types de liens : les liens physiques (hard links) et les liens logiques (soft links). Les liens physiques sont préférables car ils sont indiscernables des fichiers originaux. Cependant, les liens logiques sont également une option. Pour dédupliquer, utilisez les commandes suivantes dans un terminal.
Attention : Ne remplacez pas des fichiers systèmes sans bien comprendre les risques !
Remplacement par liens physiques
fdupes -rH /home/nom_utilisateur/
Pour les doublons dans tout le système:
sudo -s fdupes -rH /emplacement/du/fichier
Remplacement par liens logiques
fdupes -rS /home/nom_utilisateur/
Ou pour l’ensemble du système:
fdupes -rS /emplacement/du/fichier