By Walid ETTAYEB

Si vous êtes comme moi, vous avez peut-être accumulé des années de données que vous avez sauvegardées d'une machine à une autre, d'un vieux disque dur à un nouveau disque, à un disque dur plus grand, et ainsi de suite...

Cette année, j'ai fusionné plusieurs disques de sauvegarde sur un nouveau disque dur et j'ai réalisé que j'avais facilement plusieurs centaines de gigaoctets de données en double à travers les disques dans différents dossiers et emplacements.

Ma première idée était de tenter de supprimer les copies manuellement, mais j'ai rapidement réalisé que c'était une tâche fastidieuse et difficile. Alors, qu'ai-je fait? Je suis allé sur Google et j'ai trouvé environ 5 ou 6 outils qui prétendent pouvoir le faire. J'ai éliminé les outils uniquement disponibles sur Windows et j'ai continué avec les trois restants. Ensuite, j'ai creusé un peu et j'ai lu leurs documentations, et finalement, j'ai décidé d'essayer rdFind.

Permettez-moi de dire que cela a très bien fonctionné. Il m'a aidé à identifier 355 Go de fichiers en double, et après une simulation pour identifier et s'assurer qu'il les identifiait correctement, il m'a aidé à supprimer les doublons en ne conservant qu'une copie.

Comment ça fonctionne ?

Tout d'abord, rdFind vérifie les fichiers en comparant leurs premiers et derniers bits, puis il crée un hachage de chaque fichier (que vous pouvez définir), et le compare à tous les autres fichiers. Il utilise ces différentes méthodes d'identification de fichiers pour déterminer plus précisément quels fichiers sont des doublons réels et non simplement nommés de manière similaire ou similaires en taille.

Installer rdFind

Pour les systèmes Ubuntu/Debian :

sudo apt install rdfind 

Pour Fedora / CentOS / Red Hat avec dnf :

sudo dnf install rdfind 

Vous pouvez également l'exécuter sous Windows avec CygWin ou MacOS avec une installation HomeBrew.

Les bases de l'exécution de rdFind

Chaque fois que vous voulez plus d'informations sur l'utilisation d'un outil en ligne de commande, vous pouvez utiliser la commande man suivie du nom de l'outil. Dans ce cas, nous pouvons utiliser :

man rdfind

pour voir une tonne d'options d'utilisation et d'informations.

Notre objectif est de chercher à l'intérieur d'un répertoire/disque dur et de tous ses sous-répertoires (de manière récursive) et laisser rdFind rechercher tous les fichiers en double. Mais avant de supprimer quoi que ce soit, nous allons faire une simulation juste pour voir ce qui est identifié comme des doublons et nous assurer que tout est correct. Cela nous aide à nous protéger contre la perte de données indésirables.

rdfind -dryrun true <Chemin du dossier>

En fonction de la taille du disque dur et de la quantité de données dans le disque dur ou le répertoire que vous souhaitez analyser, l'analyse peut prendre de quelques millisecondes à plusieurs heures.

Sur mon disque dur de 4 To, la simulation a pris environ 45 minutes.

Une fois terminé, la simulation fournit un fichier appelé results.txt dans le répertoire où vous avez lancé l'analyse.

Vous pouvez consulter le contenu de results.txt avec n'importe quel éditeur de texte que vous souhaitez et vérifier ce qui a été identifié comme fichier en double.

Lorsque vous êtes prêt à supprimer les doublons, vous pouvez exécuter la même commande avec un argument différent.

rdfind -deleteduplicates true <Chemin du dossier>

Cette fois, l'analyse réidentifiera les fichiers en double et les supprimera du disque dur ou du répertoire.

⚠️
Ne lancez pas cette analyse avant d'avoir vérifié trois fois le chemin vers le disque dur ou le répertoire que vous souhaitez analyser. Une fois terminé, cela ne peut pas être annulé.

Conclusion

En fin de compte, rdFind est un excellent outil pour trouver et supprimer les fichiers en double, vous permettant de libérer de l'espace sur votre disque dur ou de simplifier la gestion de vos fichiers.

Cependant, n'oubliez pas qu'il est important de vérifier soigneusement les résultats avant de supprimer quoi que ce soit pour éviter toute perte de données indésirable.

Utilisez-le avec sagesse et assurez-vous d'avoir une sauvegarde de vos données importantes avant de l'utiliser.

Walid ETTAYEB • 36 Articles

Passionné par l'informatique depuis mon plus jeune âge, je transforme ma passion en expertise.

View Articles