Zoeken op website

5 beste tools om dubbele bestanden in Linux te vinden en te verwijderen


Het organiseren van uw thuismap of zelfs uw systeem kan bijzonder moeilijk zijn als u de gewoonte heeft allerlei dingen van internet te downloaden met behulp van uw downloadmanagers.

Vaak zul je merken dat je dezelfde mp3, pdf en epub (en allerlei andere bestandsextensies) hebt gedownload en naar verschillende mappen hebt gekopieerd. Dit kan ervoor zorgen dat uw mappen vol raken met allerlei nutteloze dubbele dingen.

In deze tutorial leer je hoe je dubbele bestanden in Linux kunt vinden en verwijderen met behulp van de opdrachtregelprogramma's rdfind, fdupes en rmlint , evenals het gebruik van GUI-tools genaamd DupeGuru en FSlint.

Een waarschuwing: wees altijd voorzichtig met wat u op uw systeem verwijdert, omdat dit kan leiden tot ongewenst gegevensverlies. Als u een nieuwe tool gebruikt, probeer deze dan eerst in een testmap, waar het verwijderen van bestanden geen probleem zal zijn.

1. Rdfind – Vind dubbele bestanden in Linux

Rdfind komt van redundant data find, een gratis opdrachtregelprogramma dat wordt gebruikt om dubbele bestanden in of binnen meerdere mappen te vinden. Het scant recursief mappen en identificeert bestanden met identieke inhoud, zodat u passende acties kunt ondernemen, zoals het verwijderen of verplaatsen van de duplicaten.

Rdfind gebruikt een algoritme om de bestanden te classificeren en detecteert welke van de duplicaten het originele bestand is en beschouwt de rest als duplicaten.

De regels voor het rangschikken zijn:

  • Als A werd gevonden tijdens het scannen van een invoerargument eerder dan B, is A hoger gerangschikt.
  • Als A werd gevonden op een diepte lager dan B, staat A hoger gerangschikt.
  • Als A eerder werd gevonden dan B, staat A hoger gerangschikt.

De laatste regel wordt vooral gebruikt als er twee bestanden in dezelfde map worden gevonden.

Installeer Rdfind op Linux

Om rdfind in Linux te installeren, gebruikt u de volgende opdracht, afhankelijk van uw Linux-distributie.

sudo apt install rdfind         [On Debian, Ubuntu and Mint]
sudo yum install rdfind         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/rdfind  [On Gentoo Linux]
sudo apk add rdfind             [On Alpine Linux]
sudo pacman -S rdfind           [On Arch Linux]
sudo zypper install rdfind      [On OpenSUSE]    

Om rdfind in een map uit te voeren, typt u eenvoudigweg rdfind en de doelmap.

rdfind /home/user

Zoals je kunt zien zal rdfind de resultaten opslaan in een bestand met de naam results.txt dat zich in dezelfde map bevindt als waar je het programma hebt uitgevoerd. Het bestand bevat alle dubbele bestanden die rdfind heeft gevonden. U kunt het bestand bekijken en de dubbele bestanden handmatig verwijderen als u dat wilt.

Een ander ding dat u kunt doen is de -dryrun gebruiken, een optie die een lijst met duplicaten weergeeft zonder enige actie te ondernemen:

rdfind -dryrun true /home/user

Wanneer u de duplicaten vindt, kunt u ervoor kiezen deze te vervangen door harde links.

rdfind -makehardlinks true /home/user

En als u de duplicaten wilt verwijderen, kunt u uitvoeren.

rdfind -deleteduplicates true /home/user

Om andere nuttige opties van rdfind te bekijken, kun je de rdfind handleiding gebruiken.

man rdfind 

2. Fdupes – Scannen op dubbele bestanden in Linux

Fdupes is een ander opdrachtregelprogramma waarmee u dubbele bestanden op uw systeem kunt identificeren. Het doorzoekt mappen recursief, waarbij bestandsgroottes en inhoud worden vergeleken om duplicaten te identificeren.

Het gebruikt de volgende methoden om dubbele bestanden te bepalen:

  • Vergelijking van gedeeltelijke md5sum-handtekeningen
  • Volledige md5sum-handtekeningen vergelijken
  • byte-voor-byte vergelijkingsverificatie

Net als rdfind heeft het vergelijkbare opties:

  • Zoek recursief
  • Sluit lege bestanden uit
  • Toont de grootte van dubbele bestanden
  • Verwijder duplicaten onmiddellijk
  • Bestanden met een andere eigenaar uitsluiten

Installeer Fdupes in Linux

Om fdupes in Linux te installeren, gebruikt u de volgende opdracht, afhankelijk van uw Linux-distributie.

sudo apt install fdupes         [On Debian, Ubuntu and Mint]
sudo yum install fdupes         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/fdupes  [On Gentoo Linux]
sudo apk add fdupes             [On Alpine Linux]
sudo pacman -S fdupes           [On Arch Linux]
sudo zypper install fdupes      [On OpenSUSE]    

De syntaxis van Fdupes is vergelijkbaar met rdfind. Typ eenvoudigweg de opdracht gevolgd door de map die u wilt scannen.

fdupes <dir>

Om bestanden recursief te doorzoeken, moet u de -r een optie als deze opgeven.

fdupes -r <dir>

U kunt ook meerdere mappen opgeven en een map opgeven waarin recursief moet worden gezocht.

fdupes <dir1> -r <dir2>

Om fdupes de grootte van de dubbele bestanden te laten berekenen, gebruikt u de -S optie.

fdupes -S <dir>

Om samengevatte informatie over de gevonden bestanden te verzamelen, gebruikt u de -m optie.

fdupes -m <dir>

Als u ten slotte alle duplicaten wilt verwijderen, gebruikt u -d, een optie zoals deze.

fdupes -d <dir>

Fdupes zal vragen welke van de gevonden bestanden verwijderd moeten worden. U moet het dossiernummer invoeren:

Een oplossing die zeker niet wordt aanbevolen is het gebruik van de -N optie, waardoor alleen het eerste bestand behouden blijft.

fdupes -dN <dir>

Voor een lijst met beschikbare opties voor gebruik met fdupes raadpleegt u de helppagina door deze uit te voeren.

fdupes -help

3. Rmlint – Verwijder dubbele bestanden

Rmlint is een opdrachtregelprogramma dat wordt gebruikt voor het vinden en verwijderen van dubbele en pluisachtige bestanden op Linux-systemen. Het helpt bij het identificeren van bestanden met identieke inhoud, evenals verschillende vormen van redundantie of lint, zoals lege bestanden, verbroken symbolische koppelingen en verweesde bestanden.

Installeer Rmlint op Linux

Om Rmlint onder Linux te installeren, gebruikt u de volgende opdracht, afhankelijk van uw Linux-distributie.

sudo apt install rmlint         [On Debian, Ubuntu and Mint]
sudo yum install rmlint         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/rmlint  [On Gentoo Linux]
sudo apk add rmlint             [On Alpine Linux]
sudo pacman -S rmlint           [On Arch Linux]
sudo zypper install rmlint      [On OpenSUSE]    

4. dupeGuru – Vind dubbele bestanden in een Linux

dupeGuru is een open-source en platformonafhankelijke tool die kan worden gebruikt om dubbele bestanden op een Linux-systeem te vinden. De tool kan bestandsnamen of inhoud in een of meer mappen scannen. Hiermee kunt u ook de bestandsnaam vinden die vergelijkbaar is met de bestanden waarnaar u zoekt.

dupeGuru is verkrijgbaar in verschillende versies voor Windows-, Mac- en Linux-platforms. Dankzij het snelle fuzzy matching-algoritme kunt u binnen een minuut dubbele bestanden vinden. Het is aanpasbaar, u kunt precies de gewenste dubbele bestanden ophalen en ongewenste bestanden van het systeem verwijderen.

Installeer dupeGuru op Linux

Om dupeGuru in Linux te installeren, gebruikt u de volgende opdracht, afhankelijk van uw Linux-distributie.

sudo apt install dupeguru         [On Debian, Ubuntu and Mint]
sudo yum install dupeguru         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/dupeguru  [On Gentoo Linux]
sudo apk add dupeguru             [On Alpine Linux]
sudo pacman -S dupeguru           [On Arch Linux]
sudo zypper install dupeguru      [On OpenSUSE]    

5. FSlint – Dubbele bestandszoeker voor Linux

FSlint is een gratis hulpprogramma dat wordt gebruikt om verschillende vormen van lint op een bestandssysteem te vinden en op te schonen. Het rapporteert ook dubbele bestanden, lege mappen, tijdelijke bestanden, dubbele/conflicterende (binaire) namen, slechte symbolische links en nog veel meer. Het heeft zowel opdrachtregel- als GUI-modi.

Het is echter belangrijk op te merken dat FSlint sinds mijn kennisonderbreking in september 2022 voor het laatst is bijgewerkt in 2013 en mogelijk niet actief wordt onderhouden of compatibel is met nieuwere Linux-distributies.

Installeer FSlint op Linux

Om FSlint in Linux te installeren, gebruikt u de volgende opdracht, afhankelijk van uw Linux-distributie.

sudo apt install fslint         [On Debian, Ubuntu and Mint]
sudo yum install fslint         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/fslint  [On Gentoo Linux]
sudo apk add fslint             [On Alpine Linux]
sudo pacman -S fslint           [On Arch Linux]
sudo zypper install fslint      [On OpenSUSE]    

Conclusie

Dit zijn zeer nuttige hulpmiddelen om dubbele bestanden op je Linux-systeem te vinden, maar je moet heel voorzichtig zijn bij het verwijderen van dergelijke bestanden.

Als u niet zeker weet of u een bestand nodig heeft of niet, kunt u beter een back-up van dat bestand maken en de map onthouden voordat u het verwijdert. Als u vragen of opmerkingen heeft, kunt u deze in het opmerkingengedeelte hieronder indienen.