Nieuws:

Welkom, Gast. Alsjeblieft inloggen of registreren.
Heb je de activerings-mail niet ontvangen?

Auteur Topic: Tool verwijderen dubbele bestanden  (gelezen 2498 keer)

Offline MKe

  • Lid
Re: Tool verwijderen dubbele bestanden
« Reactie #25 Gepost op: 2016/04/23, 21:11:45 »
Tja, als de bestanden niet exact gelijk zijn kun je niet op checksum zoeken. Als dan ook de namen nog afwijken, dan blijft er weinig meer over dan visueel en met het handje vergelijken. Een deep learning algoritme zou kunnen helpen. maar ik denk dat je sneller bent als je dit gewoon zelf met de hand zou doen.

Met wat programmeer ervaring zou je misschien ImageHash (https://github.com/JohannesBuchner/imagehash) kunnen gebruiken.
« Laatst bewerkt op: 2016/04/23, 21:15:26 door MKe »
Mijn blokkendoos blog: http://mke21.wordpress.com/

Offline Jenske

  • Lid
Re: Tool verwijderen dubbele bestanden
« Reactie #26 Gepost op: 2016/04/24, 15:35:36 »
Als het gaat over vergelijken van afbeeldingen (jpg, tiff, ...) klopt de uitleg hieronder niet helemaal. Je kan wel degelijk in programma's als Digikam een "digitale vingeradruk" van de foto's laten maken en deze dan onderling vergelijken. Het programma geeft dan een reeks foto's, waarvan JIJ kiest hoe "zwaar" ze moeten op elkaar gelijken: 98%, 90%, 50% ...
Het principe van deze programma's is dat ze écht naar de grafische inhoud gaan kijken en zich niet bezighouden met de naamgeving of binaire truuken zoals CRC's en dergelijke.

Je kan dus zelfs beelden die omgekeerd zijn ten opzicht van elkaar of een kleuren- met een zwartwitversie vergelijken, een gekanteld beeld met een gecropt enzovoort. Maar als je, zoals ik, vele duizenden afbeeldingen hebt, kan het lang -- meerdere uren -- duren voor heel je beeldenverzameling is ge-fingerprint.


Tja, als de bestanden niet exact gelijk zijn kun je niet op checksum zoeken. Als dan ook de namen nog afwijken, dan blijft er weinig meer over dan visueel en met het handje vergelijken. Een deep learning algoritme zou kunnen helpen. maar ik denk dat je sneller bent als je dit gewoon zelf met de hand zou doen.

Met wat programmeer ervaring zou je misschien ImageHash (https://github.com/JohannesBuchner/imagehash) kunnen gebruiken.
.. Kubuntu 23.10 op een ...
.. geen idee welk computermerk, 32 Gbyte RAM, 4 Gbyte video-RAM

Offline MKe

  • Lid
Re: Tool verwijderen dubbele bestanden
« Reactie #27 Gepost op: 2016/04/24, 16:03:08 »
Waarschijnlijk gebruikt digikam ook een Imagehash. Uiteindelijk komt het toch neer op visueel checken.

Offline Jenske

  • Lid
Re: Tool verwijderen dubbele bestanden
« Reactie #28 Gepost op: 2016/04/24, 16:44:11 »
Oeps, ik dacht dat je met "visueel" bedoelde: door je foto's zelf met je eigen ogen te vergelijken. In die zin had je gelijk, natuurlijk.

Waarschijnlijk gebruikt digikam ook een Imagehash. Uiteindelijk komt het toch neer op visueel checken.
.. Kubuntu 23.10 op een ...
.. geen idee welk computermerk, 32 Gbyte RAM, 4 Gbyte video-RAM