Voilà, j’ai un vrac de photos de familles, ou j’ai des photos qui portent le même nom dans des répertoires différents mais qui sont la même photo à des résolutions différentes. J’en ai d’autres que j’avais commencé à renommer, et qui portent en doublon ou trouplon des noms diférents avec un contenu identique.
Je voudrais cleaner un peu tout ça, et surtout, éliminer les doublons. Vu que j’en suis à plusieurs milliers, j’aimerai bien faire ça automatiquement, bien sûr.
Comment élimineriez vous les doublons sur le contenu, déjà ?
Salut,
Par leur md5 ?
#!/bin/sh
FIC=$1
MD5=`md5sum $FIC | awk '{print $1}'`
if grep -q $MD5 liste_md5 ; then
mv $FIC Doublons
else
echo $MD5 >> liste_md5
mv $FIC Originaux
fi
Va voir http://forum.debian-fr.org/viewtopic.php?f=3&t=14515
Regarde aussi du coté de fslint ça pourra sûrement t’aider
[quote]debian:/etc/apache2# aptitude show fslint
Paquet : fslint
État: installé
Automatiquement installé: non
Version : 2.26-2
Priorité : optionnel
Section : admin
Responsable : Pádraig Brady P@draigBrady.com
Taille décompressée : 579k
Dépend: python (>= 2.0), python-gtk2, python-glade2
Description : A utility to fix problems with filesystems’ data, like duplicate files
FSlint is a toolkit to clean filesystem lint. It includes a GTK+ GUI as well as a command line interface and can be used to
reclaim disk space. It has an interface for uninstalling packages, and it can find things like:
- Duplicate files
- Problematic filenames
- Temporary files
- Bad symlinks
- Empty directories
- Nonstripped binaries
Site : http://www.pixelbeat.org/fslint/
[/quote]
fdupes fonctionne pas mal non plus pour les doublons (à condition que les fichiers soient strictement identiques) 
par contre pour que tu puisses détecter les photos identiques mais à des résolutions différentes je vois pas comment faire 
quote="barbak"
par contre pour que tu puisses détecter les photos identiques mais à des résolutions différentes je vois pas comment faire
[/quote]Non non. Je n’ai pas besoin de ça, surtout des doublons qui n’ont pas le même nom.
Mais je vais essayer tout ça dés que j’aurais un peu de temps.
J’ai moi même testé la technique du petit script avec un MD5 sur une armée de pdf et c’est nickel.
Au niveau temps d’exécution compte quand même bien quelques minutes
(je sais plus exactement)
Digikam + kipi (plugin).
Il y a un moteur de recherche d’images semblables (je ne l’ai pas testé
).