bonjour tout le monde
je tente d 'extraire de informations de pages web… non pas pour du spam…
mais pour remettre a jour certaines informations.
voici mon debut mais … pas top
je pense le faire avec httrack mais pour le moment ca ne marche pas…
et surtout ca prend trop de place…
for i in $( cat 15.txt ) ; do webcheck -f $i | grep consultation >> result.txt; done;
ps: 15.txt comprends 300 sites
pour le moment je ne vois que les liens et non les informations neccessaires a ma recherche
avez vous des solutions plus simple pour eviter des usines a gaz?
merci pour vos pistes