Statistiques de téléchargement d'un référentiel

Bonjour,

J’ai créé un référentiel pour distribuer mes paquets et j’aimerai connaitre les statistiques de téléchargement.

Existe-t-il un logiciel qui fait ça ?

Ça n’est pas simple, il te faut tenir compte de plusieurs choses:

  • Les robots: Je te suggère de peaufiner ton robots.txt si tu le peux, les robots stupides, particulièrement yahoo.crawler, téléchargent tout, ça peut représenter jusqu’à 1/3 du traffic.
  • Les abrutis qui utilisent des accélérateurs de connexions, ceux là te balancent parfois une centaine de lignes de requêtes de connexion pour un seul téléchargemenl. Tu as donc intérêt à filtrer sur les requêtes abouties (code retour 200)
  • Les gars qui téléchargent 10 fois le même paquet/la même ISO

En tenant compte de tout ça, tu t’aperçois que les logiciels genre webalizer ou awstats te fournissent des chiffres pas toujours fiables. Celui qui me parait le plus simple à bien paramétrer dans ce sens serait webalizer. Mais finalement, un petit script perso à base de grep/awk/sed est le plus efficace.

Peaufiner… Je me suis contenté d’exclure l’arborescence du dépôt. Je ferais une belle page d’accueil pour éviter le référencement d’une page vide.

De toutes façons, j’utilise phpmyvisites, donc difficile de l’utiliser dans ce cas…

J’espérais pouvoir utiliser Debian Popularity Contest, mais c’est une tâche cron qui envoi un mail. Si quelqu’un à ce genre de script sous la main, je suis preneur, en attendant je vais me lancer dans cette voie :wink:

Merci.