@kripteks >

Désolé mais c’est relativement drôle. D’autres ici (Fraçois en tête) t’expliquerais mieux que moi que c’est une question de mathématiques.
Comme tu le sait, on peut voir un fichier comme un nombre (disons n). On peut voir un algorithme de compression comme une fonction (disons f).
Pour compresser ton fichier tu fait un simple :
Bon ça c’est bien beau mais un algorithme de compression ne sert à rien sans son pendant qui décompresse (disons f’) et tu veux obtenir à tout prix que :
On est bien d’accord que pour un nombre n la fonction f doit associer une valeur unique et de même pour f’. Dis de manière plus mathématiques :
pour e = f(n) et e' = f(n')
si e = e' alors n = n'
C’est ce que l’on appel la bijection si je ne me trompe pas.
Maintenant n doit être n’importe quel fichier, donc n est n’importe quel entier naturel (on dit que f est défini pour tout N (le beau N pour les entier naturel).
Ce que tu recherche c’est à ce que c (le résultat), soit dans disons 50 digits.
Donc c peut prendre 10⁵⁰, donc si on respecte la bijection on ne peut compresser que 10⁵⁰ fichiers différents.
C’est là tout le problème des algorithmes de hashage. Ils donnent une même valeur pour des fichiers différents. On appel ça les collisions. Ce ne sont pas des fonctions bijectives.
Les algorithmes de compressions ne se donnent pas de limitent dans la taille de la sortie. Ils essaient juste que log_2© < log_2(n), mais ce n’est en aucun cas une garantie ! (tu peut même avoir des cas où log_2© > log_2(n)).
Note : pourquoi je parle du log_2 (log en base 2). En informatique on compte en binaire (et pas en base 10). Le log en base 2 d’un nombre indique le nombre de bits (-1) nécessaire pour coder un nombre (c’est une grosse approximation). Par exemple pour 4, log_2(4) = 2, donc il faut 3 bits pour stocker 4 en binaire (100). Le +1 viens du fait qu’il faut coder le 0, donc log_2(4) donne le place qu’il faut pour coder 4 valeurs différentes (0, 1, 2 et 3).
Voila je pense ne pas avoir dis trop de conneries ni en mathématiques, ni en théorie de l’information (je serais content si quelqu’un m’écharpe là dessus histoire que je ravive un petit peu mes vieux cours).