Proxy : blacklist de mots

Bonjour à tous,

Je cherche une liste de mots à blacklister sur mon proxy.
En effet, j’ai déjà des blacklists sur des urls, mais j’aimerai rajouter une blacklists basées sur des mots / expressions.

Quelqu’un aurait-il une bonne liste à me filer ?

Merci d’avance

Regarde le projet Eole et notamment le proxy parefeu Hamon. Tu auras entre autre tout ce qu’il te faut estampillé Education Nationale…

Merci fran.b, j’étais sur que tu répondrai ^^.

Je vais regarder ça, à mon avis il va falloir aller fouiller dans l’iso car les listes ne sont pas publiées apparement (mais peut être pas encore assez cherché).

En fait, Hamon utilise squidguard (sur les URLs donc) et DNSGuardian. C’est ce dernier point qui t’intéresse non?

Est ce que ce fichier te convient? ftp://eole.orion.education.fr/maj/blacklists/weighted

En fait je vais filtrer des mots dans les urls avec squidguard (sous pfsense qui est un BSD).

La liste m’a l’air pas mal mais pas trop de termes anglais, moi je n’aurai pas à gérer la notion de “score”, vu que celle-ci utilise des scores il va quand même y avoir pas mal de boulot pour l’adapter.

En tout cas, merci pour le lien, en plus sur le ftp il y a des blacklists d’URL qui m’ont l’air pas trop mal.

[quote=“fran.b”]Regarde le projet Eole et notamment le proxy parefeu Hamon. Tu auras entre autre tout ce qu’il te faut estampillé Education Nationale…[/quote]C’est “Amon”… (sans le H) si je n’m’abuse… :unamused: … Ce n’est pas “le seul”…
Le projet Slis est plus ancien (en plus il me semble que ça vient de “par chez toi” themorice… :wink: )
D’après ce que j’en ai entendu dire, l’Amon fait pareil mais ce n’est pas sa fonction première… Avec la solution “Slis” (elle, axée sur la pédagogie), tu as “en plus” du proxy avec filtrage (SquidGuard et DNSGuardian aussi il me semble…) la possibilité d’héberger des adresses mail, un site colaboratif (dans la “dernière” version…)… par contre, la version 4.0 est bien “daubée”, lui préférer pour l’instant la 4.1 (qui est en test actuellement: moins de problèmes… :wink: ). Enfin bon, lui aussi est estampillé Education Nationale mais version “pédagogique” (pas comme l’Amon il me semble…)

C’était juste histoire de mettre mon grain de sable et de sel … :wink:

:smt006

Je connais un peu le projet Slis qui est de chez moi :wink:

Par contre la plateforme que je monte n’a rien à voir avec l’éducation nationale ^^.
Je cherche juste une liste de mots / expressions à faire manger à mon squidguard :smt003

[ :blush: :blush: :blush: ]
C’était juste pour “reprendre” fran.b (j’ai pas pu résister… mon coté cancre surement… :laughing: ). La fonction première d’un serveur Amon n’est pas le filtrage (pas dans le sens où il l’a donné)… c’est tout autre chose… :unamused: … il a beau être marqué “éducation nationnale”, il n’est pas destiné aux “élèves”… (enfin pas d’après les infos que j’en ai eues)
[/ :blush: :blush: :blush: ]

Pour les listes de filtrage, il me semble que ce sont les mêmes… (entre Amon et Slis…)… donc… :unamused:

Aller… je m’en vais… j’arrête de polluer dans support… :wink:

:smt006

Eole est un projet complet avec entre autres Amon (et non Hamon effectivement) qui est la partie accès à Internet. Celle ci définit deux réseau (Pedagogique/Educatif), définit gère une zone DMZ opur l’administratif et incorpore un proxy filtré par SquidGuard + DnsGuardian. C’est ce dernier point qui intéresse ici. Les URLs et listes de mots utilisées sont mises à jour régulièrement sur le site que j’ai indiqué plus haut. Dans le projet Eole, il y a bien d’autres modules et il est effectivement réducteur de limiter Amon à cette seule fonction de Proxy. Amon gère donc d’une part le réseau Administratif (interdit aux élèves: les professeurs et l’administration ont un accès filtré à Internet) et le réseau Pedagogique (pour les élèves, mes salles de classe). Si un élève obtient par une méthode quelconque un accès à Intenert au sein du lycée (branchement pirate par exemple), il est de la responsabilité du lycée qu’il n’ait pas pour autant accès à des sites «interdits»…

Personne n’a une bonne blacklist de mots alors ?

La liste ci dessus filtrée te donne ça: http://boisson.homeip.net/liste_squidquard mais tu vas avoir tous les inconvénients du filtrage par mot: DNSGuardian utilise plus les associations des mots:
seins+gros+mpeg = censuré
seins+gros+nodule = site de médecine = conservé
etc. Si tu te limites juste à des mots comme le fait squidGuard, ça va être rigolo, ça me rappelle le jour où j’ai voulu montrer à ma femme l’efficacité d’internet, elle m’a demandé de faire des recherches sur le syndrome XXX…

ok merci pour la liste François.

Oui je sais que ce n’est pas top de filtrer juste des mots. Mais Dansguardian n’est pas disponible pour la plateforme hébergeant le proxy malheureusement.

Je remonte le fil pour faire un petit retour d’expérience.

J’ai donc mis en place un filtrage basé sur une blacklist d’ip et d’urls.

En dans squidgard j’ai activé le mode “Safe search engine” pour les moteurs de recherche qui le supporte. Je rappelle que ce mode permet d’enlever des recherches les sites réservés aux adultes.

Comme aucun filtrage n’est parfait, je trouve que le mien n’est pas trop mal comme compromis.