à priori, google indexe mieux les urls plus courtes.
Il y a donc un gain SEO si on privilègie le ndd court comme forme canonique, et si on redirige toutes les déclinaisons en 301 vers ndd.tld plutot que www.ndd.tld dés la création du site.
Par contre, Matt CUTTS disait qu’il y avait une trés légère perte de jus lors de la redirection 301 d’un lien externe vers son équivalent en forme canonique, donc quand un site est linké sous plusieurs noms, il vaut mieux choisir comme canonique la forme qui accueille le plus de liens entrants.
En clair, ça aurait été une bonne idée, mais c’est trop tard, et désormais il faut privilégier www.debian-fr.org, j’ai tout compris?
C’est ça.
[quote=“mattotop”]à priori, google indexe mieux les urls plus courtes.
Il y a donc un gain SEO si on privilègie le ndd court comme forme canonique, et si on redirige toutes les déclinaisons en 301 vers ndd.tld plutot que ndd.tld dés la création du site.
Par contre, Matt CUTTS disait qu’il y avait une trés légère perte de jus lors de la redirection 301 d’un lien externe vers son équivalent en forme canonique, donc quand un site est linké sous plusieurs noms, il vaut mieux choisir comme canonique la forme qui accueille le plus de liens entrants.[/quote]
Mais pourquoi parles tu de redirection 301 ? Déclarer deux ndd dans un virutalhost de génère pas de latence. Pour moi il n’y a pas de notion de link. Le virutalhost écoute nativement sur les deux ndd donc il n’y a pas de redirection même au sein du serveur web.
Quand tu as deux alias pour un même site, c’est toujours mieux de forcer un des deux à rediriger les utilisateurs sur l’autre.
Les moteurs de recherche n’aiment pas les contenus dupliqués (oui, domaine.com/page.html sont considérés comme deux pages différentes avec du contenu dupliqué).
Maintenant on peut rajouter dans la page HTML elle-même une balise pour spécifier l’URL canonique mais…
- faut le mettre en place
- les URLs ne sont toujours pas normalisées, ce qui favorise les liens entrants disparates et a un impact sur le classement comme l’explique mattotop.
C’est quand même vachement plus simple de coller une redirection 301 pour toutes les pages, ça a l’avantage de normaliser toutes les URLs actuelles et futures sans aucun effort à fournir.
syam a bien résumé. Si on sert le même rep au travers de deux urls/vhosts distincts, il se peut que google considère qu’il y a deux sites, et que l’un est copie de l’autre. Dans ce cas, il flingue la copie et la relègue au fond des classements.
Dans le cas du doublon entre www et non www, le problème est que google voit apparaitre indifférement des copies de pages sur l’un ou l’autre des deux “sites” suivant l’ordre dans lequel il les crawle, et faute de savoir lequel des deux est le copieur, il flingue les deux sites.
et si on fait un Rewrite par exemple www.debian-fr.org -> debian-fr.org ou l’inverse, est ce que ça règle le pbm pour google? J’imagine que oui, par contre un ProxyPass doit être considéré comme une copie?
Je ne sais pas, je ne connais pas proxypass, je n’ai pas encore rencontré de cas ou google voyait deux sites à cause de ça, mais les causes de doublons sont variées.
En fait, souvent, l’algorithme de google finit par régler le problème en convergeant: une url en particulier va devenir pour diverses raisons (psychologie, création artificielle de liens) la forme la plus référencée par des liens exterieurs, donc elle devient celle qui est la plus crawlée, du coup, elle est plus souvent considèrée comme source d’originaux, lors des mises à jours, jusqu’au moment ou google la choisit comme forme canonique. Mais cette stabilisation peut prendre longtemps à arriver, des mois voire des années si on ne fait rien pour guider google a trouver sa forme canonique.
En plus, en jouant sur les redirections http bien clean au lieu de laisser les liens se diluer sur diverses urls que google considèrera comme des doublons, on peut rediriger le “jus” de tous les liens vers des formes non canonique vers une forme qu’on a choisie comme étant canonique, et la “meilleure” redirection semble être la 301.
C’est le même caca quand une logique de site permet d’accèder à un même contenu par plusieurs chemins, google rame à bien ranger les choses si on le laisse choisir, il faut l’aider.
Bien par exemple, ma config de clefagreg est la suivante:
ProxyPass /Proxy http://phare.normalesup.org/~boisson
RewriteEngine on
RewriteRule ^/ftp/(.*) ftp://ftp.ens.fr/clefagreg/$1
RewriteRule ^/debian/(.*) ftp://ftp.ens.fr/clefagreg/debian/$1
RewriteRule ^/([^/]*).zip ftp://ftp.ens.fr/clefagreg/Zip/$1.zip
RewriteRule ^/([^/]*).bz2 ftp://ftp.ens.fr/clefagreg/Bz2/$1.bz2
RewriteRule ^/([^/]*).iso ftp://ftp.ens.fr/clefagreg/Iso/$1.iso
RewriteRule ^/([^/]*).sqh ftp://ftp.ens.fr/clefagreg/Sqh4/$1.sqh
La première fait que si quelqu’un charge phare.normalesup.org/~boisson/Cl … .6-rc1.iso (ça évite un débit minable de 100K/s…), note que je viens de voir que le code dans les logs est 301, ce qui semble donc parfait.
Par contre, un chargement d’un fichier .sqh donne un code 302:
GET /extension_rtl8192-37.sqh HTTP/1.1" 302 394
Finalement tout ça doit être bien gérer par les moteurs de recherche.
Ton exemple signifie que les gens qui font un lien vers phare.normalesup.org/~boisson/Cl … .6-rc1.iso, car google voit la redirection 301.
Ton serveur clefagreg ne profite donc pas de tous les gens qui font du lien vers ta clé.
[quote=“mattotop”]Ton exemple signifie que les gens qui font un lien vers phare.normalesup.org/~boisson/Cl … .6-rc1.iso, car google voit la redirection 301.
Ton serveur clefagreg ne profite donc pas de tous les gens qui font du lien vers ta clé.[/quote]
Groumf, pourtant l’URL reste inchangée pour le client dans un tel cas (essaye un wget clefagreg.dnsalias.org/Proxy/Cle … .6-rc1.iso). Mieux, si le serveur est derrière un routeur, les paquets font Origine -> Routeur -> Client.
Pour la réecriture d’URL, par contre l’URL est réécrite et le client voit le changement.
Je viens de tester, et mon download manager de firefox me demande si je veux charger le fichier depuis normalesup.org.
D’ailleurs, comme l’indique annuaire-info.com/outil-refe … direction/
[quote]Lien testé : clefagreg.dnsalias.org/Proxy/Cle … .6-rc1.iso
Type de redirection : 301
Redirigé vers : normalesup.org
Je te rassure, avec un rythme de création de liens de 50 par mois sur un grand nombre de domaines, dont des “educational”, et en particulier une accélération à 170 nouveaux liens depuis 40 domaines sur les 30 dernier jours, ce n’est pas demain que ton site décrochera de l’expression “clef agreg” !
A noter que je n’ai jamais vu de domaine dyndns placés comme ça sur une expression de google avec les sitelinks et tout.
Mais en introduisant en quelques autres expressions qui iraient ramasser autre chose que des futurs agrégés, tu pourrais te permettre d’aller chercher d’autres publics.
Et sinon tu as un PR de 4, donc tu pourrais faire financer les couts d’entretien de clefagreg sur un vrai hébergement, par exemple 3 sponsors (des écoles par exemple) à qui tu mettrais un beau lien sortant dans une bonne phrase de présentation de ton partenariat. Pour peu que tu obtiennes un nom de sous domaine quelque part en “educational”, tes liens vaudront de l’or pour tes sponsors.
C’est les outils google qui te donnent tout ça? Je vais essayer de comprendre comment ça marche (et tes suggestions), j’avoue que je ne me suis pas posé ce genre de questions.