Projet:Correction des liens externes

Projet Correction des liens externes

Sur Wikipédia en français, des dizaines de liens sont créés chaque jour vers des sites web externes aux projets Wikimedia, notamment pour citer des articles de blog comme références dans des articles. Or, la toile évoluant très rapidement, des liens « se brisent » ou « meurent » tous les jours, pointant respectivement vers des pages web déplacées ou supprimées. Avant de créer un lien, il est conseillé de lire attentivement la philosophie de Wikipédia à ce sujet : Aide:Liens externes. Toutefois, malgré ces conseils avisés, il y a toujours des liens à corriger.

Ce projet vise à corriger les liens externes qui dirigent soit vers une page d'erreur, soit vers une absence de réponse du serveur.

J'ai trouvé un lien mort, que faire ? modifier

Un lien mort (ou brisé) vous a été signalé (sur la page de discussion ou via le modèle {{Lien brisé}}) et vous souhaitez savoir comment le corriger :

  1. Si le lien n'est pas mort et n'est pas une redirection (vers la page d'accueil par exemple), indiquez-le :
  2. Sinon, passez au mode d'emploi.

Un des liens de l'archive Wikiwix [archive] ne fonctionne pas :

  1. Rapportez un bug sur Discussion Utilisateur:Pmartin/Cache.
  2. Sinon, passez au mode d'emploi.

Mode d'emploi modifier

Vous avez trouvé un lien qui n'est pas corrigé par Wikiwix [archive].

  1. Si le lien est une redirection vers la bonne page, remplacez l'adresse du lien par l'adresse de la page vers laquelle il redirige.
  2. Cherchez si le site a été déplacé, si vous retrouvez la page, remplacez le lien.
  3. Si ce n'est pas déjà fait, utilisez le modèle {{Lien brisé}} avec la syntaxe suivante : {{Lien brisé|url=http://www.example.com|titre=exemple}}
  4. Si une des archives trouvées est valide,
    • si une archive sur Internet Archive (archive.org) est trouvée, vous pouvez remplacer le modèle « Lien brisé» par un {{Lien archive}} et ajouter un paramètre horodatage archive contenant l'identifiant correspondant à une archive valide, tout en conservant les autres paramètres du modèle. Exemple de syntaxe : « {{Lien archive | url = http://www.example.com/ | titre = titre obligatoire | date = date du document |site= site initial |horodatage archive=AAAAMMJJHHMMSS }} »
    • Pour les autres archives, vous pouvez utiliser le modèle {{Lien web}} avec les paramètres |brisé le=(oui ou date à laquelle est constaté que le lien est brise) |archive-url= (url de l'archive) et|archive-date= (date de l'archive).
  5. Si ce n’est pas le cas, il faudra trouver une autre référence :
    • Voir avec les auteurs de l’article ou du projet correspondant. Il pourront vous aider à trouver une autre référence pertinente.
    • Vous pouvez ajouter le lien et l’article dans lequel il a été trouvé dans la section « Liens à corriger à la main ». Le projet vous aidera à corriger le lien.
    • Si le lien est utilisé comme source, ne pas le supprimer, même si vous trouvez une source de remplacement. Un lien mort conserve son importance : possibilité de le retrouver dans divers caches ou archives, le site peut être restauré après un long laps de temps, etc. Si le lien comporte une date de consultation, il vaut toujours comme source.
  6. Merci de l’aide ! Vous trouverez d'autres informations intéressantes sur cette page. Les remarques, suggestions, questions ainsi que la participation au projet sont bienvenues : c'est par là !

Liens à corriger manuellement modifier

Quand un paragraphe est terminé, merci de l'archiver.

Chercher dans les caches et archives modifier

  1. Internet Archive possède peut-être la page dans ses archives. Cela peut vous aider à voir le contenu de la page originale, ce qui est très utile pour retrouver une page déplacée (c'est-à-dire qui a changé d'adresse web).
  2. Tout comme les pages en cache sur Wikiwix, dont l'adresse est de la forme : http://archive.wikiwix.com/cache/?url= url de la page. Par exemple, la page http://www.ethnologue.com/show_language.asp?code=fia est en cache à http://archive.wikiwix.com/cache/?url=http://www.ethnologue.com/show_language.asp?code=fia.
  3. Il est possible de chercher dans le cache Google. L'adresse est : http://webcache.googleusercontent.com/search?q=cache: url de la page. Exemple : http://webcache.googleusercontent.com/search?q=cache:http://www.ethnologue.com/show_language.asp?code=fia. (Des extensions de Mozilla ou la fonction PageRank de IE semblent pouvoir faire ce genre de recherches ; à suivre.)
  4. WebCite (mode d'emploi à rédiger)
  5. Archive-It (mode d'emploi à rédiger)
  6. en:Category:Web archives
  7. en:Category:Online archives

Cache Google modifier

Le cache Google est mis à jour plus ou moins fréquemment suivant le Pagerank de la page à mettre en cache. Ceci est fait par les Googlebots. En théorie, il s'agit d'un cache ; toutefois, certains sites web fermés peuvent rester en « cache » pendant plusieurs années.

Erreurs possibles modifier

  • Le site a refusé la mise en cache du site (syntaxe ?) ;
  • Lorsqu'un Googlebot est passé sur le site, le site était indisponible. Le robot n'a pas archivé la page et il est possible qu'aucun autre Googlebot ne vienne archiver le site ;
  • Les sous-pages sont inaccessibles : probablement interdites par /nofollow ;
  • Retiré de l'archive pour des problèmes légaux divers ;
  • L'erreur 404 est arrivée à expiration ;

Navigation modifier

La navigation est difficile, car un lien (interne ou externe) dans cette page ne donne pas la version mise en cache (contrairement à Internet Archive).

Internet archive modifier

Cette archive dispose d’une mise à jour peu fréquente (donc si un site apparaît et disparait entre deux mises à jour il n’y figure pas), et pas disponible immédiatement (il faut attendre quelques mois).

Erreurs possibles modifier

Navigation modifier

La navigation est aisée : les liens internes et externes sont automatiquement transformés vers le correspondant de l'archive.

Participants au projet modifier

Vous souhaitez participer au projet : la démarche à suivre est la suivante.

Les articles sont séparés en petits blocs, d'une dizaine de pages.

Pour corriger des liens :

  1. Vérifiez que les liens sont bien morts (si la page est un message indiquant que l'accès au site sera bientôt rétabli, ne supprimez pas le lien).
  2. Vérifiez que le lien n'a pas déjà été corrigé (après le 3e passage du bot pour vérifier si le message en page de discussion avait été suivi d'une correction) :
    1. Si le lien est une redirection, remplacez le lien par un lien direct vers le contenu, barrez ;
    2. Si le lien n'est pas mort, supprimez le message sur la page de discussion de l'article et rapportez le lien ici.
  3. Si le lien est mort, cf. ci-dessus. Pensez à rayer le lien de la liste des liens à corriger (en utilisant <s></s>). S'il n'y a pas eu de discussion sur le lien (Est-il vraiment utile ? Ce site correspond-il vraiment au même contenu ?), merci aussi de supprimer le message de la page de discussion.
  4. Comme commentaire, vous pouvez laisser :
[[Projet:Correction des liens externes|Projet de correction des liens externes]]

Les erreurs sur le web modifier

  • Erreur 403 : Page d'un site web protégée. Il faut un accès spécial pour accéder à une telle page. Tout le monde ne pouvant y accéder, ces pages sont à proscrire de Wikipédia.
  • Erreur 404 : La page est introuvable, mais il peut s'agir d'une indisponibilité temporaire.
  • Erreur 410 Gone : La page a définitivement disparu à cette adresse.
  • Erreur 500 : Erreur sur le serveur distant.

Liens utiles modifier