Utilisateur:CodexBot/config skip domain

dessin robot CodexBot (edits, edits2) + ZiziBot (edits)DiscussionsFAQSondagesMonitoring • Configuration : sites externesdomain banISBNvilles

# LES NOMS DE DOMAINES CI-DESSOUS SONT IGNORÉS PAR LE BOT POUR LA COMPLETION DE LIENS EXTERNES. POUVEZ AJOUTER A VOTRE CONVENANCE, ÇA PEUT RIEN CASSER.

sports-reference.com
# archive.is => titre=Welcome to nginx
archive.is
# liens Google Books géré par autre script
books.google.fr
books.google.com
# 2019 GoogleBooks : https://www.google.fr/books/edition/_/U4NmPwAACAAJ
google.fr
google.com
# embrouille titre/description (json-ld) + SEO + auteur=WMF
fr.wikipedia.org
wikipedia.org
wikimedia.org

# PRESSE
# Forbidden : accès bot bloqué. Vérifier 2023
cairn.info
cairn-int.info
# 403 forbidden ouest-france.fr (anti-bot)
ouest-france.fr
courrierdelouest.fr
#leparisien.fr Donnée pourrie : 'datePublished' erronée = today
leparisien.fr
societe.com
valeursactuelles.com
# lanouvellerepublique.fr : envoie titre={{rubedo.current.page.title}}
lanouvellerepublique.fr
# bloomberg.com : renvoie <title>Are you a robot ?
bloomberg.com
# captcha JO
journal-officiel.gouv.fr
# dailytelegraph.com.au mal configuré
dailytelegraph.com.au
# distinction [France-Soir] (-oct.2019) et [franceSoir] (2019-)
francesoir.fr

livre.fnac.com
priceminister.com
largus.fr
pro.largus.fr
nps.gov
# metadata moche (SEO)
mairesdeladrome.fr
www.mairesdeladrome.fr

# legifrance : NOINDEX avec bot, iframe :'(
legifrance.gouv.fr

example.org

# Tor "Syntax error"
pop.culture.gouv.fr

#jstor.org désactivé : bug Vérifier 2023
jstor.org

# bug title
uboat.net

# spam agence
allodoublage.com