Ce matin... deux BOT de scrapping pour alimenter des modèles d'IA/#LLM ont abusé du forum d'@osm_fr

C'est pas la première fois et ça devient vraiment une plaie, surtout quand #ClaudeBot requête les URL de notre ancien #phpBB, remplacé il y a plusieurs années par #discourse

Malgrès plus de 130 000 erreurs 404 rien que ce matin, il continuait à un rythme effréné...

Autre bot albert-bot... de albertai.com (rien avoir avec l'Albert cocorico), bloqué lui aussi.

La contre mesure prochaine à ce pillage pourrait bien être de répondre à ces bot de scrapping avec un contenu artificiel lui aussi, histoire d'emmerdifier les modèles qui seront entraînés avec.

Une sorte de honey-pot mais dédiée aux IA...

De quoi ressortir markovify, simple et léger pour ce genre de chose, car on ne va pas mobiliser trop de ressources pour ça non plus.

Afficher le fil de discussion
Inscrivez-vous pour prendre part à la conversation
techlover

Technology lovers, here we are — (development, digital artwork, science…)