IA : les médias français s'organisent face à la collecte de données par les robots
A l'image du « New York Times », quelques sites français, dont ceux de Radio France et TF1, empêchent le robot GPTBot d'OpenAI de se nourrir de leurs contenus. Refusant d'être « pillé », le secteur réfléchit à la manière d'obtenir une juste rémunération de la part des géants de l'IA.
Par Stéphane Loignon
Face à l'exploitation de leurs contenus par des algorithmes d'intelligence artificielle, les médias français sont décidés à ne pas se laisser faire. Selon nos informations, plusieurs sites d'information ont déjà bloqué la collecte de données par le robot d'exploration Web d'OpenAI, GPTBot, à l'image de leurs confrères anglo-saxons du « New York Times », de CNN ou de Reuters.
Le 8 août, OpenAI a annoncé le lancement de son robot pour ratisser automatiquement les données de « tout Internet », afin d'entraîner ses modèles d'IA GPT-4 et GPT-5. La firme a alors donné la possibilité aux éditeurs de sites d'interdire l'accès au robot. Radio France l'a instantanément saisie en bloquant GPTBot à titre conservatoire dès le 10 août, a annoncé le groupe dans un tweet. Les sites Radiofrance.fr, francebleu.fr et francetvinfo.fr sont concernés.
Ce contenu est réservé aux inscrits
Inscrivez-vous gratuitement
L’accès aux articles réservés aux inscrits
Une sélection de newsletters gratuites
La sauvegarde de vos articles sur le site et l’application