Pour les administrateurs de sites web, il s'agit d'une solution facile, disponible via robots.txt (ou le fichier texte qui permet aux robots d'indexation d'accéder aux sites). Dans un communiqué, Danielle Romain, vice-présidente de la confiance, a déclaré que Google avait appris des éditeurs de sites web "qu'ils souhaitaient avoir plus de choix et de contrôle sur la manière dont leur contenu est utilisé pour les cas d'utilisation émergents de l'IA générative".
"En utilisant Google-Extended pour contrôler l'accès au contenu d'un site, l'administrateur du site peut choisir d'aider ces modèles d'IA à devenir plus précis et plus performants au fil du temps", a ajouté Mme Romain.
OpenAI, le fabricant de ChatGPT, a récemment lancé son propre robot d'exploration du web, mais a inclus des instructions sur la manière de le bloquer. Des publications telles que Medium, le New York Times, CNN et Reuters ont notamment fait de même.
Le Bard de Google est apparu comme un concurrent rapide de ChatGPT, mais il a rencontré des problèmes, notamment des fuites et des résultats erronés. Néanmoins, le modèle d'IA s'est amélioré depuis son lancement, avec l'annonce récente d'une série d'extensions et d'autres moyens d'utiliser Bard efficacement.
Au fil des ans, les progrès de l'IA ont permis d'améliorer nos produits, au bénéfice des utilisateurs, des créateurs de contenu web et de l'écosystème web dans son ensemble. La croissance et le développement rapides des outils d'IA générative aident les éditeurs de sites web à entrer en contact avec leur public plus facilement et de manière plus créative que jamais. Nous nous engageons à développer l'IA de manière responsable, en nous appuyant sur nos principes en matière d'IA et en respectant notre engagement en matière de protection de la vie privée des consommateurs. Toutefois, les éditeurs de sites web nous ont également fait part de leur souhait de disposer d'un plus grand choix et d'un meilleur contrôle sur la manière dont leur contenu est utilisé dans le cadre des nouveaux cas d'utilisation de l'IA générative.
Nous annonçons aujourd'hui Google-Extended, un nouveau contrôle que les éditeurs de sites web peuvent utiliser pour déterminer si leurs sites contribuent à améliorer les API génératives de Bard et Vertex AI, y compris les futures générations de modèles qui alimentent ces produits. En utilisant Google-Extended pour contrôler l'accès au contenu d'un site, un administrateur de site web peut choisir d'aider ces modèles d'IA à devenir plus précis et plus performants au fil du temps.
La mise à disposition de contrôles simples et évolutifs, tels que Google-Extended, par l'intermédiaire de robots.txt est une étape importante dans la mise en place de la transparence et du contrôle que, selon nous, tous les fournisseurs de modèles d'IA devraient mettre à disposition. Toutefois, à mesure que les applications d'IA se développent, les éditeurs de sites web seront confrontés à la complexité croissante de la gestion des différentes utilisations à l'échelle. C'est pourquoi nous nous engageons à collaborer avec les communautés du web et de l'IA afin d'explorer d'autres approches lisibles par machine en matière de choix et de contrôle pour les éditeurs de sites web. Nous espérons pouvoir vous en dire plus prochainement
Nous annonçons aujourd'hui Google-Extended, un nouveau contrôle que les éditeurs de sites web peuvent utiliser pour déterminer si leurs sites contribuent à améliorer les API génératives de Bard et Vertex AI, y compris les futures générations de modèles qui alimentent ces produits. En utilisant Google-Extended pour contrôler l'accès au contenu d'un site, un administrateur de site web peut choisir d'aider ces modèles d'IA à devenir plus précis et plus performants au fil du temps.
La mise à disposition de contrôles simples et évolutifs, tels que Google-Extended, par l'intermédiaire de robots.txt est une étape importante dans la mise en place de la transparence et du contrôle que, selon nous, tous les fournisseurs de modèles d'IA devraient mettre à disposition. Toutefois, à mesure que les applications d'IA se développent, les éditeurs de sites web seront confrontés à la complexité croissante de la gestion des différentes utilisations à l'échelle. C'est pourquoi nous nous engageons à collaborer avec les communautés du web et de l'IA afin d'explorer d'autres approches lisibles par machine en matière de choix et de contrôle pour les éditeurs de sites web. Nous espérons pouvoir vous en dire plus prochainement
Et vous ?
Quel est votre avis sur le sujet ?
Voir aussi :
Google suggère de mettre à jour le fichier Robots.txt pour les cas d'utilisation de l'IA émergente selon Danielle Romain, vice-présidente de Google chargée de la confiance.
Une plainte dénonce le pillage des données publiques par Google pour entraîner son chatbot Bard. Des données d'enfants, d'artistes et d'écrivains prises sans consentement
OpenAI dévoile GPTBot, un bot qui explore les données du Web public pour l'apprentissage de l'IA pour répondre aux plaintes concernant l'utilisation de données de sites Web