IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Les entreprises d'IA affirment qu'elles ne peuvent pas respecter les droits d'auteur mais ces chercheurs ont essayé
Démontrant que former des modèles d'IA puissants sans enfreindre la loi, c'est possible

Le , par Stéphane le calme

134PARTAGES

8  0 
Au cœur d’un débat brûlant entre innovation technologique et respect des droits de propriété intellectuelle, nombre d’entreprises d’intelligence artificielle (IA) avancent que « le respect du droit d’auteur est impossible » dans leurs processus de formation. Pourtant, une équipe de chercheurs a relevé le défi... et semble avoir prouvé le contraire.

Contexte

Un collectif de plus de vingt chercheurs, piloté par l’association à but non lucratif EleutherAI (MIT, CMU, University of Toronto), a constitué un jeu de données de 8 To exclusivement issu de contenus sous licence ouverte ou appartenant au domaine public. À partir de ce corpus, ils ont entraîné Comma v0.1, un modèle de 7 milliards de paramètres, dont les performances sont comparables à celles de LLaMA 2‑7B de Meta, un modèle formé sur des données potentiellement protégées.

Contrairement aux gigantesques jeux de données non filtrés utilisés par les grandes entreprises d’IA, cette initiative a misé sur un protocole stringent :
  • Collecte uniquement sous licences libres ou domaine public ;
  • Annotation manuelle de chaque donnée pour valider les licences, indispensable face aux défis d’automatisation.

Le résultat ? Un modèle performant, mais dont la constitution reste coûteuse – tant en temps qu’en ressources.

Ce projet intervient dans un contexte législatif agité :
  • Aux États-Unis et au Royaume-Uni, des recours judiciaires et des propositions de lois (comme le Generative AI Copyright Disclosure Act) visent à encadrer l’usage des œuvres protégées.
  • En Europe, la réglementation exige désormais la transparence des jeux de données : les entreprises doivent publier un résumé détaillé des contenus utilisés, les titulaires pouvant s’y opposer (opt‑out).

OpenAI déclare la course à l'IA « terminée » s'il n'est pas possible d'entraîner les LLM sur des œuvres protégées

Ces dernières années, les capacités des chatbots d'IA, comme ChatGPT d'OpenAI, se sont considérablement améliorées ; ils s'appuient sur de grands modèles de langage (LLM) pour produire du contenu pour les utilisateurs. Mais le processus de formation est largement controversé, certains éditeurs accusant OpenAI d'utiliser des œuvres protégées par le droit d'auteur sans autorisation, et un certain nombre d'affaires juridiques sont en cours.

Défendant ses pratiques commerciales dans un procès, OpenAI a déclaré : « les modèles apprennent, comme nous le faisons tous, de ce qui a été fait auparavant. La défense de l'usage équitable existe précisément pour cette raison : encourager et permettre le développement de nouvelles idées qui s'appuient sur des idées antérieures ». Cette défense d'OpenAI est conforme aux précédentes déclarations de l'entreprise sur la formation de ses modèles.

En janvier 2024, OpenAI affirmait : « étant donné que le droit d'auteur couvre aujourd'hui pratiquement toutes les formes d'expression humaine, il serait impossible d’entraîner les meilleurs modèles d'IA d'aujourd'hui sans utiliser des documents protégés par le droit d'auteur ». OpenAI reconnaît donc ouvertement qu'il utilise des contenus protégés par le droit d'auteur pour créer ses modèles d'IA. L'entreprise n'a toutefois pas encore été condamnée.

Même son de cloche pour Nick Clegg, un homme politique britannique. Il a été vice-premier ministre du Royaume-Uni entre 2010 et 2015, puis responsable des affaires internationales et de la communication de Meta (anciennement Facebook) d'octobre 2018 à janvier 2025. Fervent défenseur des efforts de Meta en matière d'IA, il est revenu sur le débat sur la protection des droits d'auteur lors du festival de Charleston, dans l'East Sussex, un comté du sud-est de l'Angleterre.

Nick Clegg estime que le fait d'obliger les entreprises d'IA à demander l'autorisation avant d'utiliser des contenus protégés par des droits d'auteur pour former des modèles d'IA détruirait le secteur. Nick Clegg a déclaré que la communauté créative devrait avoir le droit de refuser que son travail soit utilisé pour former des modèles d'IA. Mais il a affirmé qu'il n'était pas possible de demander le consentement des créateurs avant d'ingérer leur travail.

Citation Envoyé par Nick Clegg
Je pense que la communauté créative veut aller plus loin. De nombreuses voix s'élèvent pour dire que l'on ne peut s'entraîner sur mon contenu que si l'on demande d'abord l'autorisation. Et je dois dire que cela me semble quelque peu invraisemblable, car ces systèmes s'entraînent sur de grandes quantités de données.

Je ne vois pas comment on peut demander à tout le monde d'abord. Je ne vois pas comment cela pourrait fonctionner. Et d'ailleurs, si vous le faisiez en Grande-Bretagne et que personne d'autre ne le faisait, vous tueriez du jour au lendemain l'industrie de l'intelligence artificielle dans ce pays.

Un projet inédit

Un groupe de chercheurs en intelligence artificielle a découvert qu'il était possible de créer un énorme ensemble de données de huit téraoctets en utilisant uniquement des textes sous licence libre ou appartenant au domaine public. Ils ont testé la qualité de l'ensemble de données en l'utilisant pour former un modèle de...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de shenron666
Expert confirmé https://www.developpez.com
Le 01/12/2025 à 15:46
Il n'y a que moi qui se demande pourquoi OpenAI n'a pas demandé à ChatGPT de faire le boulot ?
7  0 
Avatar de totozor
Expert confirmé https://www.developpez.com
Le 16/09/2025 à 7:30
Citation Envoyé par Ryu2000 Voir le message
Si le travail est trop dure et ne paie pas assez ils peuvent chercher un autre job moins chiant.
Un génie :
Tu as faim? Mange!
Tu es pauvre? Enrichi toi!
Tu travailles pas? Traverse la rue!
Tu as froid? Trouve un toit!
Tu es pas assez payé? Déménage, fais des études et traverse la rue.
Tu pollues? Arrête!

Rien que ça.
Ryu, notre sauveur.
Il a réponse à tout.
9  4 
Avatar de Anselme45
Membre extrêmement actif https://www.developpez.com
Le 02/12/2025 à 9:47
Citation Envoyé par Ryu2000 Voir le message
Après il faut bien que de l'argent rentre, il y a trop d'utilisateurs gratuits, chaque requête coûte à l'entreprise.
Donc il faut soit complètement stopper les utilisateurs gratuits (mais ils vont se mettre à utiliser Grok), soit mettre de la pub.
Ben oui mon bon monsieur, le succès de l'IA repose sur la gratuité et non pas sur son EFFICIENCE!

Il est bien là le vrai problème des promoteurs de l'IA, ils ont fait beaucoup de promesses aux utilisateurs, beaucoup de promesses aux investisseurs, mais en réalité l'IA ne produit que peu de vraies valeurs ajoutées

Quel est le seul vrai business que l'on peut faire quand on a volé toutes les données privées d'une cible? Ben en revenir on bonnes vieilles pratiques ancestrales: Profiter des faiblesses de la cible... La publicité ciblée n'est que la version civilisée de l'escroquerie...
6  1 
Avatar de tatayo
Expert éminent sénior https://www.developpez.com
Le 02/12/2025 à 10:41
Bonjour,
Citation Envoyé par Ryu2000 Voir le message
L'utilisateur a le choix :
- Ne pas utiliser de chatbot IA
- Payer un abonnement à un chatbot IA
- Voir de la pub afin de pouvoir utiliser un chatbot IA gratuitement

Il n'y a aucun problème avec ça. C'est normal.
Il faut bien que de l'argent rentre.
Pour changer, je suis d'accord avec Ryu2000. Enfin presque.
Youtube est blindé de pub, et personne ne râle.
Spotify insère de temps en temps de la pub (si tu n'as pas d'abonnement), idem.

Et dans les deux cas il suffit de payer un abonnement pour supprimer les pubs.
"Si c'est gratuit, c'est toi le produit".

MAIS, oui je vois un petit truc qui me chiffonne.
OpenAI "aspire" les données de sites pour l'apprentissage de ChatGPT sans rien payer en retour, donc pour moi il manque un petit truc dans l'équation.

Tatayo.
5  0 
Avatar de AoCannaille
Expert confirmé https://www.developpez.com
Le 18/12/2025 à 10:28
C'est vraiment une preuve incroyable de manque de sérieux de la part des chercheurs, ça veut dire que certains ne prennent même pas la peine de lire l'abstract...
6  1 
Avatar de
https://www.developpez.com
Le 30/12/2025 à 9:29
de mieux en mieux
la couillonnade 2.0

OpenAI travaille à l'ajout de publicités dans ChatGPT, comme la présentation de contenu sponsorisé dans les réponses IA du chatbot,
4  0 
Avatar de kain_tn
Expert éminent https://www.developpez.com
Le 10/02/2026 à 19:33
Google qui se moque de la pub, c'est cocasse, quand-même!
4  0 
Avatar de jnspunk
Membre habitué https://www.developpez.com
Le 09/07/2025 à 2:21
C'est ironique de voir qu'un article (Je parle de l'article scientifique) qui alerte sur les conclusions simplistes des modèles de langage finisse lui-même par en tirer une.
Il ne distingue pas entre une étude générée par un modèle de langage et une étude écrite par un humain, mais reformulée par un modèle pour corriger les fautes ou clarifier l'expression
Proposer un outil pour mesurer l'utilisation d'un modèle de langage dans un texte est une bonne idée, mais il est regrettable de négliger l'essentiel, à savoir différencier le fond de la forme.
3  0 
Avatar de OuftiBoy
Membre éprouvé https://www.developpez.com
Le 10/09/2025 à 18:03
Je ne suis pas trop d'accord...

Citation Envoyé par Matthieu Vergne Voir le message
Tant que ça s'apparente à du placebo, c'est à dire qu'il y a juste besoin d'une oreille à l'écoute sans réellement avoir besoin d'acte médical, ça me va très bien d'utiliser l'IA
Vu comment l'IA a tendance a "Halluciner", j'ai un gros doute sur la pertinence de la réponse d'une IA pour répondre ou proposer des solutions à une personne dépressive ou suicidaire... Cela me semble extrêmement dangereux même... Si quelqu'un ressent le besoin de consulter un psy, et que le rdv qu'on lui propose est trop lointain, et se "tourne" vers une IA en attendant, les dégâts sur la personne peuvent être dévastateurs. Qu'une IA "tente" d'apporter une aide à une personne "fragile" devrait selon moi même être interdit.

Mais, ce n'est que mon avis...

BàV et Peace & Love.
3  0 
Avatar de OuftiBoy
Membre éprouvé https://www.developpez.com
Le 03/12/2025 à 19:15
Citation Envoyé par Ryu2000 Voir le message
Voir de la pub pour un service gratuit me rassure.
On connait la musique pourtant, si c'est gratuit, c'est toi le produit ;-)

Citation Envoyé par Ryu2000 Voir le message
C'est grâce à la pub que les sites internet se financent, c'est grâce à la pub que les journaux gratuits se financent, c'est grâce à la pub que les chaînes de TV se financent, c'est grâce à la pub que les vidéastes se financent. La pub est nécessaire. Sans elle il n'y aurait aucun service gratuit sur internet.
C'est à cause de la 'pub' qu'internet est devenu ce qu'il est. Une grande surface, où trouver une information 'juste' et de 'qualité' est plus difficile qu'il y a 10 ou 15 ans.

Citation Envoyé par Ryu2000 Voir le message
L'entreprise préfère que l'utilisateur paie un abonnement plutôt qu'il regarde de la pub (voir YouTube Premium). Pour les Chatbot IA le plan le plus simple c'est de proposer une version gratuite pas terrible (qui consomme moins de ressource) et des options payantes bien meilleures.
Je ne suis pas certains, si la "démo" gratuite n'est "pas terrible", perso ça ne me donne pas envie d'acheter...

Citation Envoyé par Ryu2000 Voir le message
Aujourd'hui il y a déjà des gens qui paient 20€/mois pour un chatbot IA et ils s'en servent dans leur travail.
Chacun fait fait fait, c'qu'il lui plait plait plait...

BàT et Peace & Love.
4  1