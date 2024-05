Mais d'où proviennent ces images ?

On using user data to train AI models, "We don't train on private stuff, we don't train on stuff people share with their friends. We do train on things that are public," @Meta Chief Product Officer Chris Cox #BloombergTech pic.twitter.com/FC0SWlTgqY — Bloomberg Live (@BloombergLive) May 9, 2024

Les photographes n'ont guère le choix

Conclusion

En septembre, Meta, l’entreprise autrefois connue sous le nom de Facebook, a présenté la bêta de Meta AI, un assistant conversationnel avancé disponible sur WhatsApp, Messenger et Instagram. Meta AI est capable de générer des images comme Midjourney ou DALL-E d’OpenAI via l’invite « /imagine » grâce à Emu (qui signifie Expressive Media Universe). Emu est directement intégré à Meta AI, de sorte que les utilisateurs peuvent lui envoyer un message avec la balise «imagine» et il générera gratuitement ce que la société a qualifié d'images photoréalistes de haute qualité dans le chat.Emu peut générer des images de haute qualité à partir d'invites textuelles. Le modèle a été pré-entraîné sur 1,1 milliard de paires image-texte, puis affiné sur des images de haute qualité soigneusement sélectionnées. Le modèle résultant produit des images haute fidélité et visuellement attrayantes. Meta a vanté la vitesse d’Emu, Mark Zuckerberg soulignant que le modèle génère des images « rapidement » par rapport à ses concurrents – affirmant qu’il peut créer du contenu en seulement cinq secondes.Meta a lancé un site web autonome et gratuit de génération d'images d'IA, « Imagine with Meta AI », basé sur son modèle de synthèse d'images Emu. Auparavant, la version de Meta de cette technologie - utilisant les mêmes données - n'était disponible que dans les applications de messagerie et de réseaux sociaux telles qu'Instagram.Chris Cox, chef de produit chez Meta, a déclaré au Tech Summit de Bloomberg qu'il utilisait des photos et des textes accessibles au public sur les plateformes pour entraîner son modèle de générateur de texte à image appelé Emu. « Nous ne nous entraînons pas sur des éléments privés, nous ne nous entraînons pas sur des éléments que les gens partagent avec leurs amis, nous nous entraînons sur des éléments publics », a-t-il déclaré.Le modèle texte-image de Meta peut produire « des images d'une qualité vraiment étonnante » car Instagram contient de nombreuses photos « d'art, de mode, de culture et aussi simplement des images de personnes et de nous », a ajouté Cox.Il s'agit d'un changement d'approche par rapport à d'autres entreprises d'IA puisque Meta a accès à une grande quantité de données d'images et de légendes grâce à ses services. D'autres modèles de synthèse d'images utilisent des images récupérées illicitement sur l'internet, des images sous licence provenant de bibliothèques d'images commerciales, ou une combinaison des deux.Si vous êtes sur Facebook ou Instagram, il est fort possible qu'une photo de vous (ou que vous avez prise) ait contribué à la formation d'Emu. D'une certaine manière, le vieil adage « Si vous ne payez pas pour cela, vous êtes le produit » a pris un tout nouveau sens. Bien qu'en 2016, les utilisateurs d'Instagram aient téléchargé plus de 95 millions de photos par jour, l'ensemble de données que Meta a utilisé pour former son modèle d'IA n'était qu'un petit sous-ensemble de sa photothèque globale.Étant donné que Meta affirme n'utiliser que des photos accessibles au public pour l'entraînement, le fait de rendre vos photos privées sur Instagram ou Facebook devrait empêcher leur inclusion dans l'entraînement futur du modèle d'IA de l'entreprise (à moins qu'elle ne modifie cette politique, bien sûr).À l'instar de Stable Diffusion, DALL-E 3 et Midjourney, Imagine with Meta AI génère de nouvelles images en se basant sur ce que le modèle d'IA « sait » des concepts visuels appris à partir des données d'entraînement. La création d'images à l'aide du nouveau site web nécessite un compte Meta, qui peut être importé à partir d'un compte Facebook ou Instagram existant. Chaque génération crée quatre images de 1280×1280 pixels qui peuvent être enregistrées au format JPEG. Les images comprennent un petit logo en filigrane « Imaginé avec l'IA » dans le coin inférieur gauche.« Nous avons été ravis d'entendre les gens nous expliquer comment ils utilisent imagine, la fonction de génération de texte à partir d'images de Meta AI, pour créer des contenus amusants et créatifs dans les chats », explique Meta dans son communiqué de presse. « Aujourd'hui, nous élargissons l'accès à imagine en dehors des chats, en le rendant disponible aux États-Unis à partir de imagine.meta.com. Cette expérience autonome pour les amateurs créatifs vous permet de créer des images avec la technologie d'Emu, notre modèle de fondation d'image ».Le modèle de Meta crée généralement bien des images photoréalistes, mais pas aussi bien que Midjourney. Il peut gérer des invites complexes mieux que Stable Diffusion XL, mais peut-être pas aussi bien que DALL-E 3. Il ne semble pas bien rendre le texte du tout, et il gère différents médias comme l'aquarelle, la broderie et le stylo-encre avec des résultats mitigés. Ses images de personnes semblent inclure une diversité d'origines ethniques. Dans l'ensemble, il semble être dans la moyenne de nos jours en termes de synthèse d'images par l'IA.Pour de nombreux photographes, Instagram est la plateforme de médias sociaux la plus importante. Les sentiments de méfiance et d'indignation face à la manière dont les générateurs d'images par IA ont été construits sont largement ressentis dans la communauté créative, ce qui peut constituer une sorte de casse-tête pour les créateurs.Cox précise que Meta ne forme pas sur les photos provenant de comptes privés, mais qu'en général, les photographes ont besoin de comptes publics pour faire connaître leur travail et leur nom au monde entier. Il s'agit d'un outil de marketing très important.« Ce qui est le plus exaspérant lorsqu'on apprend qu'Instagram (Meta) récolte et exploite commercialement des centaines de milliers d'œuvres originales de photographes professionnels, pour leur programme GenAI “Imagine with Meta AI”, c'est qu'ils ne semblent pas du tout préoccupés par l'impact que cela a sur la communauté même des photographes et des créateurs d'images qui ont aidé à construire leur empire de médias sociaux visuels », explique Isabelle Doran de l'Association des photographes du Royaume-Uni.« Il semble que les œuvres créatives des photographes soient simplement là pour être prises, sans tenir compte des répercussions sur la communauté, et cela ressemble à de la pure cupidité d'entreprise. Avec Stable Diffusion, Midjourney, DALL-E et ImageFX, ces programmes de conversion de texte en image concurrencent désormais activement les photographes professionnels, supplantant des années de photographes, et les équipes avec lesquelles ils travaillent, qui cultivent leurs compétences et leur talent et investissent leur âme créative dans leurs œuvres.« C'est l'une des raisons pour lesquelles nous demandons la transparence sur les photographies protégées par le droit d'auteur qui sont récupérées, ingérées et utilisées par ces programmes, en plus de demander une autorisation d'utilisation et une compensation. Les grandes entreprises technologiques doivent jouer franc jeu et payer franc jeu ».En février dernier, Mark Zuckerberg, PDG de Meta, a clairement indiqué qu'il utilisait des images postées sur Facebook et Instagram pour entraîner les outils d'IA générative de l'entreprise.« Lorsque les gens pensent aux données, ils pensent généralement au corpus que vous pourriez utiliser pour former un modèle en amont », a déclaré Zuckerberg lors d'une conférence téléphonique sur les résultats. « Sur Facebook et Instagram, il y a des centaines de milliards d'images partagées publiquement et des dizaines de milliards de vidéos publiques, ce qui, selon nos estimations, est supérieur à l'ensemble de données Common Crawl, et les gens partagent également un grand nombre de messages textuels publics dans les commentaires sur nos services. »L’utilisation de nos photos publiques pour former des modèles d’IA soulève des questions sur la confidentialité et l’éthique. Bien que Meta affirme n’utiliser que des photos disponibles publiquement, il est important de rester conscient de la manière dont nos données sont utilisées. En attendant, “Imagine with Meta AI” nous offre un aperçu fascinant de ce que l’IA peut accomplir en transformant des mots en images.Source : Meta AI Pensez-vous que Meta (anciennement Facebook) devrait être plus transparente sur la manière dont elle utilise les photos des utilisateurs pour former ses modèles d’IA ?Quelles mesures devraient être prises pour protéger la vie privée des utilisateurs tout en permettant le développement de technologies d’IA ?Est-il acceptable d’utiliser des photos publiques sans le consentement explicite des utilisateurs pour former des modèles d’IA ?Quelles sont, selon vous, les limites éthiques en matière d’utilisation des données personnelles dans le domaine de l’intelligence artificielle ?Pensez-vous que l’utilisation d’un modèle d’IA pour générer des images à partir de descriptions écrites pourrait affecter la créativité humaine ?Comment pouvons-nous préserver l’originalité artistique tout en exploitant les capacités de l’IA ?Existe-t-il des alternatives à l’utilisation de données personnelles pour former des modèles d’IA ?Comment pouvons-nous encourager les entreprises technologiques à adopter des pratiques plus éthiques en matière de collecte et d’utilisation des données ?