Stability AI présente les nouveaux modèles Stable Diffusion 3.5 : Large, Large Turbo et Medium. Après avoir échoué avec Stable Diffusion 3 Medium, les nouveaux modèles seraient hautement personnalisables pour leur taille et fonctionneraient sur du matériel grand public. Stability AI offre également un nouveau modèle de licence permissive Stability AI Community License : une utilisation gratuite pour un usage commercial et non commercial. La technologie d'intelligence artificielle générative Stable Diffusion est le premier produit de Stability AI et est considérée comme faisant partie du boom actuel de l'intelligence artificielle. Elle est principalement utilisée pour générer des images détaillées à partir de descriptions textuelles, bien qu'elle puisse également être appliquée à d'autres tâches telles que l'inpainting, l'outpainting et la génération de traductions d'image à image guidées par un texte
Après la déception causée par Stable Diffusion (SD) 3 Medium, Stability AI est peut-être en train de commencer son propre arc de rédemption. La société d'IA revient avec la sortie de deux nouveaux modèles qui avaient été promis en juillet 2024 : Stable Diffusion 3.5 Large et Stable Diffusion 3.5 Large Turbo.
"En juin, nous avons sorti Stable Diffusion 3 Medium, la première version ouverte de la série Stable Diffusion 3. Cette version ne répondait pas entièrement à nos normes ni aux attentes de nos communautés", a déclaré Stability AI. "Après avoir écouté les précieux commentaires de la communauté, nous avons pris le temps de développer une version qui fait avancer notre mission de transformation des médias visuels. Nous avons généré quelques images pour l'essayer avant de nous empresser d'écrire cette nouvelle fracassante, et les résultats étaient très, très bons. Surtout pour un modèle de base."
La famille SD 3.5 est conçue pour fonctionner sur des systèmes grand public, même bas de gamme selon certaines normes, pour rendre la génération d'images avancée plus accessible. Et oui, ils ont entendu les plaintes concernant la version précédente et celle-ci promet d'être bien meilleure, à tel point que l'image vedette est une femme allongée sur de l'herbe, une référence ironique à l'horreur qui s'est produite plus tôt lorsqu'on lui a présenté le même défi.
Un autre aspect important de cette version est le nouveau modèle de licence. Stable Diffusion 3.5 est livré sous une licence plus permissive, autorisant à la fois l'utilisation commerciale et non commerciale. Les petites entreprises et les personnes qui tirent moins de 1 000 000 $ de revenus de l'outil peuvent utiliser et développer ces modèles gratuitement.
Les entreprises dont les revenus sont plus importants doivent contacter Stability AI pour négocier les droits d'utilisation. À titre de comparaison, Black Forest Labs propose son modèle bas de gamme Flux Schnell gratuitement, son modèle moyen Flux Dev gratuitement avec une utilisation non commerciale et son modèle SOTA Flux Pro est un modèle à source fermée. (Pour référence, Flux est généralement considéré comme le meilleur générateur d'images open source actuellement disponible - du moins dans l'ère post-SDXL actuelle).
Voici les déclarations de Stability AI pour l'annonce :
Nous publions aujourd'hui Stable Diffusion 3.5, nos modèles les plus puissants à ce jour. Cette version ouverte comprend de multiples variantes personnalisables, fonctionnant sur du matériel grand public, et disponibles sous la licence permissive Stability AI Community License. Vous pouvez télécharger les modèles Stable Diffusion 3.5 Large et Stable Diffusion 3.5 Large Turbo de Hugging Face ainsi que le code d'inférence sur GitHub dès maintenant.
En juin, nous avons publié Stable Diffusion 3 Medium, la première version ouverte de la série Stable Diffusion 3. Cette version ne répondait pas entièrement à nos standards ni aux attentes de nos communautés. Après avoir écouté les précieux commentaires de la communauté, nous avons pris le temps de développer une version qui fait avancer notre mission de transformation des médias visuels.
Stable Diffusion 3.5 reflète notre engagement à donner aux constructeurs et aux créateurs des outils largement accessibles, à la pointe de la technologie et gratuits pour la plupart des cas d'utilisation. Nous encourageons la distribution et la monétisation du travail sur l'ensemble du pipeline - qu'il s'agisse de réglages fins, de LoRA, d'optimisations, d'applications ou d'œuvres d'art.
Présentation des modèles Stable...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.