L’une des innovations les plus marquantes de 2023 a été l’émergence de l’IA générative, qui désigne les outils capables de produire du contenu original et de qualité, comme du texte, des images, de la musique, de la vidéo ou du code. Ces outils se basent sur des modèles de réseaux de neurones profonds, comme les GAN (Generative Adversarial Networks) ou les Transformers, qui apprennent à imiter des exemples existants et à en créer de nouveaux. Selon une enquête mondiale de McKinsey, un tiers des organisations utilisent régulièrement l’IA générative dans au moins une fonction métier, et 40% des organisations prévoient d’augmenter leurs investissements dans l’IA en raison des avancées de l’IA générative.
2023 et ses avancées en matière d'IA : génération de texte
GPT-4 : ChatGPT est sans doute l'outil qui a le plus fait parlé dans le domaine. Développé par OpenAI, l'outil s'appuie sur GPT-4 Turbo. De plus, OpenAI a également annoncé une nouvelle version personnalisable de ChatGPT, ainsi qu'un nouveau magasin qui présentera des IA personnalisées par l'utilisateur et particulièrement utiles. Concrètement, il s’agit d’une plateforme permettant de créer des versions personnalisées de ChatGPT pour des cas d'utilisation spécifiques, sans qu'aucune ligne de code ne soit nécessaire. « On peut imaginer que quelqu'un construise un TPG spécialisé dans l'apprentissage d'une nouvelle langue ou donnant des conseils en matière de décoration d'intérieur », a déclaré Peter Deng, vice-président d'OpenAI chargé des produits destinés aux consommateurs et aux entreprises, lors d'une interview.
Le GPT-4 d'OpenAI gère désormais la saisie d'images, génère des légendes, des classifications, entend et répond dans une conversation aller-retour et prend en charge la navigation Web en temps réel. OpenAI a également étendu la prise en charge des plugins, favorisant ainsi un paysage enrichi de concurrents open source. GPT-4 est la prochaine étape du parcours d’OpenAI pour développer l’AGI.
Mixtral 8x7B : Dans le paysage mondial de l’intelligence artificielle, dominé par des géants tels qu’OpenAI, Google et Meta, une nouvelle entreprise française fait parler d’elle : Mistral AI, fondée par cofondée par trois chercheurs français de l'IA passés par les GAFA américains.
La startup française a publié ce mois-ci une nouvelle version de son modèle de langage open source, baptisé Mixtral 8x7B, qui serait autant ou beaucoup plus performant que Llama 2 70B et GPT3.5 sur la plupart des benchmarks. Mixtral 8x7B a 46,7 milliards de paramètres au total mais n'utilise que 12,9 milliards de paramètres par jeton. Il traite donc les entrées et génère la sortie à la même vitesse et pour le même coût qu'un modèle 12,9 milliards de paramètres. Mistral AI se sert d'un procédé qui lui permet de rester efficace, mais avec un coût et une latence moindres.
Gemini et Bard : Bard de Google a ajouté des émotions et des sentiments humains au paysage des chatbots. Introduit dans le chatbot Bard et formé sur un ensemble de données multimodales, Gemini de Google est apparu comme le modèle d'IA « le plus performant » et le concurrent le plus proche du ChatGPT d'OpenAI. Alphabet a annoncé que les développeurs peuvent utiliser Google AI Studio et Vertex AI pour créer des applications avec l'API Gemini Pro, qui permet d'accéder au nouveau modèle d'IA générative de Google. Le déploiement initial de Gemini par Google était limité à Google Bard et au Pixel 8 Pro.
Google a estimé que son modèle d'intelligence artificielle surpasse ChatGPT dans la plupart des tests et affiche un « raisonnement avancé » dans plusieurs formats, y compris la possibilité de visualiser et de noter les devoirs de physique d'un étudiant.
Cependant, la meilleure vidéo de démonstration des capacités de Gemini était truquée
Nous pouvons également citer :
- Grok : La startup xAI d'Elon Musk a signalé son engagement dans le développement de l'IA, potentiellement en concurrence avec OpenAI, en dévoilant « Grok » – un chatbot avec humour, rébellion et connaissance en temps réel via la plateforme X. xAI a promis que Grok était conçu pour répondre aux questions provocatrices rejetées par d’autres systèmes d’IA.
Llama 2 : Meta a publié Llama 2, la nouvelle génération de son grand modèle de langage open source, présentant une efficacité améliorée. Le LLM affiné de Meta a également été optimisé pour les cas d’utilisation de dialogue et a surpassé les autres modèles open source sur la plupart des benchmarks. - Yi-34B llm : Évaluée à 1 milliard de dollars cette année, la startup 01.AI de Kai-Fu Lee a lancé Yi-34B, un réseau neuronal open source qui a surpassé les modèles concurrents avec un nombre de paramètres nettement plus élevé, soulignant sa rentabilité.
Génération de médias
Images
- Midjourney : Le modèle V.5 de Midjourney a marqué une étape importante dans la génération d’images, présentant une efficacité, une cohérence et une résolution plus élevées. La dernière version alpha, Midjourney V.6, a apporté des améliorations supplémentaires telles qu'un suivi plus précis des invites, une connaissance accrue du modèle et une capacité mineure de dessin de texte.
- DALL·E 3 : Construit sur ChatGPT, DALL·E 3 a simplifié la génération d'images, éliminant le besoin d'une ingénierie d'invite complexe. De plus, ChatGPT a introduit une fonctionnalité pour aider les utilisateurs à affiner les invites et à effectuer des ajustements d'image en fonction des commentaires.
- Shutterstock.AI : la grande enseigne des images de stock a intégré des capacités d'IA, permettant aux utilisateurs de transformer les invites en images prêtes pour la licence. En reconnaissant et en récompensant les artistes contributeurs, Shutterstock a fait le premier pas vers une IA éthique.
Vidéos
- Stability AI : Stability AI a introduit Stable Video Diffusion, un modèle révolutionnaire de vidéo générative, avec un accès open source sur GitHub. En faisant un parallèle avec les tendances de génération d’images IA, il est fort possible que le modèle de diffusion vidéo stable joue un rôle central dans la création d’une partie importante des vidéos générées par l’IA.
- HeyGen : une startup d'IA a dévoilé un outil pour le clonage de la voix, l'ajustement du mouvement des lèvres et la traduction de la langue dans les vidéos.
- Runway Gen-2 : Runway a lancé le modèle Gen-2, permettant aux utilisateurs de générer sans effort des vidéos complètes à partir d'invites de texte, d'images ou d'autres vidéos. Jetez simplement un œil à l’exemple ci-dessous.
- Pika et Pika 1.0 : avec sa version initiale, Pika a attiré un demi-million d'utilisateurs, générant des millions de vidéos chaque semaine. Ensuite, le modèle d'IA mis à niveau dans Pika 1.0 a permis aux utilisateurs de créer et d'éditer des vidéos dans différents styles, notamment l'animation 3D, l'anime, le dessin animé et le cinéma.
- Avatars codecs de Meta : le modèle Pixel Codec Avatars (PiCA) de Meta pour les visages humains 3D dans les vidéos nous a rapprochés de la téléprésence photoréaliste.
[TWITTER]<blockquote class="twitter-tweet" data-media-max-width="560"><p lang="en" dir="ltr">Turn words into worlds with the most advanced text to video AI model: Gen-2<br><br>Any story. Every style. Completely generated.<a href="https://t.co/ekldoIshdw">https://t.co/ekldoIshdw</a> <a href="https://t.co/q1xK84hpd1">pic.twitter.com/q1xK84hpd1</a></p>— Runway (@runwayml) <a href="https://twitter.com/runwayml/status/1731705542093983810?ref_src=twsrc%5Etfw">December 4, 2023</a></blockquote> <script async src="https://platform.twitter.com/widgets.js" charset="utf-8"></script> [/TWITTER]
Des accélérations au niveau de la législation
La situation européenne
Ce mois-ci, les négociateurs du Parlement et du Conseil sont parvenus à un accord provisoire sur la législation sur l’intelligence artificielle. La loi sur l’IA a été conçue à l’origine pour atténuer les dangers liés à des fonctions spécifiques de l’IA en fonction de leur niveau de risque, de faible à inacceptable. Mais les législateurs ont décidé de l'étendre aux modèles à usage général, les systèmes avancés qui sous-tendent les services d'IA à usage général comme ChatGPT et le chatbot Bard de Google. Une entente qui arrive malgré l'opposition menée par la France et l'Allemagne, qui ont plutôt appelé à l'autorégulation pour aider les sociétés européennes d'IA générative locales à rivaliser avec leurs grands rivaux américains.
La loi établit une nouvelle référence mondiale pour les pays cherchant à exploiter les avantages potentiels de la technologie, tout en essayant de se protéger contre ses risques possibles, comme l'automatisation des emplois, la diffusion de fausses informations en ligne et la mise en danger de la sécurité nationale. La loi doit encore franchir quelques étapes finales avant d'être approuvée, mais l'accord politique signifie que ses grandes lignes ont été fixées.
Toutefois, John Loeber estime que cette loi pourrait se retourner contre l'Europe.
Il s’agit de la pire réglementation : large, radicale, tout le monde est techniquement en infraction d’une manière ou d’une autre, mais vous pouvez payer pour la combattre. Les entrepreneurs obéissants et respectueux des règles perdront tout leur temps et leur argent à essayer de se conformer à chaque paragraphe de la loi sur l’IA. De plus en plus d’entrepreneurs soucieux de la Realpolitik placeront leur entreprise dans une zone grise, supposeront que s’ils réussissent, ils seront un jour poursuivis en justice et économiseront des fonds pour cette éventualité.
Et s’ils sont poursuivis, quelles sont les sanctions ? Jusqu'à 7% du chiffre d'affaires annuel mondial. C'est une farce. Si l’UE affirme que cette technologie est si dangereuse qu’elle nécessite une réglementation à l’échelle européenne, alors les sanctions devraient en réalité être beaucoup plus lourdes. S’il y a un mauvais acteur qui dirige une entreprise d’IA massivement abusive et que la plus grande menace à laquelle il est confronté est une pénalité de revenus de 7 % qu’il peut probablement réduire à 2 % après quelques années de litige, alors cela n’a aucun effet dissuasif ! Ces entreprises fonctionnent avec une marge brute de 75 %. Vous avez une année qui tourne à 73% ? Cela n’a pas d’importance.
Cela place la loi sur l’IA dans une situation intermédiaire lamentable en matière de réglementation : suffisamment ennuyeuse pour dissuader les entrepreneurs légitimes, suffisamment édentée pour ne pas empêcher des abus à grande échelle. Je suis choqué que la loi sur l’IA ne prévoie aucune possibilité d’interdire quelque chose qui serait réellement dangereux, comme une machine de propagande optimisée par l’IA et financée par l’État, se faisant passer pour un réseau social. S’ils ne peuvent pas interdire des produits, alors il ne s’agit pas de protection des consommateurs : il s’agit simplement d’extraction de richesses.
Et s’ils sont poursuivis, quelles sont les sanctions ? Jusqu'à 7% du chiffre d'affaires annuel mondial. C'est une farce. Si l’UE affirme que cette technologie est si dangereuse qu’elle nécessite une réglementation à l’échelle européenne, alors les sanctions devraient en réalité être beaucoup plus lourdes. S’il y a un mauvais acteur qui dirige une entreprise d’IA massivement abusive et que la plus grande menace à laquelle il est confronté est une pénalité de revenus de 7 % qu’il peut probablement réduire à 2 % après quelques années de litige, alors cela n’a aucun effet dissuasif ! Ces entreprises fonctionnent avec une marge brute de 75 %. Vous avez une année qui tourne à 73% ? Cela n’a pas d’importance.
Cela place la loi sur l’IA dans une situation intermédiaire lamentable en matière de réglementation : suffisamment ennuyeuse pour dissuader les entrepreneurs légitimes, suffisamment édentée pour ne pas empêcher des abus à grande échelle. Je suis choqué que la loi sur l’IA ne prévoie aucune possibilité d’interdire quelque chose qui serait réellement dangereux, comme une machine de propagande optimisée par l’IA et financée par l’État, se faisant passer pour un réseau social. S’ils ne peuvent pas interdire des produits, alors il ne s’agit pas de protection des consommateurs : il s’agit simplement d’extraction de richesses.
Position du Bureau américain du droit d'auteur sur l'enregistrement du contenu généré par l'IA
Le Bureau américain du droit d'auteur a adopté une position décisive en refusant l'enregistrement du droit d'auteur pour les images créées par l'algorithme d'IA Midjourney. Ce rejet a créé un précédent, affirmant que les œuvres d’art créées uniquement par l’IA, sans intervention humaine, ne sont pas éligibles à la protection du droit d’auteur. Dans le même ordre d’idées, le Bureau américain du droit d’auteur a publié des lignes directrices sur les œuvres assistées par l’IA, précisant que les œuvres créées par des humains à l’aide d’outils d’IA peuvent être éligibles à la protection du droit d’auteur. Les orientations confirment que les œuvres créées par des humains à l’aide d’outils d’IA doivent être évaluées selon que le rôle humain dans la création de ces œuvres est déterminant.
Envoyé par Daria Kuznetsova, avocate d'entreprise d'Everypixel
Source : McKinsey
Et vous ?
2023, l'année de l'IA ? Pourquoi ou pourquoi pas ?
Quelles sont les applications de l’IA générative qui vous ont le plus impressionné, surpris ou amusé en 2023? Pourquoi?
Quels sont les avantages et les inconvénients de l’IA dans des domaines particuliers comme la médecine? Pensez-vous que l’IA peut remplacer les médecins ou les compléter? Mêmes questions pour d'autres domaines
Quels sont les principaux défis et risques liés à l’utilisation de l’IA dans différents domaines? Comment les prévenir ou les résoudre?
Quelles sont les normes, les règles, les codes et les systèmes de contrôle que vous jugez nécessaires pour encadrer l’utilisation de l’IA? Qui devrait les élaborer et les appliquer?
Quelles sont vos attentes, vos craintes ou vos espoirs pour l’avenir de l’IA? Quel rôle souhaitez-vous jouer dans le développement et l’utilisation de l’IA?