L’intelligence artificielle (IA) a connu en 2023 des progrès spectaculaires dans de nombreux domaines, tels que la génération de contenu, la synthèse vocale, la traduction automatique, la reconnaissance d’images, la création artistique, la médecine, l’éducation, la sécurité, l’éthique et la durabilité. Ces avancées ont été rendues possibles par l’amélioration des algorithmes, des données, des infrastructures et des compétences, ainsi que par l’augmentation des investissements et de la collaboration entre les acteurs publics et privés. L’IA a ainsi transformé de nombreux secteurs d’activité, créé de nouvelles opportunités, mais aussi soulevé des défis et des risques.L’une des innovations les plus marquantes de 2023 a été l’émergence de l’IA générative, qui désigne les outils capables de produire du contenu original et de qualité, comme du texte, des images, de la musique, de la vidéo ou du code. Ces outils se basent sur des modèles de réseaux de neurones profonds, comme les GAN (Generative Adversarial Networks) ou les Transformers, qui apprennent à imiter des exemples existants et à en créer de nouveaux. Selon une enquête mondiale de McKinsey, un tiers des organisations utilisent régulièrement l’IA générative dans au moins une fonction métier, et 40% des organisations prévoient d’augmenter leurs investissements dans l’IA en raison des avancées de l’IA générative.
2023 et ses avancées en matière d'IA : génération de texte
GPT-4 : ChatGPT est sans doute l'outil qui a le plus fait parlé dans le domaine. Développé par OpenAI, l'outil s'appuie sur GPT-4 Turbo. De plus, OpenAI a également annoncé une nouvelle version personnalisable de ChatGPT, ainsi qu'un nouveau magasin qui présentera des IA personnalisées par l'utilisateur et particulièrement utiles. Concrètement, il s’agit d’une plateforme permettant de créer des versions personnalisées de ChatGPT pour des cas d'utilisation spécifiques, sans qu'aucune ligne de code ne soit nécessaire. « On peut imaginer que quelqu'un construise un TPG spécialisé dans l'apprentissage d'une nouvelle langue ou donnant des conseils en matière de décoration d'intérieur », a déclaré Peter Deng, vice-président d'OpenAI chargé des produits destinés aux consommateurs et aux entreprises, lors d'une interview.
Le GPT-4 d'OpenAI gère désormais la saisie d'images, génère des légendes, des classifications, entend et répond dans une conversation aller-retour et prend en charge la navigation Web en temps réel. OpenAI a également étendu la prise en charge des plugins, favorisant ainsi un paysage enrichi de concurrents open source. GPT-4 est la prochaine étape du parcours d’OpenAI pour développer l’AGI.
Mixtral 8x7B : Dans le paysage mondial de l’intelligence artificielle, dominé par des géants tels qu’OpenAI, Google et Meta, une nouvelle entreprise française fait parler d’elle : Mistral AI, fondée par cofondée par trois chercheurs français de l'IA passés par les GAFA américains.
La startup française a publié ce mois-ci une nouvelle version de son modèle de langage open source, baptisé Mixtral 8x7B, qui serait autant ou beaucoup plus performant que Llama 2 70B et GPT3.5 sur la plupart des benchmarks. Mixtral 8x7B a 46,7 milliards de paramètres au total mais n'utilise que 12,9 milliards de paramètres par jeton. Il traite donc les entrées et génère la sortie à la même vitesse et pour le même coût qu'un modèle 12,9 milliards de paramètres. Mistral AI se sert d'un procédé qui lui permet de rester efficace, mais avec un coût et une latence moindres.
Gemini et Bard : Bard de Google a ajouté des émotions et des sentiments humains au paysage des chatbots. Introduit dans le chatbot Bard et formé sur un ensemble de données multimodales, Gemini de Google est apparu comme le modèle d'IA « le plus performant » et le concurrent le plus proche du ChatGPT d'OpenAI. Alphabet a annoncé que les développeurs peuvent utiliser Google AI Studio et Vertex AI pour créer des applications avec l'API Gemini Pro, qui permet d'accéder au nouveau modèle d'IA générative de Google. Le déploiement initial de Gemini par Google était limité à Google Bard et au Pixel 8 Pro.
Google a estimé que son modèle d'intelligence artificielle surpasse ChatGPT dans la plupart des tests et affiche un « raisonnement avancé » dans plusieurs formats, y compris la possibilité de visualiser et de noter les devoirs de physique d'un étudiant.
Cependant, la meilleure vidéo de démonstration des capacités de Gemini était truquée
Nous pouvons également citer :
- Grok : La startup xAI d'Elon Musk a signalé son engagement dans le développement de l'IA, potentiellement en concurrence avec OpenAI, en dévoilant « Grok » – un chatbot avec humour, rébellion et connaissance en temps réel via la plateforme X. xAI a promis que Grok était conçu pour répondre aux questions provocatrices rejetées par d’autres systèmes d’IA.
Llama 2 : Meta a publié Llama 2, la nouvelle génération de son grand modèle de langage open source, présentant une efficacité améliorée. Le LLM affiné de Meta a également été optimisé pour les cas d’utilisation de dialogue et a surpassé les autres modèles open source sur la plupart des benchmarks. - Yi-34B llm : Évaluée à 1 milliard de dollars cette année, la startup 01.AI de Kai-Fu Lee a lancé Yi-34B, un réseau neuronal open source qui a surpassé les modèles concurrents avec un nombre de paramètres nettement plus élevé, soulignant sa rentabilité.
Génération de médias
Images
[LIST][*]Midjourney : Le modèle V.5 de Midjourney a marqué une...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.