IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Un institut de recherche gouvernemental des Émirats arabes unis a publié un nouveau modèle d'IA générative open-source : Falcon 2 11B
Déclaré comme "surclassant le nouveau Llama 3 de Meta"

Le , par Jade Emy

5PARTAGES

7  0 
L'Institut d'innovation technologique des Émirats arabes unis lance une nouvelle série de modèles d'IA pour concurrencer les grandes entreprises technologiques. La série Falcon 2 est open-source et serait plus performants que le nouveau Llama 3 de Meta

Le Technology Innovation Institute (TII) est un institut de recherche financé par le gouvernement d'Abu Dhabi qui opère dans les domaines de l'intelligence artificielle, de l'informatique quantique, de la robotique autonome, de la cryptographie, des matériaux avancés, de la science numérique, de l'énergie dirigée et des systèmes sécurisés.

L'Institut d'innovation technologique (TII) a déclaré qu'il lançait la série Falcon 2 : Falcon 2 11B, un modèle basé sur le texte, et Falcon 2 11B VLM, un modèle vision-langage qui peut générer une description textuelle d'une image téléchargée. La série Falcon 2 est un modèle d'IA open-source, multilingue et multimodal, et est doté de capacités de conversion de la vision au langage. Le nouveau Falcon 2 11B surpasse le Llama 3 8B de Meta et affiche des performances comparables à celles du modèle Gemma 7B de Google, comme l'a vérifié de manière indépendante le Hugging Face Leaderboard. Les plans immédiats comprennent l'exploration du "mélange d'experts" pour améliorer les capacités d'apprentissage automatique.

Les Émirats arabes unis, grand exportateur de pétrole et puissance influente du Moyen-Orient, investissent massivement dans l'intelligence artificielle. Mais ce pari a également attiré l'attention des autorités américaines qui, l'année dernière, ont posé un ultimatum : la technologie américaine ou la technologie chinoise. L'entreprise émiratie G42, spécialisée dans l'intelligence artificielle, a retiré le matériel chinois et a cédé des participations dans des entreprises chinoises avant d'obtenir un investissement de 1,5 milliard de dollars de la part de Microsoft, en coordination avec Washington.

Le secrétaire général du Conseil de recherche sur les technologies avancées, Faisal Al Bannai, qui est également conseiller du président pour la recherche stratégique et les technologies avancées, a déclaré que les Émirats arabes unis démontraient qu'ils pouvaient être un acteur majeur dans le domaine de l'intelligence artificielle. La série Falcon 2 intervient alors que les entreprises et les pays se lancent dans une course au développement de leurs propres grands modèles de langage après la sortie en 2022 de ChatGPT par OpenAI. Si certains ont choisi de garder leur code d'IA propriétaire, d'autres, comme Falcon des Émirats arabes unis et Llama de Meta, ont mis leur code à la disposition de tous.

M. Al Bannai s'est dit optimiste quant aux performances de Falcon 2 et a indiqué qu'il travaillait sur la "génération Falcon 3". "Nous sommes très fiers de pouvoir encore nous surpasser et de pouvoir rivaliser avec les meilleurs modèles du monde", a-t-il déclaré.


Falcon 2 : la nouvelle série de modèles d'IA open-source des Émirats arabes unis

Le Technology Innovation Institute (TII), un centre de recherche scientifique mondial de premier plan et le pilier de recherche appliquée du Conseil de recherche en technologies avancées (ATRC) d'Abou Dhabi, a lancé une deuxième itération de son célèbre grand modèle de langage (LLM) - Falcon 2. Dans le cadre de cette série, elle a dévoilé deux versions révolutionnaires : Falcon 2 11B, un LLM plus efficace et plus accessible, entraîné sur 5,5 trillions de tokens avec 11 milliards de paramètres, et Falcon 2 11B VLM, qui se distingue par ses capacités de conversion de la vision en modèle de langage (VLM), qui permettent une conversion transparente des entrées visuelles en sorties textuelles. Bien que les deux modèles soient multilingues, le Falcon 2 11B VLM est un modèle multimodal et possède cette capacité de conversion d'image en texte, ce qui marque une avancée significative dans l'innovation en matière d'IA.

La TII commente les performances du modèle :

Testé par rapport à plusieurs modèles d'IA de premier plan dans sa catégorie parmi les modèles pré-entraînés, Falcon 2 11B surpasse les performances du tout nouveau Llama 3 de Meta avec 8 milliards de paramètres (8B), et fait jeu égal avec Gemma 7B de Google à la première place (Falcon 2 11B : 64,28 contre Gemma 7B : 64,29), comme l'a vérifié de manière indépendante Hugging Face, une plateforme basée aux États-Unis qui héberge un outil d'évaluation objectif et un classement mondial pour les LLM ouverts. Plus important encore, le Falcon 2 11B et le 11B VLM sont tous deux des logiciels open-source, ce qui permet aux développeurs du monde entier d'y accéder sans restriction. Dans un avenir proche, il est prévu d'élargir la gamme des modèles Falcon 2 de nouvelle génération, en introduisant une série de tailles. Ces modèles seront encore améliorés grâce à des capacités d'apprentissage automatique avancées telles que le "mélange d'experts" (MoE), visant à pousser leurs performances à des niveaux encore plus sophistiqués.

Tous les modèles d'IA de TII publiés à ce jour se sont toujours classés dans le peloton de tête au niveau mondial, en tant que LLM open-source les plus puissants. Les nouveaux modèles Falcon 2 11B, réduits et polyvalents, devraient permettre à TII de s'imposer davantage sur le marché dans le monde en constante évolution de l'IA générative.
Les modèles Falcon 2 11B, dotés de capacités multilingues, s'attaquent en toute transparence à des tâches en anglais, français, espagnol, allemand, portugais et dans d'autres langues, ce qui enrichit leur polyvalence et accroît leur efficacité dans divers scénarios. Le Falcon 2 11B VLM, un modèle de vision-langage, est capable d'identifier et d'interpréter les images et les éléments visuels de l'environnement, ce qui lui permet d'offrir un large éventail d'applications dans des secteurs tels que la santé, la finance, le commerce électronique, l'éducation et le droit. Ces applications vont de la gestion de documents, de l'archivage numérique et de l'indexation contextuelle à l'aide aux personnes souffrant de déficiences visuelles. En outre, ces modèles peuvent fonctionner efficacement sur une seule unité de traitement graphique (GPU), ce qui les rend hautement évolutifs et faciles à déployer et à intégrer dans des infrastructures plus légères telles que les ordinateurs portables et d'autres appareils.

S.E. Faisal Al Bannai, secrétaire général de l'ATRC et conseiller du président des Émirats arabes unis pour les questions de recherche stratégique et de technologie avancée, a déclaré :

"Avec la sortie du Falcon 2 11B, nous avons introduit le premier modèle de la série Falcon 2. Alors que le Falcon 2 11B a démontré des performances exceptionnelles, nous réaffirmons avec lui notre engagement en faveur du mouvement open-source et de la Falcon Foundation. Avec l'arrivée prochaine sur le marché d'autres modèles multimodaux de différentes tailles, notre objectif est de faire en sorte que les développeurs et les entités qui attachent de l'importance à leur vie privée aient accès à l'un des meilleurs modèles d'IA pour leur permettre de se lancer dans l'IA."
S'exprimant sur le modèle, le Dr Hakim Hacid, directeur exécutif et chercheur en chef par intérim de l'unité AI Cross-Center de TII, a déclaré :

"L'IA est en constante évolution et les développeurs reconnaissent les innombrables avantages des modèles plus petits et plus efficaces. En plus de réduire les besoins en puissance de calcul et de répondre aux critères de durabilité, ces modèles offrent une plus grande flexibilité et s'intègrent de manière transparente dans les infrastructures d'IA de pointe, la prochaine mégatendance émergente. En outre, les capacités de conversion de la vision au langage du Falcon 2 ouvrent de nouveaux horizons en matière d'accessibilité à l'IA, en permettant aux utilisateurs de bénéficier d'interactions transformatrices entre l'image et le texte.
La polyvalence du Falcon 2 11B a également conduit TII à envisager de travailler sur des innovations plus excitantes de l'IA générative. Parmi celles-ci, l'adoption d'un nouveau type de capacité d'apprentissage automatique connu sous le nom susmentionné de "mélange d'experts". Cette méthode consiste à fusionner des réseaux plus petits avec des spécialisations distinctes, en veillant à ce que les domaines les mieux informés collaborent pour fournir des réponses hautement sophistiquées et personnalisées - un peu comme si l'on disposait d'une équipe d'assistants intelligents qui connaissent chacun quelque chose de différent et qui travaillent ensemble pour prédire ou prendre des décisions en cas de besoin. Cette approche permet non seulement d'améliorer la précision, mais aussi d'accélérer la prise de décision, ouvrant ainsi la voie à des systèmes d'IA plus intelligents et plus efficaces.

Le Falcon 2 11B est soumis à la licence TII Falcon License 2.0, une licence logicielle permissive basée sur Apache 2.0 qui comprend une politique d'utilisation acceptable qui encourage l'utilisation responsable de l'IA.

Source : Technology Innovation Institute (TII)

Et vous ?

Quel est votre avis sur cette annonce ?
Pensez-vous que cette série de modèle d'IA est crédible ou pertinente ?

Voir aussi :

Falcon 180B : un modèle d'IA open source avec 180 milliards de paramètres entraînés sur 3 500 milliards de jetons, il serait plus performant que le modèle Llama 2 de Meta et égale PaLM-2 de Google

Meta annonce que Llama 3 est "le LLM le plus performant à ce jour", bientôt disponible sur AWS, Databricks, Google Cloud, Hugging Face, Kaggle, IBM WatsonX, Microsoft Azure, NVIDIA NIM et Snowflake

Quelle est la meilleure option pour les entreprises : des services d'IA libres ou commerciaux ? Défis et limites d'une approche open source de l'intelligence artificielle

Une erreur dans cette actualité ? Signalez-nous-la !