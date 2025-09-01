IdentifiantMot de passe
Microsoft pose la première pierre de son indépendance vis-à-vis d'OpenAI en proposant enfin des modèles d'IA maison : MAI-Voice-1 et MAI-1-preview sont sous la bannière MAI (Microsoft AI)

Le , par Stéphane le calme
0 commentaire

23PARTAGES

6  0 
Microsoft pose la première pierre de son indépendance vis-à-vis dOpenAI en proposant enfin des modèles d'IA maison :
MAI-Voice-1 et MAI-1-preview sont sous la bannière MAI (Microsoft AI)

Depuis la fin de lannée 2022, le duo MicrosoftOpenAI domine le paysage de lintelligence artificielle. Microsoft a massivement investi dans la start-up californienne, mettant sur la table plusieurs milliards de dollars et offrant son infrastructure Azure comme colonne vertébrale aux déploiements des modèles de la série GPT. Cest grâce à ce partenariat que les fameux Copilot ont vu le jour dans Word, Excel, Outlook et Teams, transformant le quotidien de millions dutilisateurs. Mais derrière cette réussite, un dilemme stratégique sest progressivement imposé. À force de dépendre dOpenAI, Microsoft se retrouvait dans une position inconfortable : incapable de maîtriser totalement la technologie qui alimente une bonne partie de sa stratégie produit et dépendant des orientations dune société tierce, parfois imprévisible.

En mars, un rapport indiquait que Microsoft était en train de développer ses propres modèles axés sur le raisonnement. Selon le rapport, Microsoft envisageait de rompre ses liens avec OpenAI et de se débarrasser de sa dépendance excessive aux technologies de la startup. Microsoft a déjà exprimé des plaintes concernant le modèle GPT-4 d'OpenAI, jugé trop coûteux et pas assez rapide pour répondre aux questions des utilisateurs. Microsoft semblait également vouloir se débarrasser de ce partenariat pour éviter des poursuites judiciaires.

Le virage vers des modèles maison

Cest dans ce contexte que Microsoft a décidé de tracer sa propre voie en dévoilant ses premiers modèles développés en interne, sous la bannière MAI (Microsoft AI). Deux dentre eux sont désormais connus : MAI-Voice-1, dédié à la synthèse vocale, et MAI-1-preview, un modèle de langage généraliste destiné à rivaliser, au moins partiellement, avec les grands modèles de la concurrence. Le premier impressionne par sa rapidité et son expressivité. Capable de générer une minute complète daudio en une fraction de seconde, il ouvre la voie à des applications immersives dans Copilot, que ce soit pour des podcasts générés automatiquement ou des assistants vocaux fluides. Le second, MAI-1-preview, constitue un pari plus audacieux. Conçu sur une base de 15 000 GPU NVIDIA H100, il na pas encore lambition dégaler GPT-4 ou Claude dans toutes leurs capacités, mais il démontre la volonté de Microsoft de bâtir son propre socle technologique, sans se limiter à être lintégrateur dOpenAI.

Voici l'annonce de Microsoft :

Citation Envoyé par Microsoft
Chez Microsoft AI (MAI), nous pensons que l'IA doit être utilisée pour donner plus de moyens à chaque individu sur la planète. Nous créons une IA pour tous, une présence solidaire et utile, toujours au service de l'humanité. Elle sera la porte d'entrée vers un univers de connaissances et un ensemble de capacités qui permettront aux individus et aux organisations d'aller plus loin. Responsables, fiables, dotés de personnalité et d'expertise, nous nous concentrons sur la création d'une IA appliquée comme plateforme pour des produits de référence et profondément fiables qui comprennent chacun de nos besoins uniques.

Depuis l'année dernière, nous nous sommes attachés à poser les bases de cette vision, avec une équipe et une infrastructure de classe mondiale. Pour atteindre pleinement nos objectifs, MAI a besoin de modèles spécialement conçus. Aujourd'hui, nous sommes ravis de vous présenter les premières étapes pour que cela devienne réalité.
  • Tout d'abord, nous lançons MAI-Voice-1, notre premier modèle de génération de discours hautement expressif et naturel, disponible dans Copilot Daily et Podcasts, ainsi que dans une toute nouvelle expérience Copilot Labs à essayer ici. La voix est l'interface du futur pour les compagnons IA et MAI-Voice-1 offre un son haute fidélité et expressif dans des scénarios à un ou plusieurs locuteurs.
  • Deuxièmement, nous avons commencé à tester publiquement MAI-1-preview sur LMArena, une plateforme populaire d'évaluation de modèles communautaires. Il s'agit du premier modèle de base de MAI formé de bout en bout, qui donne un aperçu des futures offres de Copilot. Nous travaillons activement à l'amélioration des modèles. Nous aurons beaucoup plus à partager dans les mois à venir. Restez à l'écoute !

Nous avons de grandes ambitions pour l'avenir. Non seulement nous poursuivrons nos progrès dans ce domaine, mais nous pensons également que la mise en place d'une gamme de modèles spécialisés répondant à différentes intentions et cas d'utilisation des utilisateurs permettra de dégager une valeur considérable. Cette équipe aura beaucoup à offrir dans ces deux domaines dans un avenir proche. Nous sommes enthousiasmés par le travail qui nous attend, car notre objectif est de fournir des modèles de pointe et de les mettre à la disposition des utilisateurs du monde entier.

Un choix pragmatique plutôt que mégalomaniaque

À ce jour, Copilot s'est principalement appuyé sur les modèles d'OpenAI. Microsoft a investi des sommes colossales dans OpenAI, et il est peu probable que les deux entreprises se séparent complètement dans un avenir proche. Cela dit, des tensions sont apparues ces derniers mois lorsque leurs motivations ou leurs objectifs se sont écartés.

Comme il est difficile de prédire où tout cela va mener, Microsoft a probablement tout intérêt à long terme à développer ses propres modèles.

Il est également possible que Microsoft ait introduit ces modèles pour répondre à des cas d'utilisation ou à des requêtes sur lesquels OpenAI ne se concentre pas. Nous assistons à une évolution progressive du paysage de l'IA vers des modèles plus spécialisés pour certaines tâches, plutôt que vers des modèles généraux et polyvalents destinés à répondre à tous les besoins de tous les utilisateurs.

La stratégie adoptée par Microsoft semble trancher avec la course effrénée à « lIA la plus puissante » que lon observe chez dautres acteurs. Mustafa Suleyman, lancien co-fondateur de DeepMind recruté par Microsoft pour piloter son département IA, lexplique clairement : il ne sagit pas de construire le modèle le plus gigantesque, mais de créer des systèmes plus efficaces, mieux calibrés et capables de répondre à des besoins concrets. Là où OpenAI ou Anthropic visent des architectures universelles, Microsoft semble plutôt vouloir assembler un écosystème de modèles spécialisés. Cette orientation pourrait séduire les professionnels qui cherchent moins lexpérimentation de pointe que la fiabilité, la scalabilité et une intégration fluide dans leurs outils quotidiens.

Il est donc logique que ces modèles soient déployés dans Copilot, le chatbot IA grand public de Microsoft. À propos de MAI-1-preview, le blog Microsoft AI précise que « ce modèle est conçu pour offrir des fonctionnalités puissantes aux consommateurs qui souhaitent bénéficier de modèles spécialisés dans le suivi d'instructions et la fourniture de réponses utiles aux questions quotidiennes ».


Copilot, laboratoire dune nouvelle hybridation

Lintégration de ces modèles maison au sein de Copilot marque le début dune nouvelle ère. Jusquici, lassistant intelligent reposait presque exclusivement sur GPT-4 dOpenAI. Désormais, certaines tâches sont traitées directement par MAI-Voice-1 ou MAI-1-preview, selon la pertinence du contexte. La promesse est double : réduire les coûts liés à la dépendance à OpenAI et offrir aux utilisateurs une réactivité accrue, puisque les modèles internes peuvent être optimisés pour les cas dusage précis de lécosystème Microsoft. À terme, il est probable que Copilot devienne un véritable orchestrateur de modèles, choisissant en temps réel lIA la plus adaptée à la demande, quelle vienne dOpenAI, de Microsoft ou même de partenaires tiers.

Des tensions avec OpenAI qui deviennent palpables

Cet élan vers lindépendance nest pas neutre pour le partenariat historique. Ces derniers mois, des signes de crispation sont apparus. Des dirigeants dOpenAI auraient évoqué lhypothèse daccuser Microsoft de pratiques anticoncurrentielles, notamment en raison de la manière dont les contrats de cloud et les intégrations logicielles sont structurés. De son côté, Microsoft consacre désormais plus de 80 milliards de dollars par an à ses initiatives liées à lintelligence artificielle, un signal clair quil ne souhaite pas rester prisonnier de la feuille de route dOpenAI. Le couple continue donc de fonctionner, mais la dynamique a changé : Microsoft nest plus seulement le bailleur et lhébergeur, il devient aussi un concurrent.

Les défis qui attendent Redmond

Rien nindique pour linstant que les modèles MAI pourront égaler les ténors de lindustrie dans les deux ou trois prochaines années. Le défi technique reste colossal. Entraîner des modèles performants exige des quantités astronomiques de données, une expertise rare et des ressources matérielles considérables. Mais Microsoft a un avantage déterminant : sa capacité dintégration. Là où OpenAI doit séduire les utilisateurs via des produits comme ChatGPT, léditeur de Redmond dispose déjà dun accès direct à une base dutilisateurs massive via Windows et la suite Microsoft 365. Autrement dit, même si ses modèles natteignent pas immédiatement le sommet de la hiérarchie, leur simple présence dans des outils utilisés quotidiennement par des centaines de millions de personnes peut suffire à les imposer comme une norme.

Pour les professionnels de linformatique, cette évolution marque un tournant. Il ne sagit plus seulement de choisir entre « utiliser GPT ou ne pas utiliser GPT », mais de naviguer dans un environnement où cohabitent des modèles multiples, parfois complémentaires, parfois concurrents. Cela soulève des questions stratégiques : quelle plateforme privilégier ? Faut-il adapter les architectures internes pour dialoguer avec plusieurs modèles à la fois ? Quelle sera la place du cloud Azure si Microsoft bascule progressivement vers ses propres briques IA ? Autant de décisions qui façonneront la manière dont les entreprises tireront profit de cette nouvelle génération de technologies.

Conclusion : vers une autonomie assumée

Le lancement de MAI-Voice-1 et de MAI-1-preview nest pas seulement une annonce produit de plus dans le flux incessant de lactualité technologique. Cest un signal politique envoyé par Microsoft. Après avoir fait de son partenariat avec OpenAI un accélérateur décisif, lentreprise veut désormais démontrer quelle est capable de tenir seule la barre. Et si OpenAI a permis à Microsoft de gagner une avance spectaculaire, cest bien Redmond qui entend écrire les chapitres suivants de son histoire dindépendance.

Source : Microsoft

Et vous ?

La recherche dindépendance de Microsoft vis-à-vis dOpenAI est-elle une nécessité stratégique ou une simple démonstration de force ?

Les modèles spécialisés, comme MAI-Voice-1, sont-ils lavenir face aux modèles universels comme GPT-5 ?

Copilot peut-il réellement devenir un orchestrateur neutre de modèles, ou sera-t-il dabord un outil pour imposer lécosystème maison ?

Cette émancipation pourrait-elle redéfinir léquilibre des forces dans lIA, au détriment dOpenAI ?

Pour les entreprises clientes, faut-il se préparer à une fragmentation des standards et à la nécessité de gérer plusieurs IA en parallèle ?
