
En mars, un rapport indiquait que Microsoft était en train de développer ses propres modèles axés sur le raisonnement. Selon le rapport, Microsoft envisageait de rompre ses liens avec OpenAI et de se débarrasser de sa dépendance excessive aux technologies de la startup. Microsoft a déjà exprimé des plaintes concernant le modèle GPT-4 d'OpenAI, jugé trop coûteux et pas assez rapide pour répondre aux questions des utilisateurs. Microsoft semblait également vouloir se débarrasser de ce partenariat pour éviter des poursuites judiciaires.
Le virage vers des modèles maison
C’est dans ce contexte que Microsoft a décidé de tracer sa propre voie en dévoilant ses premiers modèles développés en interne, sous la bannière MAI (Microsoft AI). Deux d’entre eux sont désormais connus : MAI-Voice-1, dédié à la synthèse vocale, et MAI-1-preview, un modèle de langage généraliste destiné à rivaliser, au moins partiellement, avec les grands modèles de la concurrence. Le premier impressionne par sa rapidité et son expressivité. Capable de générer une minute complète d’audio en une fraction de seconde, il ouvre la voie à des applications immersives dans Copilot, que ce soit pour des podcasts générés automatiquement ou des assistants vocaux fluides. Le second, MAI-1-preview, constitue un pari plus audacieux. Conçu sur une base de 15 000 GPU NVIDIA H100, il n’a pas encore l’ambition d’égaler GPT-4 ou Claude dans toutes leurs capacités, mais il démontre la volonté de Microsoft de bâtir son propre socle technologique, sans se limiter à être l’intégrateur d’OpenAI.
Voici l'annonce de Microsoft :

Un choix pragmatique plutôt que mégalomaniaque
À ce jour, Copilot s'est principalement appuyé sur les modèles d'OpenAI. Microsoft a investi des sommes colossales dans OpenAI, et il est peu probable que les deux entreprises se séparent complètement dans un avenir proche. Cela dit, des tensions sont apparues ces derniers mois lorsque leurs motivations ou leurs objectifs se sont écartés.
Comme il est difficile de prédire où tout cela va mener, Microsoft a probablement tout intérêt à long terme à développer ses propres modèles.
Il est également possible que Microsoft ait introduit ces modèles pour répondre à des cas d'utilisation ou à des requêtes sur lesquels OpenAI ne se concentre pas. Nous assistons à une évolution progressive du paysage de l'IA vers des modèles plus spécialisés pour certaines tâches, plutôt que vers des modèles généraux et polyvalents destinés à répondre à tous les besoins de tous les utilisateurs.
La stratégie adoptée par Microsoft semble trancher avec la course effrénée à « l’IA la plus puissante » que l’on observe chez d’autres acteurs. Mustafa Suleyman, l’ancien co-fondateur de DeepMind recruté par Microsoft pour piloter son département IA, l’explique clairement : il ne s’agit pas de construire le modèle le plus gigantesque, mais de créer des systèmes plus efficaces, mieux calibrés et capables de répondre à des besoins concrets. Là où OpenAI ou Anthropic visent des architectures universelles, Microsoft semble plutôt vouloir assembler un écosystème de modèles spécialisés. Cette orientation pourrait séduire les professionnels qui cherchent moins l’expérimentation de pointe que la fiabilité, la scalabilité et une intégration fluide dans leurs outils quotidiens.
Il est donc logique que ces modèles soient déployés dans Copilot, le chatbot IA grand public de Microsoft. À propos de MAI-1-preview, le blog Microsoft AI précise que « ce modèle est conçu pour offrir des fonctionnalités puissantes aux consommateurs qui souhaitent bénéficier de modèles spécialisés dans le suivi d'instructions et la fourniture de réponses utiles aux questions quotidiennes ».
Copilot, laboratoire d’une nouvelle hybridation
L’intégration de ces modèles maison au sein de Copilot marque le début d’une nouvelle ère. Jusqu’ici, l’assistant intelligent reposait presque exclusivement sur GPT-4 d’OpenAI. Désormais, certaines tâches sont traitées directement par MAI-Voice-1 ou MAI-1-preview, selon la pertinence du contexte. La promesse est double : réduire les coûts liés à la dépendance à OpenAI et offrir aux utilisateurs une réactivité accrue, puisque les modèles internes peuvent être optimisés pour les cas d’usage précis de l’écosystème Microsoft. À terme, il est probable que Copilot devienne un véritable orchestrateur de modèles, choisissant en temps réel l’IA la plus adaptée à la demande, qu’elle vienne d’OpenAI, de Microsoft ou même de partenaires tiers.
Des tensions avec OpenAI qui deviennent palpables
Cet élan vers l’indépendance n’est pas neutre pour le partenariat historique. Ces derniers mois, des signes de crispation sont...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.