- des réseaux de transformateurs ;
- des données synthétiques ;
- de l’apprentissage par renforcement ;
- de l’apprentissage fédéré ;
- de l’inférence causale
Les auteurs Kjell Carlsson, Brandon Purcell et Mike Gualtieri décrivent comment ces avancées impactent l'IA en termes de faisabilité technique et d'applications commerciales.
Ces changements répondent à certaines des limites de l’IA 1.0, telles que les limitations de données, de précision, de vitesse et de sécurité, qui ont rendu difficile pour les entreprises de développer des cas d'utilisation robustes. Les auteurs décrivent l'IA 1.0 comme étant axée sur les modèles spécifiques aux tâches de reconnaissance de formes, la formation et le déploiement centralisés, tandis que l'IA 2.0 se caractérise par un langage, une vision et d'autres modèles généraux de génération de données et est intégrée partout. Il s'agit d'un changement discontinu pour l'IA, ce qui signifie que ces nouvelles capacités constituent une rupture significative avec l'histoire de l'IA à ce jour, selon le rapport.
En plus de permettre à l’IA 2.0 de générer automatiquement du contenu et du code logiciel, de résumer des articles et de générer des questions, ces capacités peuvent être déployées n'importe où. Les auteurs déclarent que les modèles d'IA peuvent être placés et formés à la périphérie, ce qui signifie que les nouvelles applications doivent être moins chères, plus rapides et plus sécurisées.
Selon les auteurs, les entreprises ont déjà accès à la plupart des outils et services nécessaires pour commencer à créer des solutions IA 2.0 à partir d'hyperscalers tels qu'Amazon Web Services, Google, IBM et Microsoft. Voici un aperçu de chacune des cinq technologies :
- Réseaux de transformateurs : ces réseaux peuvent gérer des tâches avec un élément temporel ou contextuel, comme le traitement et la génération du langage naturel. Cette avancée permet d'entraîner des modèles géants à effectuer plusieurs tâches à la fois avec une plus grande précision et moins de données que les modèles individuels fonctionnant séparément. Selon le rapport, Microsoft utilise ces réseaux de transformateurs dans des applications commerciales telles que la recherche en langage naturel, le sous-titrage automatique des images, la modération du langage des joueurs inapproprié et le support client automatisé. Photon de Salesforce Research utilise ces réseaux pour transformer les questions des utilisateurs professionnels en requêtes SQL générées automatiquement.
- Données synthétiques : l'IA apprend des données et il n'est ni facile ni bon marché d'obtenir le volume de données nécessaire pour former des modèles et créer des cas d'utilisation en entreprise. Les données synthétiques résolvent ce problème et améliorent la précision, la robustesse et la généralisabilité des modèles, selon le rapport. Des entreprises comme MDClone utilisent des données synthétiques dans les établissements de santé pour combler les lacunes en matière de données et protéger la confidentialité des patients. Ceci est un exemple du nouvel écosystème de fournisseurs fournissant ce service aux entreprises qui ne souhaitent pas créer de données synthétiques en interne.
- Apprentissage par renforcement : cette nouvelle fonctionnalité permet aux entreprises de réagir plus rapidement aux changements de données. L'apprentissage par renforcement apprend en interagissant avec un environnement réel ou simulé par essais et erreurs au lieu de s'appuyer sur des données historiques. Une société d'exploration pétrolière et gazière utilise le projet Bonsai de Microsoft pour trouver les voies les plus prometteuses pour le forage horizontal sous terre, ont déclaré les auteurs du rapport.
- Apprentissage fédéré : l'un des obstacles à une diffusion plus large des enseignements tirés de l'IA est la nécessité de transférer des données à partir de plusieurs sources. Le transfert de ces données peut être « coûteux, difficile et souvent risqué du point de vue de la sécurité, de la confidentialité ou de la compétitivité ». L'apprentissage fédéré permet à des modèles d'IA distincts de partager des modèles au lieu des données sous-jacentes. Cela signifie que l'intelligence peut être partagée « rapidement, à moindre coût et en toute sécurité » au sein d'une même organisation et entre plusieurs organisations. Les auteurs du rapport déclarent qu'Android 11 de Google utilise l'apprentissage fédéré pour générer des réponses intelligentes et suggérer des emojis.
- Inférence causale : cette technique peut identifier les relations de cause à effet entre les variables qui peuvent suggérer des relations étayées par des données. Cela ne peut pas prouver la causalité, mais cela permet d'éviter plus facilement des décisions commerciales erronées basées sur des modèles peu performants. Cette capacité est à un stade précoce de développement par rapport aux quatre autres facteurs.
Source : Forrester