Cette tendance soulève des questions cruciales pour l'avenir du travail, de la société et de l'humanité. L'automatisation croissante due à la performance accrue de l'IA pourrait entraîner des pertes d'emplois et des changements dans l'organisation du travail. En ce qui concerne la société, l'IA a le potentiel d'améliorer les domaines tels que la médecine, l'éducation et le divertissement, mais elle présente aussi des risques, tels que la propagation de fausses informations et la création d'armes autonomes.
Enfin, la question de savoir si l'IA pourrait éventuellement surpasser l'intelligence humaine suscite des débats sur sa possible menace pour l'humanité, certains craignant une domination mondiale par l'IA, tandis que d'autres estiment qu'elle restera sous le contrôle humain. L'avenir de l'IA demeure incertain, mais son impact significatif sur le monde souligne l'importance de réfléchir aux implications dès maintenant afin de se préparer à l'évolution à venir. L'auteur encourage les lecteurs à partager leurs opinions sur l'avenir de l'IA dans les commentaires.
Les progrès de l'IA ne vont probablement pas ralentir
Au cours des dix dernières années, les systèmes d'IA se sont développés à une vitesse fulgurante. Après avoir battu un joueur légendaire au jeu complexe de Go en 2016, l'IA est aujourd'hui capable de reconnaître des images et des paroles mieux que les humains, et de réussir des tests tels que les examens d'écoles de commerce et les questions d'entretien d'Amazon sur le codage.
La semaine dernière, lors d'une audition de la commission judiciaire du Sénat américain sur la réglementation de l'IA, le sénateur Richard Blumenthal du Connecticut a décrit la réaction de ses électeurs face aux récentes avancées de l'IA. Le mot qui a été utilisé à maintes reprises est « effrayant ». La sous-commission « Vie privée, technologie et droit », qui supervisait la réunion, a entendu les témoignages de trois experts, qui ont souligné le rythme des progrès de l'IA. L'un de ces témoins, Dario Amodei, PDG de l'entreprise d'IA Anthropic, a déclaré que « la chose la plus importante à comprendre à propos de l'IA est la vitesse à laquelle elle évolue ».
Envoyé par Dario Amodei
Pour chaque critère de référence, le niveau de référence le plus performant indiqué dans le document de référence est considéré comme le « point de départ », qui est fixé à 0 %. La performance humaine est fixée à 100 %. Reconnaissance de l'écriture manuscrite = MNIST, Compréhension du langage = GLUE, Reconnaissance d'images = ImageNet, Compréhension de la lecture = SQuAD 1.1, Compréhension de la lecture = SQuAD 2.0, Reconnaissance de la parole = Switchboard, Mathématiques scolaires = GSK8k, Complétion du bon sens = HellaSwag, Génération de code = HumanEval.
On pense souvent que les progrès scientifiques et technologiques sont fondamentalement imprévisibles et qu'ils sont le fruit d'éclairs de lumière qui apparaissent plus clairement avec le recul. Mais les progrès des capacités des systèmes d'intelligence artificielle sont prévisibles et dépendent de l'évolution de trois éléments : le calcul, les données et les algorithmes.
Une grande partie des progrès réalisés au cours des 70 dernières années est due au fait que les chercheurs ont entraîné leurs systèmes d'IA en utilisant une plus grande puissance de traitement informatique, généralement appelée « calcul », en alimentant les systèmes avec davantage de données ou en trouvant des astuces algorithmiques qui réduisent effectivement la quantité de calcul ou de données nécessaire pour obtenir les mêmes résultats. Il est essentiel de comprendre comment ces trois facteurs ont fait progresser l'IA dans le passé pour comprendre pourquoi la plupart des personnes travaillant dans le domaine de l'IA ne s'attendent pas à ce que les progrès se ralentissent de sitôt.
Le premier réseau neuronal artificiel, le Perceptron Mark I, a été développé en 1957 et pouvait apprendre à déterminer si une carte était marquée à gauche ou à droite. Il comportait 1 000 neurones artificiels et son apprentissage nécessitait environ 700 000 opérations. Plus de 65 ans plus tard, l'OpenAI a publié le grand modèle linguistique GPT-4. L'entraînement de GPT-4 a nécessité environ 21 septillions d'opérations.
L'augmentation des calculs permet aux systèmes d'IA d'ingérer de plus grandes quantités de données, ce qui signifie que le système dispose de plus d'exemples à partir desquels il peut apprendre. Une plus grande capacité de calcul permet également au système de modéliser la relation entre les variables des données de manière plus détaillée, ce qui signifie qu'il peut tirer des conclusions plus précises et plus nuancées à partir des exemples qui lui sont présentés.
Depuis 1965, la loi de Moore - l'observation selon laquelle le nombre de transistors dans un circuit intégré double tous les deux ans environ - signifie que le prix de l'informatique n'a cessé de diminuer. Selon Jaime Sevilla, directeur d'Epoch, un organisme de recherche, si cette évolution s'est traduite par une augmentation de la quantité de calcul utilisée pour entraîner les systèmes d'IA, les chercheurs se sont davantage concentrés sur le développement de nouvelles techniques de construction de systèmes d'IA que sur la quantité de calcul utilisée pour entraîner ces systèmes.
Les choses ont changé vers 2010, explique Sevilla. « Les gens ont réalisé que si l'on formait des modèles plus grands, on n'obtiendrait pas de rendement décroissant », ce qui était l'opinion communément admise à l'époque.
Depuis lors, les développeurs ont dépensé des sommes de plus en plus importantes pour former des modèles à plus grande échelle. L'entraînement des systèmes d'IA nécessite des puces spécialisées coûteuses. Les développeurs d'IA construisent leur propre infrastructure informatique ou paient des fournisseurs d'informatique en nuage pour avoir accès à leur infrastructure. Sam Altman, PDG d'OpenAI, a déclaré que la formation du GPT-4 avait coûté plus de 100 millions de dollars. Cette augmentation des dépenses, combinée à la baisse continue du coût de l'augmentation de la capacité de calcul résultant de la loi de Moore, a conduit à la formation de modèles d'IA sur d'énormes quantités de calcul.
OpenAI et Anthropic, deux des principales entreprises d'IA, ont chacune levé des milliards auprès d'investisseurs pour payer le calcul qu'elles utilisent pour entraîner les systèmes d'IA, et chacune a conclu des partenariats avec des géants de la technologie aux poches bien garnies - OpenAI avec Microsoft et Anthropic avec Google.
FLOP (floating-point operations) désigne le nombre total d'opérations informatiques utilisées pour entraîner un système d'IA. Le calcul est estimé sur la base des résultats publiés dans la littérature sur l'IA et comporte une certaine incertitude. Epoch s'attend à ce que la plupart de ces estimations soient correctes à un facteur de 2, et à un facteur de 5 pour les modèles récents pour lesquels les chiffres pertinents n'ont pas été divulgués, tels que le GPT-4.
Les systèmes d'IA fonctionnent en construisant des modèles de relations entre les variables de leurs données d'apprentissage, qu'il s'agisse de la probabilité que le mot « maison » apparaisse à côté du mot « courir » ou des modèles de relation entre la séquence génétique et le pliage des protéines, le processus par lequel une protéine prend sa forme en 3D, qui définit ensuite sa fonction.
En général, un plus grand nombre de points de données signifie que les systèmes d'intelligence artificielle disposent de plus d'informations pour construire un modèle précis de la relation entre les variables des données, ce qui améliore les performances. Par exemple, un modèle linguistique alimenté par un plus grand nombre de textes aura un plus grand nombre d'exemples de phrases dans lesquelles le mot « courir » suit le mot « maison » - dans les phrases qui décrivent des matchs de baseball ou des succès éclatants, cette séquence de mots est plus probable.
L'article de recherche original sur le Perceptron Mark I indique qu'il a été entraîné sur seulement six points de données. À titre de comparaison, LlaMa, un grand modèle linguistique développé par des chercheurs de Meta et publié en 2023, a été entraîné sur environ un milliard de points de données, soit une multiplication par plus de 160 millions par rapport à Perceptron Mark I.
Dans le cas de LlaMa, les points de données étaient des textes collectés à partir d'un éventail de sources, dont 67 % de données Common Crawl (Common Crawl est une organisation à but non lucratif qui scrape l'internet et met les données collectées à disposition gratuitement), 4,5 % de GitHub (un service internet utilisé par les développeurs de logiciels) et 4,5 % de Wikipédia.
La taille des données de formation fait référence à la quantité de données utilisées pour former un modèle d'IA, indiquant le nombre d'exemples ou d'instances disponibles pour que le modèle puisse apprendre. Chaque domaine possède une unité d'entrée de points de données spécifique, comme les images pour former les modèles de vision, les mots pour les modèles de langage et les pas de temps pour les modèles de jeux. Cela signifie que les systèmes ne peuvent être comparés directement qu'au sein d'un même domaine.
Les algorithmes - ensembles de règles ou d'instructions qui définissent une séquence d'opérations à effectuer - déterminent la manière dont les systèmes d'IA utilisent la puissance de calcul pour modéliser les relations entre les variables des données qui leur sont fournies. En plus d'entraîner les systèmes d'IA sur de plus grandes quantités de données en utilisant des quantités croissantes de calcul, les développeurs d'IA ont trouvé des moyens d'obtenir plus à partir de moins. Une étude d'Epoch a montré que « tous les neuf mois, l'introduction de meilleurs algorithmes contribue à l'équivalent d'un doublement des budgets de calcul ».
Le progrès algorithmique signifie que moins de calculs et de données sont nécessaires pour atteindre un niveau de performance donné. Quantité de calcul et nombre de points de données nécessaires pour atteindre une précision de 80,9 % lors d'un test de reconnaissance d'images. Système de vision par ordinateur ResNeXt-101 sur le benchmark ImageNet. Le calcul est mesuré en FLOPs (opérations en virgule flottante). Les données sont mesurées en nombre d'images dans l'ensemble d'apprentissage.
Données, calculs, et algorithmes : les moteurs de l'évolution de l'IA
Selon Sevilla, la quantité de calcul que les développeurs d'IA utilisent pour entraîner leurs systèmes devrait continuer à augmenter à son rythme accéléré actuel pendant un certain temps, les entreprises augmentant le montant qu'elles consacrent à chaque système d'IA qu'elles entraînent, et l'efficacité augmentant au fur et à mesure que le prix du calcul continue à diminuer régulièrement. M. Sevilla prévoit que cette évolution se poursuivra jusqu'à ce qu'il ne soit plus rentable de continuer à dépenser de l'argent, lorsque l'augmentation de la quantité de calcul n'améliorera que légèrement les performances. Après cela, la quantité de calcul utilisée continuera d'augmenter, mais à un rythme plus lent, uniquement en raison de la baisse du coût du calcul résultant de la loi de Moore.
Les données qui alimentent les systèmes d'IA modernes, tels que LlaMa, sont extraites de l'Internet. Historiquement, le facteur limitant la quantité de données introduites dans les systèmes d'IA a été la disponibilité d'un nombre suffisant d'ordinateurs pour traiter ces données. Mais l'explosion récente de la quantité de données utilisées pour former les systèmes d'IA a dépassé la production de nouvelles données textuelles sur l'internet, ce qui a conduit les chercheurs d'Epoch à prédire que les développeurs d'IA seront à court de données linguistiques de haute qualité d'ici à 2026.
Les personnes qui développent des systèmes d'IA ont tendance à être moins préoccupées par ce problème. Lors d'une intervention dans le podcast Lunar Society en mars, Ilya Sutskever, scientifique en chef chez OpenAI, a déclaré que « la situation des données est encore assez bonne. Il reste encore beaucoup à faire ». Lors de son passage au podcast Hard Fork en juillet, Dario Amodei a estimé qu' « il y a peut-être 10 % de chances que cette mise à l'échelle soit interrompue en raison de l'incapacité à recueillir suffisamment de données ».
Sevilla est également convaincu que le manque de données n'empêchera pas d'autres améliorations de l'IA, par exemple en trouvant des moyens d'utiliser des données linguistiques de faible qualité, car contrairement au calcul, le manque de données n'a jamais été un goulot d'étranglement pour les progrès de l'IA auparavant. Il s'attend à ce que les développeurs d'IA découvrent un grand nombre d'innovations faciles à mettre en œuvre pour résoudre ce problème.
Selon Sevilla, les progrès algorithmiques continueront probablement à agir comme un amplificateur de la quantité de calcul et de données utilisée pour former les systèmes d'IA. Jusqu'à présent, la plupart des améliorations proviennent d'une utilisation plus efficace du calcul. Epoch a constaté que plus des trois quarts des progrès algorithmiques réalisés par le passé ont été utilisés pour compenser les insuffisances en matière de calcul. Si, à l'avenir, les données deviennent un goulot d'étranglement pour l'apprentissage de l'IA, une plus grande partie des progrès algorithmiques pourrait être axée sur la compensation des insuffisances en matière de données.
Si l'on réunit ces trois éléments, les experts, dont Sevilla, s'attendent à ce que les progrès de l'IA se poursuivent à un rythme effréné au moins pendant les quelques années à venir. Le calcul informatique continuera d'augmenter à mesure que les entreprises dépenseront plus d'argent et que la technologie sous-jacente deviendra moins chère. Les données utiles restantes sur l'internet seront utilisées pour entraîner les modèles d'IA, et les chercheurs continueront à trouver des moyens d'entraîner et de faire fonctionner des systèmes d'IA qui utilisent plus efficacement le calcul et les données. La poursuite de ces tendances décennales explique pourquoi les experts pensent que l'IA continuera à devenir plus performante.
Cette situation inquiète de nombreux experts. S'exprimant lors de l'audition de la commission sénatoriale, Amodei a déclaré que, si les progrès se poursuivent au même rythme, un large éventail de personnes pourrait être en mesure d'accéder à des connaissances scientifiques que même les experts d'aujourd'hui ne possèdent pas d'ici deux à trois ans grâce aux systèmes d'intelligence artificielle. Cela pourrait augmenter le nombre de personnes capables de « faire des ravages », a-t-il déclaré. « Je crains en particulier que les systèmes d'IA ne soient utilisés à grande échelle dans les domaines de la cybersécurité, de la technologie nucléaire, de la chimie et surtout de la biologie. »
IA omnipotente : les ombres d'une supériorité technologique en question
Le constat selon lequel l'intelligence artificielle (IA) surpasse l'homme dans plusieurs domaines, tel que présenté par l'étude de l'université de Californie à Berkeley, est indéniable et reflète l'évolution rapide de cette technologie. Cependant, cette avancée soulève des préoccupations légitimes qui méritent une analyse critique.
D'abord, la mention des domaines où l'IA surpasse l'homme, tels que la reconnaissance de l'écriture manuscrite ou la compréhension du langage, évoque des aspects spécifiques de tâches plutôt que des compétences intellectuelles globales. Il est crucial de noter que bien que l'IA excelle dans ces domaines particuliers, elle ne possède pas la compréhension holistique, la créativité, ou la conscience propre à l'humain.
En ce qui concerne les implications sociétales, l'automatisation accrue et les changements dans l'organisation du travail sont inévitables avec le progrès de l'IA. Cependant, le texte souligne également les avantages potentiels dans des domaines tels que la médecine et l'éducation. Néanmoins, les risques associés à la manipulation d'informations, la création d'armes autonomes, et d'autres applications potentiellement néfastes de l'IA soulignent la nécessité d'une régulation et d'une éthique strictes.
La question de savoir si l'IA pourrait dépasser l'intelligence humaine est l'un des débats centraux. Bien que certains experts redoutent une possible domination mondiale par l'IA, d'autres croient en son maintien sous le contrôle humain. Il est essentiel de souligner que la définition même de l'intelligence est complexe et que l'IA, malgré ses succès dans des domaines spécifiques, ne possède pas la compréhension émotionnelle, la conscience, ou l'éthique inhérentes à l'humanité.
Sources : University of California at Berkeley, United States Senate Committee on the Judiciary, ContextualAI
Et vous ?
Les conclusions de l'étude de l'université de Californie à Berkeley, affirmant que l'IA a dépassé l'homme dans diverses tâches, sont-elles pertinentes ?
Devrions-nous remettre en question la course à la supériorité de l'IA au détriment de notre autonomie ?
Voir aussi :
L'IA pourrait surpasser l'homme dans toutes les tâches d'ici 2047, selon une enquête auprès de 2,778 chercheurs
Une IA peut-elle devenir son propre PDG après avoir créé une entreprise ? C'est ce que pense le cofondateur de Google DeepMind
Un syndicat de musiciens de Hollywood menace de déclencher une grève générale si ses membres n'obtiennent pas des protections contre l'IA et des droits résiduels pour le streaming