Une intelligence artificielle (IA) élaborée par Google, baptisée Articulate Medical Intelligence Explorer (AMIE), a démontré des performances comparables, voire supérieures, à celles des médecins humains dans le diagnostic des affections respiratoires et cardiovasculaires. Ce chatbot, fondé sur un grand modèle de langage, a été évalué au cours d'entretiens médicaux simulés avec des acteurs formés, surpassant les médecins en termes de précision diagnostique et d'empathie. Bien que l'IA ne soit pas encore prête pour une utilisation clinique, les chercheurs estiment qu'elle pourrait contribuer à rendre les soins de santé plus accessibles. Toutefois, des précautions sont nécessaires, notamment pour évaluer les éventuels biais et garantir l'équité entre différentes populations. La protection de la vie privée des utilisateurs de chatbots est également soulignée comme une considération cruciale.
Au cœur de la médecine réside le dialogue entre le médecin et le patient, où une anamnèse habile ouvre la voie à un diagnostic précis, une gestion efficace et une confiance durable. Les systèmes d'intelligence artificielle (IA) capables de dialoguer pour un diagnostic pourraient améliorer l'accessibilité, la cohérence et la qualité des soins. Cependant, imiter l'expertise des cliniciens reste un défi majeur.
AMIE, un système d'intelligence artificielle basé sur un grand modèle de langage (LLM) optimisé pour le dialogue diagnostique, utilise un environnement simulé basé sur l'auto-jeu avec des mécanismes de retour d'information automatisés pour étendre l'apprentissage à diverses maladies, spécialités et contextes. L'outil d'IA a démontré une précision supérieure à celle des médecins de premier recours certifiés dans le diagnostic des affections respiratoires et cardiovasculaires, entre autres.
L'évolution des grands modeles de langage : au-dela des mots, vers des dialogues diagnostiques en sante
Un grand modèle de langage (LLM) est un algorithme d'apprentissage profond qui peut effectuer une variété de tâches de traitement du langage naturel (NLP). Les grands modèles de langage utilisent des modèles de transformation et sont formés à l'aide d'ensembles de données massifs - d'où le terme « grand ». Cela leur permet de reconnaître, traduire, prédire ou générer du texte ou d'autres contenus.
Les grands modèles linguistiques sont également appelés réseaux neuronaux (RN), qui sont des systèmes informatiques inspirés du cerveau humain. Ces réseaux neuronaux fonctionnent à l'aide d'un réseau de nœuds en couches, à l'instar des neurones. Outre l'apprentissage des langues humaines pour les applications d'intelligence artificielle, les grands modèles de langage peuvent également être entraînés à effectuer diverses tâches telles que la compréhension des structures protéiques, l'écriture de codes logiciels, etc.
À l'instar du cerveau humain, les grands modèles de langage doivent être pré-entraînés puis affinés afin de pouvoir résoudre des problèmes de classification de textes et de réponse à des questions. Leurs capacités de résolution de problèmes peuvent être appliquées à des domaines tels que la santé. Les grands modèles de langage ont également un grand nombre de paramètres, qui sont comme des mémoires que le modèle recueille au fur et à mesure qu'il apprend lors de la formation. Ces paramètres constituent la banque de connaissances du modèle.
Les progrès récents des grands modèles de langage (LLM) en dehors du domaine médical ont montré qu'ils peuvent planifier, raisonner et utiliser un contexte pertinent pour tenir des conversations riches. Cependant, de nombreux aspects d'un bon dialogue diagnostique sont propres au domaine médical. Un clinicien efficace établit un « historique clinique » complet et pose des questions intelligentes qui aident à établir un diagnostic différentiel.
Il dispose de compétences considérables pour établir une relation efficace, fournir des informations claires, prendre des décisions conjointes et éclairées avec le patient, réagir avec empathie à ses émotions et le soutenir dans les étapes suivantes des soins. Bien que les LLM puissent effectuer avec précision des tâches telles que la synthèse médicale ou la réponse à des questions médicales, peu de travaux ont été consacrés au développement de ce type de capacités de diagnostic conversationnel.
En début d'année dernière, des chercheurs de Google et de DeepMind ont présenté un grand modèle de langage, appelé Med-PaLM, destiné à répondre à des questions médicales non spécialisées. Med-PaLM, basé sur le modèle de langage PaLM de Google avec 540 milliards de paramètres, a montré des performances équivalentes, voire supérieures, à celles des médecins humains dans le diagnostic des affections respiratoires et cardiovasculaires.
L'équipe a utilisé une nouvelle méthode appelée "Instruction Prompt Tuning", combinant des invites souples, des données médicales limitées et des invites rédigées par des humains. Med-PaLM a obtenu des résultats comparables aux professionnels dans la plupart des tests, surpassant notamment Flan-PaLM. Les performances du modèle ont été évaluées sur MultiMedQA, un benchmark de questions-réponses médicales, et ont montré des résultats encourageants, bien que l'IA ne soit pas encore prête pour une utilisation clinique.
Le modèle a également présenté moins de réponses potentiellement dangereuses par rapport à Flan-PaLM. Le rapport suggère que les modèles de langage, tels que Med-PaLM, pourraient jouer un rôle émergent dans le domaine médical, mais souligne l'importance d'une approche prudente pour garantir la fiabilité et la sécurité des réponses fournies par l'IA.
Par rapport aux médecins humains, AMIE a réussi à acquérir une quantité similaire d'informations au cours des entretiens médicaux et a obtenu un meilleur classement en matière d'empathie. Alan Karthikesalingam, chercheur clinique chez Google Health à Londres et coauteur de l'étude, souligne qu'il s'agit de la première conception optimale d'un système d'IA conversationnel dédié au dialogue diagnostique et à la prise en compte des antécédents cliniques.
Bien que le chatbot soit encore à un stade expérimental et n'ait pas été testé sur des personnes présentant de réels problèmes de santé, les auteurs estiment qu'il pourrait éventuellement contribuer à la démocratisation des soins de santé. Cependant, ils insistent sur le fait qu'il ne devrait pas remplacer les interactions avec les médecins, car la médecine va au-delà de la collecte d'informations, impliquant des relations humaines, comme le souligne le Dr Adam Rodman de la Harvard Medical School.
ChatGPT vs. Médecins : une étude révèle des préférences surprenantes
Une autre étude, publiée dans la revue JAMA Internal Medicine, met en avant que dans 79 % des cas, un panel de professionnels de la santé a préféré les réponses de ChatGPT à des questions médicales par rapport à celles d'un médecin. Ces résultats suggèrent que les assistants d'intelligence artificielle, tels que ChatGPT, pourraient jouer un...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.