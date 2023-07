Le chatbot médical d’ intelligence artificielle de Google a réussi l’examen de médecine aux États-Unis, mais ses résultats restent en deçà de ceux des humains, indique une étude publiée mercredi dans «Nature». L’année dernière, la sortie de ChatGPT --dont le développeur OpenAI est soutenu par le rival de Google, Microsoft-- a lancé une course entre les géants de la technologie dans le domaine en plein essor de l’IA.

Résultats «encourageants»

Google affirme que Med-PaLM a été le premier grand modèle de langage, une technique d’IA entraînée sur de grandes quantités de textes produits par l’homme, à réussir l’USMLE (US Medical Licensing Examination). La réussite de cet examen permet d’exercer la médecine aux États-Unis. Pour y parvenir, il faut obtenir un score de 60% environ. En février, une étude avait révélé que ChatGPT avait obtenu des résultats plutôt satisfaisants à l’examen.

Dans une nouvelle étude, évaluée par les pairs et publiée mercredi dans la revue Nature, les chercheurs de Google ont déclaré que Med-PaLM avait atteint 67,6% en répondant aux questions à choix multiples de style USMLE. Ces résultats sont «encourageants, mais restent inférieurs à ceux des humains», indique l’étude.

Réduire les «hallucinations»

Pour identifier et réduire ce que l’on appelle les «hallucinations» --le mot qui désigne une réponse manifestement fausse proposée par un modèle d’IA--, Google a indiqué avoir développé une nouvelle référence d’évaluation. Karan Singhal, chercheur chez Google et auteur principal de la nouvelle étude, a expliqué à l’AFP que son équipe avait testé une version plus récente du modèle.