Sûrs d’eux, mais faux : nous avons testé 17 modèles d’IA sur des questions qu’un collégien peut résoudre
L’article évalue 17 grands modèles de langage open source à l’aide de six questions scolaires très simples. Six modèles se sont trompés au moins une fois, et deux ont échoué aux six questions. Plus inquiétant encore, les mauvaises réponses paraissaient aussi fluides et assurées que les bonnes, révélant de sérieuses failles de fiabilité et de raisonnement.