Selbstsicher und falsch: Wir haben 17 KI-Modelle mit Fragen getestet, die ein Mittelschüler lösen kann
Der Artikel testet 17 Open-Source-Sprachmodelle mit sechs sehr einfachen Schulfragen. Sechs Modelle beantworteten mindestens eine Frage falsch, zwei scheiterten sogar an allen sechs. Besonders problematisch ist, dass die falschen Antworten genauso flüssig und überzeugend wirkten wie die richtigen – ein deutliches Warnsignal für Schwächen bei Zuverlässigkeit und logischem Denken.