Die Anzahl an fehlerbehafteten Fachartikeln steigt rasant. Ein Grund dafür ist weniger die künstliche Intelligenz, sondern ein Wissenschaftssystem, das die Menge der Publikationen über deren Qualität stellt. Eine Reform ist unumgänglich.
Ein Artikel über Patientenüberwachung auf Intensivstationen blieb zwei Jahre lang online, bevor Unstimmigkeiten in den Quellenangaben festgestellt wurden: Zehn von fünfzehn Studien im Literaturverzeichnis waren erfunden. Ein anderes Magazin zog einen Artikel zurück, nachdem Forscher groteske Illustrationen darin entdeckt hatten und ihn online kritisierten.
In beiden Fällen trugen KI-basierte Fehler dazu bei, dass fehlerhafte Referenzen und bizarre Laborabbildungen erstellt wurden. Trotz strenger Begutachtungsverfahren erschienen die Artikel in Fachjournalen.
Das Wissenschaftssystem zeigt Schwächen: Die Rücknahme von Studien aufgrund von Fehlern oder Manipulationen nimmt zu – von einigen Dutzend pro Monat vor fünf Jahren bis hin zu etwa 500 heute. Viele fehlerhafte Arbeiten bleiben jedoch unentdeckt.
KI-Tools, die im wissenschaftlichen Schreiben eingesetzt werden, verschärfen das Problem. Die eigentliche Ursache liegt in einem Bewertungssystem, das auf Publikationszahlen statt auf Sorgfalt setzt. Forscher produzieren zu viele Studien, von denen ein großer Teil den Qualitätsstandards nicht genügt.
Diese mangelhaften Veröffentlichungen beeinträchtigen die Forschung und verzerren den wissenschaftlichen Fortschritt. Wichtige Entscheidungen in Medizin, Wirtschaft und Politik basieren auf wissenschaftlicher Evidenz, was das Problem verschärft.
Warum können Fachzeitschriften ihre Kontrollfunktion nicht effektiver ausüben? Sie prüfen eingereichte Studien vor der Veröffentlichung. Im Peer-Review-Prozess beurteilen unabhängige Wissenschaftler die Artikel, doch oft fehlt ihnen die Zeit und Expertise.
Während die Anzahl der Forscher leicht gestiegen ist, hat sich die Zahl der Publikationen stark erhöht. Es gibt zu wenige qualifizierte Reviewer für die wachsende Flut an Fachartikeln. Dies führt zur Annahme schlechter und Ablehnung guter Arbeiten.
Das Streben nach mehr Publikationen als akademische Währung – “Publish or perish” – treibt Forscher dazu, ihre Veröffentlichungsliste zu verlängern. KI-Tools können dabei helfen, aber auch mangelhafte oder gefälschte Artikel zu produzieren.
Paper-Mills erstellen gefälschte Studien für Wissenschaftler, oft mit KI-generierten Inhalten, was zu absurd erscheinenden Artikeln führt. Diese zunehmende Anzahl an Pseudoartikeln ist ein Problem.
Spezialausgaben unterliegen oft weniger strengem Peer-Review und sind daher gefährdet. Auch etablierte Journalen fallen auf Fälschungen herein, wie eine Überprüfung von 608 Studien zeigte, bei denen rund 40 Prozent problematische Bilder enthielten.
Wissenschaftsverlage haben Research-Integrity-Teams eingerichtet, um gefälschte Arbeiten zu identifizieren. Dennoch werden oft nur offensichtliche Betrugsversuche aufgedeckt; raffinierte Fälschungen mit KI bleiben verborgen.
Neben der Ahndung von Betrug sind weitere Systemänderungen nötig: Das Verhältnis zwischen Studien und Reviewern muss ausbalanciert werden, Anreize sollten auf Qualität statt Menge setzen. Die Dora-Deklaration (2012) und die Stockholm-Deklaration (letztes Jahr) forderten solche Reformen.
Einige Institutionen agieren bereits: Der Schweizerische Nationalfonds hat 2022 den narrativen Lebenslauf eingeführt. Zeitschriften könnten den Peer-Review-Prozess öffnen, um die Sichtbarkeit und Attraktivität von Begutachtungen zu erhöhen.
Solche Maßnahmen müssen flächendeckend umgesetzt werden. Wissenschaftsverlage, Universitäten und Förderer sind gefordert, ansonsten wird der Anteil mangelhafter Studien weiter steigen und das gesellschaftliche Wissen vermüllen.