Forschung · 2026-06-23 · 1 Min. Preprint, nicht peer-reviewed
LASSO mit eingebautem Lehrbuch
Ein Preprint aus Houston rüstet die statistische Variablenauswahl mit kuratiertem Vorwissen aus und sagt damit Suizidgedanken bei bipolaren Jugendlichen schärfer voraus als der Standardansatz.
Klassische Vorhersagemodelle in der Psychiatrie wählen ihre Prädiktoren rein datengetrieben und produzieren in kleinen Stichproben instabile, klinisch schwer lesbare Variablensets. Das noch nicht begutachtete Preprint auf medRxiv schlägt einen Umweg vor: Vierzig höherrangige Evidenzdokumente zu Suizidalität werden indexiert, ein offenes Sprachmodell vergibt nach festem Rubrum Strafgewichte für jede der zwanzig Kandidatenvariablen, und diese Gewichte fließen in ein gewichtetes LASSO. Getestet an 136 Jugendlichen aus dem Greater Houston Area Bipolar Registry, erreichte das evidenzgeführte Modell für Suizidideation eine AUROC von 0,768 bei ausbalancierter Sensitivität und Spezifität um 0,76, während die evidenzfreie Variante zurückblieb. Auffällig ist weniger die Zahl als die Bauweise, denn der LLM-Beitrag liegt nicht in der Vorhersage selbst, sondern davor, in der Gewichtung der Hypothese. Das verschiebt die Debatte um KI in der Klinik von der Black-Box-Prognose hin zur prüfbaren Vorab-Annahme.
Wer das Vorwissen ins Modell hineinschreibt, muss es auch verantworten. Die Strafe für jede Variable wird zur dokumentierten Entscheidung, nicht zum statistischen Zufall.
Quelle: medRxiv Psychiatry