April 14, 2026 14:30 - 16:00
MPI-CBG - Auditorium
Paulo von Petersen: Computern das Denken beibringen - warum große Sprachmodelle so gut funktionieren
Maschinelles Lernen und künstliche Intelligenz (KI) sind heute allgegenwärtig, doch warum diese Anwendungen funktionieren ist eine strittige Fragestellung. Ein vielversprechender Erklärungsansatz aus der Informationstheorie besagt: KI-Systeme wie ChatGPT lernen durch Komprimierung von Daten. Ähnlich wie ein Student zum Lernen umfangreiche Vorlesungsnotizen auf wenigen Seiten zusammenfasst, extrahiert der Computer durch Verdichtung riesiger Textmengen die Essenz von Sprache und lernt so, selbst Sprache zu generieren.