Sören Mindermann über das Problem der Ausrichtung Künstlicher Intelligenz
Manage episode 383325187 series 3474305
Sören Mindermann erklärt, wie moderne KI-Systeme funktionieren, wie Fehlausrichtungen dieser KI-Systeme (engl.: AI misalignment) entstehen können und welche Ansätze es gibt, um dem vorzubeugen.
Für ein Transkript des Gesprächs mit weiterführenden Ressourcen siehe: https://prioritaeten-podcast.de/episode/soren-mindermann-uber-das-problem-der-ausrichtung-kunstlicher-intelligenz
Chapitres
1. Einführung ins Thema KI-Ausrichtung (00:00:00)
2. Effektivität nicht-pharmazeutischer Covid-Gegenmaßnahmen (00:02:45)
3. Was ist maschinelles Lernen? Wie funktioniert es? (00:04:11)
4. Was bedeutet (Fehl-)ausrichtung? (00:10:34)
5. Selbstüberwachtes und nicht-selbstüberwachtes Lernen (00:12:17)
6. Fehlspezifikationen (00:16:11)
7. Historische Betrachtung zu KI-Ausrichtung (00:18:44)
8. Rekursive Selbstverbesserung (00:21:27)
9. Instrumentelle Konvergenz und Orthogonalitätsthese (00:24:28)
10. Wie intelligent können Maschinen werden? Bedrohung selbst durch nicht-superintelligente Systeme (00:28:43)
11. Situationsbewusstes Belohnungs-Hacking (00:34:39)
12. Intern repräsentierte Ziele (00:43:23)
13. Machtstrebendes Verhalten (00:52:40)
14. Hinterlist und falsche Generalisierungen (01:03:14)
15. Ansätze für die Ausrichtung von KI (01:06:53)
16. Outro (01:16:52)
10 episodes