Wie trainiert man eine KI?
Damit eine Maschine lernen kann, muss sie zuerst ganz viel üben, indem sie viele Beispiele zu sehen bekommt. Dieser Vorgang kann auf verschiedene Arten geschehen:
- Überwachtes Lernen (Supervised Learning)
- Unüberwachtes Lernen (Unsupervised Learning)
- Bestärkendes Lernen (Reinforcement Learning)
1. Überwachtes Lernen (Supervised Learning)
Beim überwachten Lernen werden einer Maschine beschriftete Daten vorgelegt: Man zeigt ihr (beispielsweise einer Bilderkennungs-KI) ganz viele Bilder mit beigefügten Informationen. Diese geben an, was auf jedem einzelnen Bild zu sehen ist.
Die Maschine lernt, zu welcher Kategorie die einzelnen Bilder gehören und merkt sich die Muster hinter den Kategorien. Hierfür braucht man idealerweise eine sehr große Menge an Daten. Diese Phase wird „Trainingsphase” genannt.
Die KI hat dazugelernt! Wenn man der Maschine nun neue, nicht beschriftete Bilder zeigt, kann sie anhand der zuvor gelernten Muster erkennen, in welche Kategorie das Bild gehört.
Die Maschine erkennt: „Das ist eine Blume!” Beim unüberwachten Lernen werden einer Maschine ganz viele nicht gelabelte Daten vorgelegt. Im Gegensatz zum Überwachten Lernen, weiß die Maschine also nicht, was auf den einzelnen Bildern zu sehen ist. Sie bekommt auch keine spezifischen Zielvorgaben wie z. B. dass sie zwischen Bäumen und Blumen unterscheiden soll. Stattdessen muss sie eigenständig Muster und Beziehungen in den Daten erkennen. In unserem Beispiel bekommt die KI folgende Bilder von pinken und lila Blumen für den Lernprozess vorgelegt: Nun versucht die Maschine, Muster und Ähnlichkeiten in der Mengen an Daten zu finden. Zum Beispiel könnte die Maschine feststellen, dass viele der Bilder ähnliche Farben und Formen haben. Dabei weiß sie jedoch nicht, dass es sich bei den Bildern um Blumen handelt – sie erkennt lediglich die sich wiederholenden Merkmale. Klickt auf das nächste Tab, um euch die Antwort anzusehen!
Die Maschine gruppiert anschließend die Bilder mit ähnlichen Mustern in Cluster (Kategorien). Zum Beispiel: Lila und Pink. Um die von einer Maschine identifizierten Kategorien sinnvoll interpretieren und benennen zu können, ist oft eine menschliche Überprüfung erforderlich. Bei dieser Form des Maschinellen Lernens lernt die KI durch Belohnungen und Bestrafungen. Am Anfang weiß die KI nichts und handelt einfach irgendwie. Wenn sie eine richtige Entscheidung trifft, wird ihr gesagt, dass sie dieses Verhalten wiederholen soll. Bei einer falschen Entscheidung wird ihr gesagt, dass sie dieses Verhalten nicht mehr machen soll. Was „richtig” und was „falsch” ist, wird in diesem Fall jedoch ganz allein von den KI-Entwickler*innen entschieden. Je öfter eine Entscheidung belohnt wurde, desto wahrscheinlicher wird die Maschine diese Entscheidung in ähnlichen Situationen treffen. Dieser Lernprozess wiederholt sich in immer neuen Situationen, bis die KI eine effektive Strategie entwickelt hat und flexibel auf verschiedene Szenarien reagieren kann.
Ein Beispiel für Bestärkendes Lernen ist das KI-Training eines digitalen Spiels: Der Computer lernt in vielen Versuchen, wie er ein Spiel möglichst schnell durchspielen kann. Im folgenden Video wird das am Beispiel eines alten Pokémon-Spiels dargestellt. Es wird deutlich, dass sehr viele Versuche notwendig sind, um in diesem Fall die beste Spielstrategie zu finden und dass die Verbesserung der Spielstrategie stark von der Qualität des Belohnungssystems abhängt. https://digital.tueftellab.de/course/view.php?id=134 Tic Tac Toe: Im digitalen KI-Labor der Christian-Albrechts-Universität zu Kiel könnt ihr Tic Tac Toe gegen einen Computer spielen! Beobachtet, wie der Computer mit jedem Spielzug dazulernt und seine Strategie verbessert, während er gegen euch spielt!
„Das ist ein Baum”
„Das ist eine Blume”
2. Unüberwachtes Lernen (Unsupervised Learning)
3. Bestärkendes Lernen (Reinforcement Learning)
Video: Training AI to Play Pokemon with Reinforcement Learning
In diesem Video werden die verschiedenen Ansätze der KI zur Lösung des Spiels gezeigt – jedes Männchen steht dabei für einen einzelnen Spieldurchlauf.
Exkurs
Bestärkendes Lernen (Reinforcement Learning) spielend entdecken.
NIM-Spiel: Das NIM-Spiel ist ein Brettspiel, mit dem ihr spielend erfahren könnt, wie ein Computer lernt. Besucht unser Tüftel Tutorial, um mehr über das NIM-Spiel zu erfahren.