Damit eine Maschine lernen kann, muss sie zuerst ganz viel üben, indem sie viele Beispiele zu sehen bekommt. Dieser Vorgang kann auf verschiedene Arten geschehen:

  1. Überwachtes Lernen (Supervised Learning)
  2. Unüberwachtes Lernen (Unsupervised Learning)
  3. Bestärkendes Lernen (Reinforcement Learning)

Illustration: Hand zeigt auf eines von zwei Fotos, Roboter schaut zu 

1. Überwachtes Lernen (Supervised Learning)

Beim überwachten Lernen werden einer Maschine beschriftete Daten vorgelegt: Man zeigt ihr (beispielsweise einer Bilderkennungs-KI) ganz viele Bilder mit beigefügten Informationen. Diese geben an, was auf jedem einzelnen Bild zu sehen ist.

Illustration: Foto Baum
„Das ist ein Baum”
Illustration: Foto Blume
„Das ist eine Blume”

Die Maschine lernt, zu welcher Kategorie die einzelnen Bilder gehören und merkt sich die Muster hinter den Kategorien. Hierfür braucht man idealerweise eine sehr große Menge an Daten. Diese Phase wird „Trainingsphase” genannt.

Illustration: Viele Fotos von Bäumen
Illustration: Viele Fotos von Blumen

Die KI hat dazugelernt! Wenn man der Maschine nun neue, nicht beschriftete Bilder zeigt, kann sie anhand der zuvor gelernten Muster erkennen, in welche Kategorie das Bild gehört.

Illustration: Foto einer pinken Blume

Die Maschine erkennt: „Das ist eine Blume!”

Illustration: Roboter sitzt an einem Laptop 

2. Unüberwachtes Lernen (Unsupervised Learning)

Beim unüberwachten Lernen werden einer Maschine ganz viele nicht gelabelte Daten vorgelegt. Im Gegensatz zum Überwachten Lernen, weiß die Maschine also nicht, was auf den einzelnen Bildern zu sehen ist. 

Sie bekommt auch keine spezifischen Zielvorgaben wie z. B. dass sie zwischen Bäumen und Blumen unterscheiden soll. Stattdessen muss sie eigenständig Muster und Beziehungen in den Daten erkennen.

In unserem Beispiel bekommt die KI folgende Bilder von pinken und lila Blumen für den Lernprozess vorgelegt:

15 verschiedene Illustrationen von lilanen und pinken Blumen

Nun versucht die Maschine, Muster und Ähnlichkeiten in der Mengen an Daten zu finden. Zum Beispiel könnte die Maschine feststellen, dass viele der Bilder ähnliche Farben und Formen haben. Dabei weiß sie jedoch nicht, dass es sich bei den Bildern um Blumen handelt – sie erkennt lediglich die sich wiederholenden Merkmale.

Welche wiederkehrenden Muster erkennt ihr in den Bildern? 

Klickt auf das nächste Tab, um euch die Antwort anzusehen!

Die Bilder weisen verschiedene Ähnlichkeiten auf. Zum Beispiel diese hier:

  • Viele der Bilder haben einen Kreis in der Mitte und länglich-runde Blütenblätter.

    Zwei graue Formen: Ein Blütenblatt und ein Kreis

  • Die Objekte zeigen hauptsächlich die Farben Lila und Pink.

    Vier Farbige Rechtecke: Pink, helles Pink, Lila, helles Lila

Die Maschine gruppiert anschließend die Bilder mit ähnlichen Mustern in Cluster (Kategorien). Zum Beispiel: Lila und Pink. Um die von einer Maschine identifizierten Kategorien sinnvoll interpretieren und benennen zu können, ist oft eine menschliche Überprüfung erforderlich.

Illustration: Roboter sitzt vor einem richtig gelösten Tic-Tac-Toe Spiel 

3. Bestärkendes Lernen (Reinforcement Learning)

Bei dieser Form des Maschinellen Lernens lernt die KI durch Belohnungen und Bestrafungen.

Am Anfang weiß die KI nichts und handelt einfach irgendwie. Wenn sie eine richtige Entscheidung trifft, wird ihr gesagt, dass sie dieses Verhalten wiederholen soll. Bei einer falschen Entscheidung wird ihr gesagt, dass sie dieses Verhalten nicht mehr machen soll. 

Was „richtig” und was „falsch” ist, wird in diesem Fall jedoch ganz allein von den KI-Entwickler*innen entschieden.

Je öfter eine Entscheidung belohnt wurde, desto wahrscheinlicher wird die Maschine diese Entscheidung in ähnlichen Situationen treffen. Dieser Lernprozess wiederholt sich in immer neuen Situationen, bis die KI eine effektive Strategie entwickelt hat und flexibel auf verschiedene Szenarien reagieren kann.


Video: Training AI to Play Pokemon with Reinforcement Learning

Ein Beispiel für Bestärkendes Lernen ist das KI-Training eines digitalen Spiels: Der Computer lernt in vielen Versuchen, wie er ein Spiel möglichst schnell durchspielen kann. Im folgenden Video wird das am Beispiel eines alten Pokémon-Spiels dargestellt. 



In diesem Video werden die verschiedenen Ansätze der KI zur Lösung des Spiels gezeigt – jedes Männchen steht dabei für einen einzelnen Spieldurchlauf.

Es wird deutlich, dass sehr viele Versuche notwendig sind, um in diesem Fall die beste Spielstrategie zu finden und dass die Verbesserung der Spielstrategie stark von der Qualität des Belohnungssystems abhängt.


Exkurs

Bestärkendes Lernen (Reinforcement Learning) spielend entdecken.


NIM-Spiel:
Das NIM-Spiel ist ein Brettspiel, mit dem ihr spielend erfahren könnt, wie ein Computer lernt. Besucht unser Tüftel Tutorial, um mehr über das NIM-Spiel zu erfahren.

 https://digital.tueftellab.de/course/view.php?id=134

Tic Tac Toe: Im digitalen KI-Labor der Christian-Albrechts-Universität zu Kiel könnt ihr Tic Tac Toe gegen einen Computer spielen! Beobachtet, wie der Computer mit jedem Spielzug dazulernt und seine Strategie verbessert, während er gegen euch spielt!

https://progly.informatik.uni-kiel.de/ki-labor/tictactoe