Das Geheimnis des Deep Learning entschlüsseln: so funktioniert es
13. Februar 2024
|Heutzutage redet so ziemlich jeder über künstliche Intelligenz: Ist sie gut? Ist sie schlecht? Wird sie neue Arbeitsplätze schaffen oder eher welche vernichten? Wird sich dadurch alles ändern?
Künstliche Intelligenz – oder kurz KI – ist von einer gewissen geheimnisvollen Atmosphäre umgeben: Wie kann sie eigentlich all die Dinge tun, die sie tut? Und woher weiß sie, wie sie diese Dinge tun muss?
Dabei ist KI überhaupt nicht geheimnisvoll. Sie ist eher vergleichbar mit einem fünfjährigen Kind, das die Welt erkunden lernt.
Werfen wir einen genaueren Blick auf das Deep Learning, also die Art von KI, die derzeit am häufigsten eingesetzt wird.
Deep Learning verstehen
Wenn ein Kind fünf Jahre alt ist, hat es bereits viele Informationen verinnerlicht. Doch wie entwickelt eine Fünfjährige (nehmen wir mal an, sie heißt Anna) eine Vorstellung davon, wie ein Auto aussieht?
Vermutlich hat sie schon einmal ein Kinderbuch mit einem Bild von einem Auto vorgelesen bekommen. Wahrscheinlich ist Anna selbst schon mit dem Familienauto zu Verwandten oder zum Arzt gefahren worden. Möglicherweise hat sie im Kinderfernsehen eine Sendung mit einem Auto gesehen.
Alle diese Datenpunkte haben in ihrem Gehirn einen Signalweg gebildet, bei dem ein Auto mit einem Ding auf vier Rädern gleichgesetzt wird. Jeder dieser Punkte war Teil des Lernstoffs dieser Fünfjährigen.
Ein solcher Lernprozess verläuft nicht fehlerfrei! Angenommen, man hätte einen Satz Karten, auf dem auf einer Seite ein Objekt abgebildet ist (Hund, Auto, Flugzeug, Haus) und auf der anderen Seite der jeweilige Begriff. Beim ersten Durchgang des Kartensatzes sagt Anna möglicherweise “Katze!”, wenn sie die Abbildung des Hundes sieht. Wurde sie dann einmal verbessert, wird Anna beim nächsten Durchgang wahrscheinlich das richtige Wort sagen.
Das entspricht fast exakt der Art und Weise, wie ein KI-Modell Dinge lernt.
Das menschliche Gehirn ist ein neuronales Netzwerk mit biologischen Neuronen. Die KI hat ebenfalls ein neuronales Netzwerk, das ganz ähnlich aufgebaut ist.
So funktionieren neuronale KI-Netzwerke
Die Funktionsweise eines neuronalen KI-Netzwerks lässt sich mit einer Anordnung von Punkten in mehreren Zeilen und Spalten veranschaulichen (wir nennen sie verborgene Schichten). Jeder Punkt ist mit anderen verknüpft und verfügt über begrenzte mathematische Fähigkeiten – er kann jede Eingabe mit einer Zahl multiplizieren sowie zu jeder Eingabe eine Zahl addieren oder von ihr subtrahieren. Man kann sich diese Punkte als Neuronen vorstellen, die aus Software bestehen.
Nun soll die KI ein Objekt identifizieren, z. B. ein Flugzeug.
Zu diesem Zeitpunkt besitzt das neuronale KI-Netzwerkmodell noch keinerlei Informationen. Jeder Knotenpunkt enthält nur eine Reihe von Zufallszahlen, vergleichbar einem neugeborenen Baby, das noch keinerlei Input erhalten hat. In Anbetracht dessen, dass unser Modell nur Zufallszahlen enthält, ist es nahezu garantiert, dass es falsch antwortet.
Wissen Sie noch, wie die kleine Anna “Katze” sagte, obwohl die richtige Antwort “Hund” war? Wir haben sie daraufhin verbessert. Machen wir also dasselbe mit der KI und senden dem Netzwerk eine entsprechende korrigierte Rückmeldung. Die Berichtigung führt dazu, dass sich die mathematischen Daten an allen Knotenpunkten leicht verändern: weg von der falschen Antwort und hin zur richtigen Antwort (das nennt sich Rückkopplung bzw. Backpropagation):
Um nun das KI-Modell in unserem Beispiel zu trainieren, müssen wir viele Fotos von Hunden, Autos, Flugzeugen und Häusern eingeben, und zwar millionenfach. Das bedeutet, der Lernstoff muss sehr umfangreich sein, also werden sehr viele, korrekt gekennzeichnete Abbildungen von Hunden, Flugzeugen oder anderen Dingen benötigt, mit denen die KI trainiert werden soll.
Ohne ein entsprechend hochwertiges Lernset gibt es keine Chance, ein brauchbares KI-Modell zu entwickeln.
Mit einer guten Datengrundlage als Lernstoff und dank der technologischen Weiterentwicklung (bei den Chips aus dem Bereich der Grafikprozessoren oder kurz GPU) lässt sich in kurzer Zeit ein KI-Modell entwickeln, das in der Lage ist, ein Bild, das es noch nie zuvor gesehen hat, korrekt als Hund, Auto, Flugzeug oder Haus zu erkennen!
Und das kann es ebenso gut, wie ein Mensch es kann.
Wobei kann KI behilflich sein?
Natürlich ließen sich neue Modelle trainieren, mit denen man Krebsarten erkennen, Kfz-Probleme diagnostizieren, Vorschläge für weitere Amazon-Einkäufe unterbreiten oder zahlreiche andere Probleme lösen könnte, die für uns Menschen wichtig sein könnten.
Zwar werden sich neuronale Netze im Laufe der Zeit verbessern, aber Tatsache ist: Künstliche Intelligenz funktioniert nur mit einer entsprechend großen Trainingsmenge. Wollen Sie beispielsweise ein Modell trainieren, das die englische Sprache versteht, dann sollten Sie dazu besser Lerndaten in der Größenordnung der gesamten Wikipedia heranziehen!
Die KI ist sehr gut darin, (manchmal sehr subtile) Muster in Trainingsdaten zu erkennen. So gibt es beispielsweise ein KI-Modell, das mithilfe von Präparaten von Lungenkrebs trainiert wurde. Es kann erkennen, ob vorliegendes Lungengewebe mit Krebs befallen ist oder nicht, und falls ja, um welche Art von Krebs es sich handelt. Das Modell liegt in 96 % der Fälle richtig, was ungefähr der Trefferquote führender Onkologen entspricht. In manchen Fällen entdeckt es sogar Strukturen auf den Objektträgern, die so fein sind, dass Menschen sie nicht sehen können.
Fazit: KI-Modelle sind nur so gut wie die Datensätze, anhand derer sie entwickelt werden.
So funktioniert das Deep Learning. Nicht wirklich geheimnisvoll, oder?