Unter der künstlichen Intelligenz können sich mittlerweile viele Menschen etwas vorstellen. Sie verändert unseren Alltag, unser Miteinander und unser Arbeiten. Doch innerhalb der KI unterscheidet man noch zwischen Supervised Learning, also dem überwachten Lernen, und dem Unsupervised Learning. In diesem „Innovation erklärt“ schauen wir uns das überwachte Lernen an.
Im Wesentlichen handelt es sich beim Supervised Learning um eine Unterkategorie des maschinellen Lernens, die sich damit beschäftigt, wie man einen Algorithmus trainiert, um das bestmögliche Ergebnis in der Datenklassifizierung zu erhalten. Einfach ausgedrückt geht es beispielsweise darum, wie eine KI es schafft Katzen und Hunde, Äpfel und Birnen oder Rot und Grün zu unterscheiden. Das wichtigste, was es über das Supervised Learning zu wissen gibt ist, dass sie markierte Datensätze nehmen, um die KI-Modelle zu trainieren. Man gibt der Maschine dabei genaue Werte und Merkmale und sie passt kontinuierlich ihre Informationen an, bis sie ein möglichst präzises Ergebnis erhält. Der Algorithmus misst seine Genauigkeit dabei anhand der Verlustfunktion und passt sie an, bis der Fehler ausreichend minimiert ist.
Im Supervised Learning kennt man dabei verschiedene Arten von Problemen, für die es angewendet werden kann. Die Klassifizierung und die Regression.
Bei der Klassifizierung ordnet der Algorithmus die Testdaten in bestimmte Kategorien ein. Er erkennt beispielsweise ob es sich um Katzen, Hunde oder Sonstiges handelt und versucht anhand der ihm zur Verfügung stehenden Daten so viele Schlussfolgerungen wie möglich zu treffen. Sehr gängige Klassifizierungsalgorithmen sind lineare Klassifizierer, Support Vector Machines (SVM), Entscheidungsbäume, k-nearest neighbor und Random Forest, die im Folgenden näher beschrieben werden.
Im Gegensatz zur Klassifizierung wird die Regression verwendet, um die Beziehung zwischen abhängigen und unabhängigen Variablen zu verstehen. Wie stehen beispielsweise bestimmte Umweltbedingungen mit dem Umsatzergebnis eines Unternehmens zusammen. Immer, wenn es um Prognosen geht, kommt diese Art des Supervised Learnings zum Einsatz. Hier eingesetzte Methoden sind dabei unteranderem die lineare Regression, logistische Regression und polynomiale Regression sind beliebte Regressionsalgorithmen.
Das Supervised Learning benötigt, wenigstens am Anfang, sehr viel Trainingszeit und Aufmerksamkeit des Menschen. Doch mit immer mehr Datensätzen und Informationen wird auch die KI immer intelligenter und lernt sich selbstständig weiterzubilden und zu lernen.