Der Unterschied zwischen Deep Learning und Machine Learning

Zu den Teilbereichen der Künstlichen Intelligenz gehören unter anderem das Deep Learning und das Machine Learning.

Der Hauptunterschied zwischen Deep Learning und Machine Learning liegt in der Fähigkeit, durch künstlich neuronale Netzwerke, unstrukturierte Daten zu verarbeiten. Deep Learning ist mit Hilfe von künstlich neuronalen Netzwerken in der Lage, Informationen (Texte, Bilder, Töne, Videos) in numerische Werte umzuwandeln. Das herkömmliche Machine Learning ist im Gegensatz zum Deep Learning nicht in der Lage, unstrukturierte Daten sinnvoll als Inputdaten zu nutzen, um zum Beispiel einen Algorithmus zur Gesichtserkennung zu trainieren. Hierzu wäre wiederum der menschliche Eingriff von Nöten, um ein aufwendiges Feature Engineering (Vorbereitung von Daten (Data Preparation) für die Verarbeitung in Machine Learning Algorithmen) zu betreiben.

Bestandteile des Machine Learning

Machine Learning ist ein Anwendungsbereich in der KI (Künstlichen Intelligenz) und eine der Fachrichtungen in der Informatik. Anhand von zufälligen Datenpaketen werden Funktionen an Systeme vermittelt, ohne diese vorher zu codieren. Um eigenständiges Denken bzw. Handeln (z.B. Entscheidungen oder Wahrscheinlichkeiten) zu entwickeln, wird eine spezielle Software verwendet, die zuvor geschult bzw. trainiert werden muss. Klassifizierungen und Datenextraktionen in Emails und Dokumenten, medizinische Analysen anhand von Bilderkennung und Laborwerten, Analyse und Vorhersage über das Kundenverhalten, Vorhersagen von Eintrittswahrscheinlichkeiten sämtlicher Krankheitsbilder oder Analyse und Vorhersage über das Kundenverhalten sind klassische Einsatzgebiete im Bereich des Machine Learning. Anhand von Algorithmen (z.B. aus Erfahrungen oder historischen Daten) entwickelt sich diese intelligente Software kontinuierlich weiter. Durchdachte Mathematik und Programmierung (oftmals Python und C#) sind Grundvoraussetzung für einen reibungslosen Ablauf im Machine Learning. Nur wenn diese Voraussetzungen gegeben sind, können die gewünschten Funktionen und Ergebnisse erreicht werden.

Machine Learning wird häufig bei strukturierten Daten angewendet. Datenbanken oder Excel Tabellen sind typische Beispiele. Die einzelnen Datenbereiche sollten außerdem über eine gewisse Struktur. Aus diesen Strukturen entwickeln sich dann die Algorithmen. Diese werden wiederum auf neue, unbekannte Informationen durchsucht. Katzenbilder zählen zu den typischen Beispielen. Um eine bestimmte Indexierung von beliebigen Bildern zu erreichen, ob zum Beispiel auf dem vorliegenden Bild, auch wirklich das gewünschte Objekt, in dem Falle eine Katze zu sehen ist, werden im maschinellen Lernen, klassische Strukturierungen benötigt. Spezielle Merkmale einer Katze (Ohren, Gesicht, Nahrung, Farbe) müssen im Voraus definiert werden. Sind diese Bedingungen erfüllt, können die korrekten Algorithmen zur richtigen Klassifikation bestimmt werden. 

Die 4 Kategorien des Machine Learning

Supervised Learning (überwachtes Lernen):

Anhand eines Trainingsdatensatzes erlernt der Algorithmus die Muster. Des Weiteren werden bekannte Daten verwendet, um daraus Kausalitäten und Muster zu erkennen. Hierbei wird der Zusammenhang einer Zielvariable erlernt und versucht, die richtigen Vorhersagen, zu treffen. Eine solche Klasse kann numerische Attribute oder binäre Attribute beinhalten. Kreditbewilligung, abhängig von Kredithöhe und Bonität oder automatisierte Messsysteme im Bereich der Fertigungstechnik sind nur einige der Beispiele im Gebiet des überwachten Lernens.


Unsupervised Learning (unüberwachtes Lernen):

Findet eigenständig Muster und Zusammenhänge in den Daten und das ganz ohne Zielvariable. Typische Modelle sind zum Beispiel das Clusteringverfahren (Verfahren zur Entdeckung von Ähnlichkeitsstrukturen in Datenbeständen) und die Dimensionsreduktion (eine Reihe von Techniken für maschinelles Lernen, wird auch in der Statistik angewendet), um die Anzahl der zu berücksichtigenden Zufallsvariablen zu reduzieren. Der Algorithmus bekommt keine Beispieldaten. Er bekommt nur Daten, aus denen er eigenständig Muster und aufschlussreiche, versteckte Gruppen erkennen soll. Das Unsupervised Learning eignet sich nicht, um zum Beispiel eine bekannte Zielvariable (z.B. Klassifikation oder Prognose) zu berechnen. Der Data Scientist (Datenwissenschaftler) muss beim unüberwachten Lernen anhand von relativ weichen Faktoren (soft facts) z.B. Prestige, Stimmungen usw. bewerten und einschätzen, wie geeignet die Ergebnisse zur Anwendung sind.


Semi-supervised Learning (teilüberwachtes Lernen):

Beim teilüberwachten Lernen werden zuvor festgelegte Zielvariablen, aber auch anonyme Daten verwendet. Wie auch schon beim Supervised Learning, muss es die gleichen Voraussetzungen erfüllen. Die einzige Unterscheidung liegt darin, dass für den Lernprozess nur eine geringe Datenmenge mit bekannter Zielvariable genutzt wird und eine große Datenmenge mit nicht vorhandener Zielvariable. Die Beschaffung bekannter Beispieldaten ist oftmals sehr aufwendig und mit hohen Kosten verbunden. Diese Daten müssen häufig durch Menschen, genauer gesagt, manuelle Prozesse erstellt werden. Im Bereich der Bild- und Objekterkennung kommt teilüberwachtes Lernen oft zum Einsatz. In der Regel wird durch Menschenhand ein kleiner Datensatz von bekannten, gelabelten Bildern erstellt. Anschließend wird ein künstlich, neuronales Netz zur Klassifikation erstellt, trainiert und dann auf die restliche Datenmenge angewendet. Dadurch können auch wesentlich effizienter, fehlerfreie und unbekannte Daten erstellt werden.


Reinforcement Learning (verstärkendes oder bestärkendes Lernen):

Reinforcement Learning ist eine besondere Form des maschinellen Lernens. Diese Algorithmen werden durch eine Kostenfunktion oder ein Belohnungssystem (z.B. Social Credit System) bewertet. Sie kommunizieren unmittelbar mit ihrer Umgebung, um so selbstständig ein Lösungskonzept zur Bewältigung einer Problematik zu erlernen und die Belohnung zu maximieren. Zu dem nennenswerten Unterschied zwischen Supervised- und dem Unsupervised Learning zählt, dass das verstärkende Lernen auf keine Ursprungsdaten angewiesen ist. Ein Algorithmus kann in einem simulierten Sektor, in mehreren, sich wiederholenden Anweisungen, eine eigenständige Vorgehensweise entwickeln. (z.B. Laufen oder Sprechen lernen, Gefahrenbeurteilung)

Elemente des Deep Learning

Zum Machine Learning zählt wiederum das Deep Learning als Teilbereich. Das menschliche Lernverhalten wird anhand großer Datenpakete imitiert. Das Ganze setzt sich aus dem Oberbegriff Neuronale Netze zusammen. Im Maschinellen Lernen wird das Deep Learning wortwörtlich auch als Turbolader bezeichnet. Deep Learning verwendet künstlich erzeugte Neuronen, um spezielle Muster zu erkennen. Diese sind als Hauptelement im Deep Learning unerlässlich. Die Verarbeitungseinheiten eines Neuronale Netzes sind in mehrere Schichten angeordnet.


Schicht 1: 

Sie verarbeitet Rohdaten, zum Beispiel einzelne Pixel eines Bildes oder Einträge in einer Datenbank. Sie wird auch als die sogenannte Eingangsschicht bezeichnet.


Schicht 2: 

Informationen werden über mehrere verborgene Schichten und Ebenen weiterverarbeitet und reduziert.


Schicht 3:

Diese Schicht (Ausgabeschicht) führt schließlich zum Ergebnis. Über mehrere Verknüpfungsmöglichkeiten werden die Eingangsneuronen von Zwischenneuronen zu den Ausgangsneuronen verbunden. Es ist oftmals nicht mehr nachvollziehbar, welche Wahl auf der Grundlage, welcher Daten getroffen wurden. Die Entscheidungsregeln werden durch die Maschine automatisiert und zugleich verfeinert. Der positive Nutzen wird beim Deep Learning, unter anderem bei der tiefen Grundvorstellung von den Zusammenhängen zwischen Ein- und Ausgangsdaten (Schichtenmodell), erkennbar. Sobald Algorithmen das Deep Learning beherrschen, lernen und arbeiten sie mit jeder Berechnung ausgereifter und effizienter. Deep Learning hat im Laufe der Zeit eine bedeutende Rolle eingenommen und ist zu einem der zentralen Entwicklungsobjekte im Bereich der IT geworden.

Zusammenfassung 

Machine Learning bezeichnet ein Modell des Algorithmus, der selbstständig Strukturen in Daten erkennen kann. Das Ziel muss genau definiert sein. Eine wichtige Rolle dabei, spielen auch die Qualität und die Vorbereitung der Daten. Bei minimalen Abweichungen können schon Probleme auftreten und es kann keine vernünftige Analyse erstellt werden. Maschinelles Lernen funktioniert besonders effizient mit kompakten, durchstrukturierten Datenpaketen, wie zum Beispiel Kundendaten oder Informationen über Lagerbestände.

Deep Learning ist eine Unterklasse des Machine Learning. Es zeichnet sich durch selbstständige Datenaufbereitung und Feature-Extraktionen (besonders wichtig bei Spracherkennung) aus. Vor allem im Aufbau und der Funktionsweise des Programms liegen seine Besonderheiten. DL-Systeme durchlaufen eine Menge Iterationen, um Muster in den selbstständig, traktieren Daten zu erkennen. Diese sich ständig wiederholenden Praktiken werden dem menschlichen Lernverhalten nachempfunden. Dafür sind große Datenmengen und komplexe Aufgaben, wie zum Beispiel autonomen Fahren oder Spracherkennung, bestens geeignet.



Bilderquelle: 

Tara Winstead (https://www.pexels.com)

Alex Knight (https://www.pexels.com)


By accepting you will be accessing a service provided by a third-party external to https://nrml.de/