Machine Learning | kurz&gut | Nguyen & Zeigermann | O’Reilly

Machine Learning kurz & gut | O‘Reilly Verlag

Blockchain, Künstliche Intelligenz, Machine Learning, Big Data. Alles Begriffe, die man immer häufiger hört und Beiträge dazu liest. Nicht immer hat man das notwendige (Vor-)Wissen, um alles hinreichend zu verstehen.

Zum Thema Machine Learning gibt es hierfür eine empfehlenswerte Einführung von Nguyen & Zeigermann aus der kurz & gut – Reihe der O’Reilly Taschenbibliothek. Nach der Rezension zu Blockchain aus der gleichen Reihe, schauen wir uns nun dieses knapp 190 seitige, kleinformatiges Taschenbuch näher an.

Daten sind das neue Öl

Die Autoren beginnen mit einer kurzen Einleitung, die den Leser direkt mit einem sehr praktikablen Beispiel zur Funktionsweise von Robotern abholt. Dort werden kurz die Arten von Machine Learning beschrieben. So kommt man gut ins Thema und in das zweite Kapitel «Quick-Start» in dem die wichtigen Grundlagen beim Training mit der Datenbasis mit Begriffen wie Underfitting oder Overfitting vermittelt werden.

Das wichtigste für ein effizientes Machine Learning ist eine gute und brauchbare Datenbasis. Im folgenden dritten Kapitel führen die Autoren Schritt für Schritt durch die Datenaufbereitung und den notwendigen Datenimport. Hier erhält der Leser Einblick in die ersten Schritte des Preprocessing und der verwendeten Programmiersprache Python.

Supervised Learning

Nach dieser Vorbereitung der Daten geht das nächste Kapitel auf das Supervised Learning ein, also auf das Trainieren der Daten. Hier geht es schon sehr ins Detail und man erhält Zugang zu Begriffen wie der Linearen Regression, Loss-Funktion, der logistischen Regression oder der weiteren Methode namens Support Vector Machine.

Logistische Funktion zweidimensional
Logistische Funktion zweidimensional

Neben mathematischen Funktionen und Formeln, werden die einzelnen Erklärungen durch zahlreiche Abbildungen und Grafiken unterstützt. Leider hat es hier aber für ein tieferes Verständnis der Ausführungen (bisher) noch nicht weitergeholfen. Es bleibt einfach eine sehr schwierige Materie.

Paarweise Klassifikation des Irisdatensatzes
Paarweise Klassifikation des Irisdatensatzes

Feature Auswahl

Im fünften Kapitel «Feature-Auswahl» gehen die Autoren noch weiter in die Tiefe und geben Antworten auf die Fragen zu den Eigenschaften von Daten, den Zusammenhängen untereinander und nicht zuletzt vermitteln sie hier etwas statistisches Wissen. Alle notwendigen Code-Beispiele und erzeugten Grafiken diese aber auch aller übrigen Kapitel sind an einer im Bucb genannten URL zum Abruf hinterlegt. Damit kann sich der Leser auch direkt am PC die einzelnen Schritte erarbeiten.

Neuronale Netze & Deep Learning

Im vorletzten Kapiteln führen die Autoren an die Methoden heran, mit denen man Underfitting oder Overfitting erkennen kann, um so die Parameter des gewählten Modells best möglichst zu wählen. Abschließend werden anhand eines konkreten Beispiels die erworbenen Kenntnisse zusammengefasst und man geht zuletzt noch ganz kurz auf neuronale Netze und Deep Learning ein.

Fazit

Trotz der dem Format geschuldeten kurzen und knappen Darstellung dieser komplexen und nicht ganz einfachen Materie schaffen es die Autoren einen griffigen und hilfreichen Einstieg zu liefern. Ist man absoluter Einsteiger, muss man vielleicht die eine oder andere Passage  mehr als einmal lesen, doch Dank der begleitenden Code-Beispiele kann man die Schritte sehr gut selbst am PC nacharbeiten und die Ergebnisse ermiteln.

Dieser Titel macht Spaß und Lust auf Mehr in diesem hoch interessanten Thema Machine Learning.

Daten zum Buch:

Autoren: Chi Nhan Nguyen / Oliver Zeigermann
Titel: Machine Learning – kurz & gut
Eine Einführung mit Python, Pandas und Scikit-Learn
Erschienen: April 2018, 184 Seiten, komplett in Farbe, Broschur
Verlag: O’Reilly
ISBN Print: 978-3-96009-052-6
ISBN PDF: 978-3-96010-192-5
ISBN ePub: 978-3-96010-193-2
ISBN Mobi: 978-3-96010-194-9

Weitere Informationen auf der Verlagswebseite zu diesem Titel.

Zum Thema Machine Learning bietet der Verlag noch zahlreiche Werke, von denen wir den einen oder anderen Titel evtl. noch rezensieren.