image image


image

Für umme lesen: Data Science und Datenvisualisierung

Da ich ein wenig enttäuscht war von den Möglichkeiten der Datenvisualisierung, die mir (bisher) Julia anbot, hatte ich mich mal umgeschaut, was denn Python außer der Matplotlib so zu bieten hat. Dabei bin ich – unter anderem – auf Bokeh gestoßen, das ich mir unbedingt einmal genauer anschauen will. Aber besonders gefreut habe ich mich, daß mir zwei Bücher untergekommen sind, die Ihr kostenlos online lesen könnt, sich mit Datenvisualisierung befassen und unterschiedlicher nicht sein können.

Das erste Buch heißt »Fundamentals of Data Visualization« und ist von Claus O. Wilke. Die Online Version umfaßt das komplette Buch vor dem letzten Korrekturlesen und der letzten Qualitätskontrolle. Ich habe es den ganzen Nachmittag durchgeblättert und bin begeistert. Zwar gibt es keine einzige Zeile Code in diesem Band, denn es behandelt die Datenvisualisierung aus theoretischer Sicht: Was ist ein gute Visualisierung, was eine schlechte und welche Visualisierungen sind einfach falsch oder irreführend. Das Buch ist gespickt mit Beispielen und farbigen Abbildungen. Als Farbenblinden hat es mich gefreut, daß der Autor dem Thema »Farbenblindheit« ein ganzes Kapitel gewidmet hat.

Das Buch ist einfach gut. Der Autor hat die Abbildungen in R mit ggplot2 erstellt und auch das Buch ist in R mit Rmarkdown entstanden. Neben der Online-Ausgabe ist es bei O’Reilly als Totes-Holz und Ebook erschienen. Wenn Ihr es auf Eurem Schreibtisch haben oder dem Autor eine Anerkennung zukommen lassen wollt, könnt Ihr es auch kaufen.

Auf das zweite Buch bin ich gestoßen, weil es von dem Autor oben empfohlen wurde. Es heißt »Python Data Science Handbook«, ist von Jake VanderPlas (regelmäßige Leser des Schockwellenreiters wissen, daß der Name hier schon mehrfach aufgetaucht ist), steht unter einer Creative-Commons-Lizenz (CC-BY-ND) und daher könnt Ihr es ebenfalls kostenlos lesen. Ich habe es noch nicht gelesen, aber laut dem Inhaltsverzeichnis behandelt es IPython, NumPy, Pandas und die Matplotlib. Als Höhepunkt ist das letzte Kapitel gedacht, das das Thema Maschinelles Lernen mit Python und der Bibliothek Scikit-Learn behandelt. Ich bin gespannt, denn Scikit-Learn steht ebenfalls schon lange auf meiner Liste der zu testenden Python-Bibliotheken.

Das Buch ist zusätzlich auf GitHub in Form von Jupyter-Notebooks verfügbar.

Auch dieses Buch ist bei O’Reilly als Totes-Holz-Ausgabe und als Ebook erschienen. Ihr könnt es also ebenfalls käuflich in dinglicher Form erwerben. Die Gründe, warum Ihr es tun solltet, sind die gleichen wie bei dem ersten Buch oben. 🤓

Ich habe Euch in den letzten Wochen so viele kostenlos zu lesende Bücher vorgestellt, daß ich mich frage, ob ich es in diesem Leben noch schaffe, sie alle zu lesen. Aber ich bin ja Rentner mit viel Zeit und mein Vater hat vor wenigen Tagen bei bester Gesundheit seinen 91. Geburtstag gefeiert. Das gilt es zu toppen.


(Kommentieren) 

image image



Über …

Der Schockwellenreiter ist seit dem 24. April 2000 das Weblog digitale Kritzelheft von Jörg Kantel (Neuköllner, EDV-Leiter Rentner, Autor, Netzaktivist und Hundesportler — Reihenfolge rein zufällig). Hier steht, was mir gefällt. Wem es nicht gefällt, der braucht ja nicht mitzulesen. Wer aber mitliest, ist herzlich willkommen und eingeladen, mitzudiskutieren!

Alle eigenen Inhalte des Schockwellenreiters stehen unter einer Creative-Commons-Lizenz, jedoch können fremde Inhalte (speziell Videos, Photos und sonstige Bilder) unter einer anderen Lizenz stehen.

Der Besuch dieser Webseite wird aktuell von der Piwik Webanalyse erfaßt. Hier können Sie der Erfassung widersprechen.

Diese Seite verwendet keine Cookies. Warum auch? Was allerdings die iframes von Amazon, YouTube und Co. machen, entzieht sich meiner Kenntnis.


Werbung

Diese Spalte wurde absichtlich leergelassen!


Werbung


image  image  image
image  image  image


image