Grundlagen

Sie haben die Möglichkeit, den gesamten Inhalt dieses Kapitels als Notebook herunterzuladen. Nach dem Herunterladen können Sie es in Ihrem code Ordner speichern und das Notebook in Jupyter öffnen:

⬇️ Juypter Notebook herunterladen

Bibliotheken importieren

Das Importieren von Bibliotheken ist unerlässlich, um zusätzliche Python-Funktionen nutzen zu können. Wir importieren sie am Anfang der Datei, um Übersichtlichkeit und Effizienz zu gewährleisten. Ein Alias (ein kurzer Name) erleichtert die Referenzierung im gesamten Code.

Fügen Sie den folgenden Code in eine neue Codezelle direkt unter Ihrem Titel ein und führen Sie ihn aus:

# Bibliotheken importieren (am Anfang)
import numpy as np
import pandas as pd
import altair as alt

Kommentare einfügen

In Python kann man Kommentare im Code schreiben, indem man das Zeichen # verwendet. Alles, was nach diesem Zeichen auf derselben Zeile steht, wird vom Python-Interpreter ignoriert. Kommentare sind nützlich, um den Code zu dokumentieren, Erklärungen hinzuzufügen oder vorübergehend Teile des Codes zu deaktivieren.

Variablen und Datentypen

Variablen werden verwendet, um verschiedene Arten von Daten in Python zu speichern. Datentypen definieren die Natur dieser Daten und beeinflussen, wie sie verwendet werden können.

Fügen Sie eine neue Codezelle hinzu, kopieren Sie dann den unten angegebenen Code in diese Zelle und führen Sie die Zelle anschließend aus.

Beispielcode:

# Variablen zuweisen (mit beschreibenden Namen)
name = "Alice"  # String für den Namen einer Person
age = 30  # Integer für das Alter
height = 5.5  # Float für die Größe in Fuß
numbers = [1, 2, 3]  # Liste von ganzen Zahlen
person = {"name": "Alice", "age": 30}  # Wörterbuch für Personendaten

Erklärung:

  • name ist ein String, der eine Zeichenfolge speichert, die einen Namen darstellt.
  • age ist eine Integer-Variable, die eine ganze Zahl darstellt.
  • height ist ein Float, der eine Zahl mit einem Dezimalpunkt darstellt.
  • numbers ist eine Liste, die eine geordnete Sammlung von Elementen darstellt.
  • person ist ein Dictionary (Wörterbuch), das aus Schlüssel-Wert-Paaren besteht und mehrere Attribute speichern kann.

Um die in diesen Variablen gespeicherten Werte zu überprüfen, können Sie die print-Funktion verwenden:

print(name)  # Ausgabe: Alice
print(age)  # Ausgabe: 30
print(numbers)  # Ausgabe: [1, 2, 3]
print(person)  # Ausgabe: {'name': 'Alice', 'age': 30}
Alice
30
[1, 2, 3]
{'name': 'Alice', 'age': 30}

Grundlegende Operatoren und Berechnungen

Operatoren ermöglichen Berechnungen, Vergleiche und logische Operationen.

Beispielcode:

# Variablen erzeugen
length = 10
width = 5

Berechnung der Fläche und des Umfangs:

area = length * width  # Multiplikation
perimeter = 2 * (length + width)  # Addition und Multiplikation

# Umfang anzeigen
perimeter
30
  • length und width werden multipliziert, um die area zu berechnen.
  • perimeter wird berechnet, indem length und width addiert und dann mit 2 multipliziert werden.

Vergleichsoperationen:

is_square = length == width  # Überprüfen, ob Länge und Breite gleich sind

is_square
False
  • is_square überprüft, ob die beiden Seiten gleich lang sind.

Logische Operationen:

is_large_rectangle = (area > 20) and (perimeter > 10)  # Logisches UND

is_large_rectangle
True
  • is_large_rectangle verwendet logische Operatoren, um festzustellen, ob das Rechteck sowohl eine große Fläche als auch einen großen Umfang hat.

Arbeiten mit DataFrames

Ein DataFrame ist eine zweidimensionale tabellarische Datenstruktur, die von Pandas bereitgestellt wird. Es ermöglicht eine effiziente Datenmanipulation, ähnlich wie ein Tabellenblatt oder eine SQL-Tabelle.

Hier ein Beispiel. Wir bereiten zunächst die Daten vor:

data = { 
         "Numbers": [1, 2, 3, 4, 5], 
         "Squares": [1, 4, 9, 16, 25]
}
  • Das Wörterbuch data enthält zwei Listen: Zahlen und deren Quadrate.

Erstellen eines DataFrame mit Pandas:

df = pd.DataFrame(data)
  • Der DataFrame df wird aus diesem Wörterbuch mit der Funktion pd.DataFrame erstellt, die die Daten in Zeilen und Spalten organisiert.

Den DataFrame inspizieren (dafür verwenden wir nicht print())

df
Numbers Squares
0 1 1
1 2 4
2 3 9
3 4 16
4 5 25
  • Das Eingeben von df in eine Jupyter Notebook-Zelle zeigt den DataFrame in tabellarischer Form an.

Methoden verstehen

Eine Methode ist eine Funktion, die mit einem Objekt (wie einem DataFrame, einer Liste oder einem String) verknüpft ist und über die Punktnotation (.) aufgerufen wird. Dies erleichtert die Manipulation des Objekts und das Abrufen von Informationen.

Beispielcode:

df.head() ist eine Methode, welche die ersten paar Zeilen eines DataFrames anzeigt, um die Daten zu zeigen:

df.head() 
Numbers Squares
0 1 1
1 2 4
2 3 9
3 4 16
4 5 25

df.describe() liefert zusammenfassende Statistiken wie Mittelwert, Anzahl und Standardabweichung. Zusätzlich verwenden wir die Methode .round(2), um die Werte auf zwei Dezimalstellen zu runden:

df.describe().round(2) 
Numbers Squares
count 5.00 5.00
mean 3.00 11.00
std 1.58 9.67
min 1.00 1.00
25% 2.00 4.00
50% 3.00 9.00
75% 4.00 16.00
max 5.00 25.00

Allgemeines Methodenkonzept:

  • Objekt: Eine Entität, die Daten und Funktionalität enthält (z.B. DataFrame, Liste oder String).
  • Methode: Eine Funktion, die mit einem Objekt verknüpft ist.
  • Punktnotation (.): Wird verwendet, um eine Methode auf einem Objekt aufzurufen.

Daten visualisieren

Nachdem Sie die Struktur eines DataFrames verstanden haben, können Sie dessen Daten mit Altair visualisieren.

Beispielcode:

# Das Diagramm erstellen
alt.Chart(df).mark_point().encode(
    x='Numbers',
    y='Squares'
)

Erklärung:

  • Altair-Bibliothek: Eine deklarative Visualisierungsbibliothek, die den Prozess der Erstellung von Diagrammen und Grafiken vereinfacht.
  • alt.Chart(df): Erstellt ein neues Diagrammobjekt aus dem DataFrame df.
  • mark_point(): Gibt den Diagrammtyp an (in diesem Fall ein Streudiagramm).
  • encode: Ordnet DataFrame-Spalten Diagrammattributen zu.
    • x='Numbers': Legt die horizontale Achse auf die Spalte Numbers fest.
    • y='Squares': Legt die vertikale Achse auf die Spalte Squares fest.

Diese prägnante Syntax ermöglicht die schnelle Erstellung und Anpassung von Visualisierungen.