# Bibliotheken importieren (am Anfang)
import numpy as np
import pandas as pd
import altair as alt
Grundlagen
Sie haben die Möglichkeit, den gesamten Inhalt dieses Kapitels als Notebook herunterzuladen. Nach dem Herunterladen können Sie es in Ihrem code
Ordner speichern und das Notebook in Jupyter öffnen:
⬇️ Juypter Notebook herunterladen
Bibliotheken importieren
Das Importieren von Bibliotheken ist unerlässlich, um zusätzliche Python-Funktionen nutzen zu können. Wir importieren sie am Anfang der Datei, um Übersichtlichkeit und Effizienz zu gewährleisten. Ein Alias (ein kurzer Name) erleichtert die Referenzierung im gesamten Code.
Fügen Sie den folgenden Code in eine neue Codezelle direkt unter Ihrem Titel ein und führen Sie ihn aus:
Kommentare einfügen
In Python kann man Kommentare im Code schreiben, indem man das Zeichen #
verwendet. Alles, was nach diesem Zeichen auf derselben Zeile steht, wird vom Python-Interpreter ignoriert. Kommentare sind nützlich, um den Code zu dokumentieren, Erklärungen hinzuzufügen oder vorübergehend Teile des Codes zu deaktivieren.
Variablen und Datentypen
Variablen werden verwendet, um verschiedene Arten von Daten in Python zu speichern. Datentypen definieren die Natur dieser Daten und beeinflussen, wie sie verwendet werden können.
Fügen Sie eine neue Codezelle hinzu, kopieren Sie dann den unten angegebenen Code in diese Zelle und führen Sie die Zelle anschließend aus.
Beispielcode:
# Variablen zuweisen (mit beschreibenden Namen)
= "Alice" # String für den Namen einer Person
name = 30 # Integer für das Alter
age = 5.5 # Float für die Größe in Fuß
height = [1, 2, 3] # Liste von ganzen Zahlen
numbers = {"name": "Alice", "age": 30} # Wörterbuch für Personendaten person
Erklärung:
name
ist ein String, der eine Zeichenfolge speichert, die einen Namen darstellt.age
ist eine Integer-Variable, die eine ganze Zahl darstellt.height
ist ein Float, der eine Zahl mit einem Dezimalpunkt darstellt.numbers
ist eine Liste, die eine geordnete Sammlung von Elementen darstellt.person
ist ein Dictionary (Wörterbuch), das aus Schlüssel-Wert-Paaren besteht und mehrere Attribute speichern kann.
Um die in diesen Variablen gespeicherten Werte zu überprüfen, können Sie die print
-Funktion verwenden:
print(name) # Ausgabe: Alice
print(age) # Ausgabe: 30
print(numbers) # Ausgabe: [1, 2, 3]
print(person) # Ausgabe: {'name': 'Alice', 'age': 30}
Alice
30
[1, 2, 3]
{'name': 'Alice', 'age': 30}
Grundlegende Operatoren und Berechnungen
Operatoren ermöglichen Berechnungen, Vergleiche und logische Operationen.
Beispielcode:
# Variablen erzeugen
= 10
length = 5 width
Berechnung der Fläche und des Umfangs:
= length * width # Multiplikation
area = 2 * (length + width) # Addition und Multiplikation
perimeter
# Umfang anzeigen
perimeter
30
length
undwidth
werden multipliziert, um diearea
zu berechnen.perimeter
wird berechnet, indemlength
undwidth
addiert und dann mit 2 multipliziert werden.
Vergleichsoperationen:
= length == width # Überprüfen, ob Länge und Breite gleich sind
is_square
is_square
False
is_square
überprüft, ob die beiden Seiten gleich lang sind.
Logische Operationen:
= (area > 20) and (perimeter > 10) # Logisches UND
is_large_rectangle
is_large_rectangle
True
is_large_rectangle
verwendet logische Operatoren, um festzustellen, ob das Rechteck sowohl eine große Fläche als auch einen großen Umfang hat.
Arbeiten mit DataFrames
Ein DataFrame ist eine zweidimensionale tabellarische Datenstruktur, die von Pandas bereitgestellt wird. Es ermöglicht eine effiziente Datenmanipulation, ähnlich wie ein Tabellenblatt oder eine SQL-Tabelle.
Hier ein Beispiel. Wir bereiten zunächst die Daten vor:
= {
data "Numbers": [1, 2, 3, 4, 5],
"Squares": [1, 4, 9, 16, 25]
}
- Das Wörterbuch
data
enthält zwei Listen: Zahlen und deren Quadrate.
Erstellen eines DataFrame mit Pandas:
= pd.DataFrame(data) df
- Der DataFrame
df
wird aus diesem Wörterbuch mit der Funktionpd.DataFrame
erstellt, die die Daten in Zeilen und Spalten organisiert.
Den DataFrame inspizieren (dafür verwenden wir nicht print()
)
df
Numbers | Squares | |
---|---|---|
0 | 1 | 1 |
1 | 2 | 4 |
2 | 3 | 9 |
3 | 4 | 16 |
4 | 5 | 25 |
- Das Eingeben von
df
in eine Jupyter Notebook-Zelle zeigt den DataFrame in tabellarischer Form an.
Methoden verstehen
Eine Methode ist eine Funktion, die mit einem Objekt (wie einem DataFrame, einer Liste oder einem String) verknüpft ist und über die Punktnotation (.
) aufgerufen wird. Dies erleichtert die Manipulation des Objekts und das Abrufen von Informationen.
Beispielcode:
df.head()
ist eine Methode, welche die ersten paar Zeilen eines DataFrames anzeigt, um die Daten zu zeigen:
df.head()
Numbers | Squares | |
---|---|---|
0 | 1 | 1 |
1 | 2 | 4 |
2 | 3 | 9 |
3 | 4 | 16 |
4 | 5 | 25 |
df.describe()
liefert zusammenfassende Statistiken wie Mittelwert, Anzahl und Standardabweichung. Zusätzlich verwenden wir die Methode .round(2)
, um die Werte auf zwei Dezimalstellen zu runden:
round(2) df.describe().
Numbers | Squares | |
---|---|---|
count | 5.00 | 5.00 |
mean | 3.00 | 11.00 |
std | 1.58 | 9.67 |
min | 1.00 | 1.00 |
25% | 2.00 | 4.00 |
50% | 3.00 | 9.00 |
75% | 4.00 | 16.00 |
max | 5.00 | 25.00 |
Allgemeines Methodenkonzept:
- Objekt: Eine Entität, die Daten und Funktionalität enthält (z.B. DataFrame, Liste oder String).
- Methode: Eine Funktion, die mit einem Objekt verknüpft ist.
- Punktnotation (
.
): Wird verwendet, um eine Methode auf einem Objekt aufzurufen.
Daten visualisieren
Nachdem Sie die Struktur eines DataFrames verstanden haben, können Sie dessen Daten mit Altair visualisieren.
Beispielcode:
# Das Diagramm erstellen
alt.Chart(df).mark_point().encode(='Numbers',
x='Squares'
y )
Erklärung:
- Altair-Bibliothek: Eine deklarative Visualisierungsbibliothek, die den Prozess der Erstellung von Diagrammen und Grafiken vereinfacht.
alt.Chart(df)
: Erstellt ein neues Diagrammobjekt aus dem DataFramedf
.mark_point()
: Gibt den Diagrammtyp an (in diesem Fall ein Streudiagramm).encode
: Ordnet DataFrame-Spalten Diagrammattributen zu.x='Numbers'
: Legt die horizontale Achse auf die SpalteNumbers
fest.y='Squares'
: Legt die vertikale Achse auf die SpalteSquares
fest.
Diese prägnante Syntax ermöglicht die schnelle Erstellung und Anpassung von Visualisierungen.