# Pakete

## Code in Dateien, Module und Pakete aufteilen

Gr√∂√üere Programme enthalten oft dutzende Klassen mit hunderten Funktionen und vielen tausend Zeilen Code. Hier wird es sehr schnell schwer einen √úberblick zu behalten, wenn alle Klassen in einer Datei definiert sind. Insbesondere wenn verschiedene Programmierer an verschiedenen Stellen im Programm arbeiten, kommt es dann sehr schnell zu Versionskonflikten, wenn Leute an √§hnlichen Dateien arbeiten.

Um dies organisiert und √ºbersichtlich zu halten, wird Code in mehrere Dateien mit der Erweiterung `.py` aufgespalten. Dabei ist es √ºblich jeweils eine Datei
-  pro Klasse, wenn Klassen definiert werden
-  pro Thema, wenn Hilfsfunktionen definiert werden (z.B. Mathematik-Funktionen, ‚Ä¶)
-  pro Aufgabenbereich, wenn (z.B. Laden von Daten getrennt von deren Verarbeitung. So kann man z.B. sp√§ter andere Verarbeitungsschritte definieren und das Laden wiederverwenden)

Speichern wir jede Klasse der Geometrieelemente aus dem Teil der [Klassendefinition](7a_Objects.ipynb) aus der letzten Vorlesung so h√§tten wir dann z.B. eine Projektstruktur entsprechend:

- üìÅ geometry
    - üìÑ [ImmutablePoint.py](points/ImmutablePoint.py)
    - üìÑ [Point.py](points/Point.py)
    - üìÑ [Line.py](shapes/Line.py)
    - üìÑ [Pentagon.py](shapes/Pentagon.py)
    - üìÑ [Polygon.py](shapes/Polygon.py)
    - üìÑ [Tetragon.py](shapes/Tetragon.py)
    - üìÑ [Triangle.py](shapes/Triangle.py)

<!-- <center><img src="images/files.png" style="width: 40ex"></center> -->

Dabei enth√§lt jede Datei nur den Code der gleichnamigen Klasse, auch wenn dies nur wenige Zeilen sind, wie im Fall der Klassen `Triangle`, `Tetragon` und `Pentagon`. Entscheidend ist, dass wenn ein Programmierer nach dem Code f√ºr eine Klasse sucht, er genau sieht in welcher Datei dieser zu finden ist und nicht gro√ü suchen muss.

Noch gr√∂√üere Projekte spalten man in mehrere *Module* indem man weitere Unterverzeichnisse anlegt. So wollen wir z.B. alle generischen Klassen f√ºr Punkte in das Verzeichnis `points` gruppieren und alle geometrischen Formen in das Verzeichnis `shapes`. So lassen sich gr√∂√üere Projekte gut strukturieren.

Die Summe aller Module formt dann ein *Package*. In diesem Fall das Package `geometry`, welches wir in verschiedenen Implementierungen wieder verwenden k√∂nnen.

- üìÅ geometry
    - üìÅ points
        - üìÑ [ImmutablePoint.py](geometry/points/ImmutablePoint.py)
        - üìÑ [Point.py](geometry/points/Point.py)
    - üìÅ shapes
        - üìÑ [Line.py](geometry/shapes/Line.py)
        - üìÑ [Pentagon.py](geometry/shapes/Pentagon.py)
        - üìÑ [Polygon.py](geometry/shapes/Polygon.py)
        - üìÑ [Tetragon.py](geometry/shapes/Tetragon.py)
        - üìÑ [Triangle.py](geometry/shapes/Triangle.py)

<!-- <center><img src="images/shapes.png" style="width: 40ex"></center> -->

## `main()` - Der Startpunkt eines Programmes 

Wenn Code √ºber mehrere Dateien verteilt ist, braucht Python einen Hinweis welcher Code ausgef√ºhrt werden soll. Hierf√ºr definiert man die spezielle Einstiegsfunktion `main()`. Sie gibt es in fast allen Programmiersprachen und gibt immer den Startpunkt eines Programms an.

In Python hat sie entweder keine Argumente oder sie erh√§lt diese dynamisch, wenn sie vom Nutzer / von einem anderen Programm aufgerufen wird (a.k.a. Kommandozeilenargumente).

In [None]:
def main():
	print("This is the main function")

Allerdings m√∂chte man vermeiden, dass die Funktion `main()` auch aufgerufen wird, wenn die Python-Datei zum Beispiel als Bibliothek eingebunden wird, wo man nur an den Funktionen interessiert ist. Deshalb nutzt man am Ende einer Datei mit einer `main()`-Funktion die folgende Verzweigung.

In [None]:
if __name__ == "__main__":
	main()

Sie nutzt aus, dass der Wert der Standardvariable `__name__` in der Hauptdatei immer `'__main__'` lautet. W√§hrend sie in einer importierten Datei den Namen der Hauptdatei angibt.

## Importieren von Modulen

Um zu vermeiden, dass st√§ndig unn√∂tiger Code geladen wird l√§dt Python diesen Code nicht automatisch. Wollen wir also den Code in unseren Dateien, Modulen und Packages nutzen so m√ºssen wir vorher Python anweisen diesen zu laden. Dieses *Importieren* weist man mit dem Befehl `import` an.

Ein einfacher Import ist der import ganzer Pakete. Dies geschieht, indem wir `import` und dem Paketnamen schreiben.

In [None]:
import geometry.points.ImmutablePoint
import geometry.shapes.Line

def main():
	point_1 = geometry.points.ImmutablePoint.ImmutablePoint(x=54.083336, y=12.108811)
	point_2 = geometry.points.ImmutablePoint.ImmutablePoint(y=12.094167, x=54.075211)
	linie_1 = geometry.shapes.Line.Line(start=point_1, end=point_2)
	print(f"Die L√§nge der Linie zwischen Punkt 1 und 2 ist: {linie_1.length()}")

if __name__ == "__main__":
	main()

Der Nachteil des Imports ganzer Pakete ist, dass wenn wir hieraus einzelne Klassen referenzieren wollen, die sich in Untermodulen befinden, so m√ºssen wir den kompletten Pfad der Klasse angeben. In dem Beispiel oben zum Beispiel `geometry.points.ImmutablePoint.ImmutablePoint`.

Deshalb importiert man meist einzelne Module indem man den Pfad eines Moduls angibt, wie zum Beispiel `geometry.points.ImmutablePoint.ImmutablePoint`. Hierbei kann man den importierten Modulen auch neue Namen geben wie `point` oder `line` in dem Beispiel unten.

In [None]:
import geometry.points.ImmutablePoint as point
import geometry.shapes.Line as line

def main():
	point_1 = point.ImmutablePoint(x=54.083336, y=12.108811)
	point_2 = point.ImmutablePoint(y=12.094167, x=54.075211)
	linie_1 = line.Line(start=point_1, end=point_2)
	print(f"Die L√§nge der Linie zwischen Punkt 1 und 2 ist: {linie_1.length()}")

if __name__ == "__main__":
	main()

Alternativ lassen sich auch Teile eines Moduls mit dem Platzhalter `*` und dem Befehl `from` importieren. Alle Elemente werden mit dem Platzhalter `*` importiert. Spezifische Elemente wie einzelne Klassen k√∂nnen auch direkt angegeben werden, wie im folgenden Beispiel `Line`.

In [None]:
from geometry.points.ImmutablePoint import *
from geometry.shapes.Line import Line

def main():
	point_1 = ImmutablePoint(x=54.083336, y=12.108811)
	point_2 = ImmutablePoint(y=12.094167, x=54.075211)
	linie_1 = Line(start=point_1, end=point_2)
	print(f"Die L√§nge der Linie zwischen Punkt 1 und 2 ist: {linie_1.length()}")

if __name__ == "__main__":
	main()

## Standard Paktete aus Python importieren

Python beinhaltet viele [Standardpakete](https://python.readthedocs.io/en/latest/library/index.html) f√ºr typische Aufgaben. F√ºr die Bau- und Umweltinformatik sind die folgenden am sinnvollsten:

| packet |   description |
| ------ | ------------- |
| collections | Mehr komplexe Datentypen zum z√§hlen, sortieren     |
| http   | Funktionen des HTTP-Internetprotokolls wie Web-Server   |
| json   | Funktionen um Objekte als Text abzuspeichern            |
| logging| Funktionen um Logs zu schreiben                         |
| math   | Mathematische Funktionen                                |
| os     | Funktionen um Dateien zu finden, laden und speichern     |
| pickle | Funktionen um Objekte bin√§r abzuspeichern               |
| pprint | print-Funktionen um Objekte sch√∂ner (pretty) auszugeben |
| random | Funktionen zum Erzeugen von Zufallszahlen               |
| re     | Funktionen f√ºr Regul√§re Ausdr√ºcke um Text zu suchen     |
| sys    | Funktionen um Systeminformationen zu erhalten           |
| time   | Funktionen f√ºr Zeit und Datumsangaben                   |
| timeit | Funktionen um die Performance von Funktionen zu testen  |
|traceback| Funktionen um den Stack aufzulisten                    |
| urllib | Funktionen um ULRs im Internet zu laden und verarbeiten |

Von der Liste haben wir die Bibliotheken `math`, `time`, `timeit`, `traceback` und `logging` schon kennen gelernt und benutzt. Die anderen Pakete bieten allerdings weitere sinnvolle Funktionen.

 Wollen wir zum Beispiel alle Dateien in einem Verzeichnis auflisten, so nutzen wir das Paket `os`.

In [None]:
import os

folder = "geometry/shapes/"
for count, filename in enumerate(os.listdir(folder)):
	if os.path.isfile(os.path.join(folder, filename)):
		path = os.path.join(folder, filename)
		print(path)

Viele Webseiten bieten Programmierschnittstellen an, so genannte APIs, da diese APIs auch von den eigenen Webseiten genutzt werden, um Daten nachzuladen, die auf der Webseite angezeigt werden. Die APIs nutzen meist das JSON-Format um Daten auszutauschen. Dies ist ein Text-basiertes Dateiformat, das in Python sehr stark dem `dict`-Datentyp √§hnelt, aber auch alle anderen primitiven und zusammengesetzten Datentypen von Python unterst√ºtzt. 

Wir m√∂chten zum Beispiel die Wetterdaten einer Wetterstation in Deutschland analysieren. Diese Daten bekommen wir beim [Deutschen Wetterdiest](https://www.dwd.de). Diese Daten kann man sich auch von der [API](https://dwd.api.bund.dev/) herunterladen. Hierf√ºr braucht man die ID (Identifikationsnummer) einer Wetterstation welche [hier](https://www.dwd.de/DE/leistungen/klimadatendeutschland/statliste/statlex_html.html?view=nasPublication&nn=16102) zu finden ist. Wir nehmen als Beispiel eine Station im Hansaviertel in Rostock mit der ID `12495`.

Dann kann man die Wetterdaten mit Python mit Hilfe des Paketes `urllib` von der API laden. Das JSON-Format k√∂nnen wir mit dem `json` Paket verarbeiten. Wir laden dazu zuerst vom Deutschen Wetterdienst ein bin√§res Datenpaket vom Datentype `bytes`. Dieses konvertieren wir mit der Funktion `loads` aus dem `json` Paket in ein Python `dict`. Um das sch√∂ner lesbar auszugeben, nutzen wir die Funktion `pprint` aus dem Paket `pprint` (pretty-print).

In [None]:
import urllib.request
import json
import pprint

stationID='12495' # Rostock-Hansaviertel
with urllib.request.urlopen(f'https://dwd.api.proxy.bund.dev/v30/stationOverviewExtended?stationIds={stationID}') as f:
    data=f.read() # Dies gibt uns ein bin√§ren Datentyp zur√ºck
    wetter=json.loads(data) # Wir konvertieren den bin√§ren Datentyp in ein dict
    pprint.pprint(wetter, indent=2, compact=True)

<!-- Einen eigenen Webserver k√∂nnen wir mit dem Paket `http.server` starten.

import http.server as server

server_object = server.HTTPServer(server_address=('', 80), 	RequestHandlerClass=server.CGIHTTPRequestHandler)

server_object.serve_forever()

-->

## Externe Pakete installieren und importieren

Die St√§rke von Python ist allerdings die riesige Auswahl an vorhandenen Paketen. F√ºr die meisten Anwendungszwecke gibt es entsprechende Python Packages. Ein solches Verzeichnis is [PyPi](https://pypi.org/) das √ºber 400.000 Pakete listet.

Die Installation neuer Pakete f√ºr Python ist einfach. Hierf√ºr √∂ffnet man ein Terminal (Kommandozeile) und gibt den Befehl `pip install <packetname>` ein. 

Zum Beispiel wollen wir die eben geladenen Wetterdaten anzeigen. Hierf√ºr nutzen wir:
- zuerst das Paket `pandas` zum Erzeugen einer Tabelle aus den Wetterdaten. 
- dann nutzen wir das Paket `plotly` zum Zeichnen eines Diagramms. 
- zuletzt erzeugen wir uns einen Webserver mit `dash` der uns das Diagramm immer anzeigt

Alles drei installieren wir mit `pip`. Wir k√∂nnen das in einem Aufruf machen. Wir nutzen den `--quiet` Switch, um die Ausgabe zu reduzieren.

In [None]:
pip install pandas plotly dash  --quiet

Jetzt laden wir beide Pakete, wobei man √ºblicher Weise `pandas` die Abk√ºrzung `pd` zuweist und Plotly Express, welches einfach zu bedienen ist, die Abk√ºrzung `px`.

In [None]:
import pandas as pd
import plotly.express as px
import dash

Nun wandeln wir die tageweise Wettervorhersage `days` der Daten von der Wetterstation mit der `stationID` zuerst in eine Tabelle um, da diese von Plotly express verarbeitet werden kann. Tabellen hei√üen in Pandas DataFrames (allgemein werden so Tabellen in der Data Science genannt). Wir erzeugen also aus der Wettervorhersage ein neue Objektinstanz vom Typ `DataFrame` via

In [None]:
df = pd.DataFrame(wetter[stationID]['days'])
df

Nun plotten wir die Daten `df` als LinienDiagramm mit Hilfe von Plotly wobei wir als `x`-Axe das Datum w√§hlen (`dayDate`) und als `y`-Axe die minimale Temperatur `temperatureMin` und maximale Temperatur `temperatureMax`.

In [None]:
fig=px.line(df, x="dayDate", y=["temperatureMin", "temperatureMax"])
fig.show(renderer="svg")

Zuletzt wollen wir dieses Diagramm in einer Webseite auf einem Webserver anzeigen. Hier nutzen wir das Paket `dash` welches erlaubt eine Webseite mit Python-Befehlen zu erzeugen und darin interaktive Diagramme von Plotly mit anzuzeigen.

In [None]:
import dash

app = dash.Dash()

In [None]:
pip install jupyter_dash  --quiet

In [None]:
# und ersetzen das Dash objekt
from jupyter_dash import JupyterDash

app = JupyterDash()

Dann erzeugen wir eine Webseite mit einer √úberschrift (`H1`), welche den Plot als `Graph` enth√§lt.

In [None]:
app.layout = dash.html.Div(children = [
    dash.html.H1(children='Wetter in Rostock'),
    dash.dcc.Graph(id="fare_vs_age", figure=fig)
])

Und starten den Webserver.

In [None]:
app.run_server()

Dies startet einen Webserver auf den wir in einem Browser unter `http://127.0.0.1:8083/` zugreifen k√∂nnen. Er zeigt uns eine Webseite mit einem interaktiven Diagramm welches die Wetterdaten anzeigt.

![](images/wetter.png)