# Datentypen

<figure class="mj-tile-band">
<img src='images/02c_Datentypen/mj_title_band.jpg'>
<figcaption>Midjourney: Datatype Jungle, ref. Henri Rousseau</figcaption>
</figure>

> The definition of ‚Äòinsanity‚Äô in programming is doing the same thing over and over again and expecting different data types
> 
> ‚Äî Linus Torvalds

## <a href="../lec_slides/02c_Datentypen.slides.html">Folien</a>/<a href="../pdf/slides/02c_Datentypen.pdf">PDF</a>
<iframe src="../lec_slides/02c_Datentypen.slides.html" width="750" height="500"></iframe>

## Variablen in Python

Fast alle Programmiersprachen benutzen Variablen, um Werte abzuspeichern. Eine Variable ist dabei eine Zuweisung eines Wertes zu einem Namen. Intern verweist dieser Name dann auf die Speicheradresse im Arbeitsspeicher des Programmes, wo der Wert gespeichert ist. Dadurch kann man bei der Programmierung mit dem Namen der Variable arbeiten, ohne sich um die genaue Speicheradresse k√ºmmern zu m√ºssen.

<div class="alert alert-block alert-success">
    <b>üìò Definition: Variable</b><br/>
    Bei der Programmierung ist eine Variable ein Wert, der bei der Ausf√ºhrung eines Computerprogramms auftritt und meist ver√§ndert werden kann. Eine Variable wird normalerweise im Quelltext durch einen Namen bezeichnet, hat einen Datentypen und eine Adresse im Speicher des Computers.
</div>

Neben Variablen gibt es auch Konstanten.  In den meisten compilierten Programmiersprachen gibt es spezielle Syntax, um Konstanten zu definieren, da diese direkt in den Programmcode hinterlegt werden und nicht im Arbeitsspeicher des Programmes. 

<div class="alert alert-block alert-success">
    <b>üìò Definition: Konstante</b><br/>
    Eine Konstante ist ein Wert, der nicht ver√§ndert werden kann, nachdem er einmal zugewiesen wurde.
</div>

In Python gibt es keine speziellen Konstanten, aber es ist √ºblich, Variablen, die als Konstanten verwendet werden sollen, in Gro√übuchstaben zu schreiben, um sie von normalen Variablen zu unterscheiden. Sowohl Konstanten als auch Variablen haben einen Datentyp, der angibt, welche Art von Wert sie speichern k√∂nnen.

<div class="alert alert-block alert-success">
    <b>üìò Definition: Datentyp</b><br/>
    Der Datentyp einer Variable bestimmt den Typ des Wertes, der in der Variable gespeichert ist und welche Operationen auf diesem ausgef√ºhrt werden k√∂nnen. Z.B. ob es sich um eine Zahl, einen Text oder eine Liste handelt.
</div>

Der Datentyp einer Variable wird in Python automatisch bestimmt, wenn der Wert zugewiesen wird. Deshalb nennt man Python auch eine *dynamisch typisierte* Sprache. Das hei√üt, dass wir den Datentypen einer Variable nicht vorher festlegen m√ºssen, sondern er dynamisch durch Zuweisung eines Wertes zur Variable festgelegt wird.  In anderen Programmiersprachen muss der Datentyp einer Variable oft explizit deklariert werden, bevor der Wert zugewiesen wird. Diese nennt man auch *statisch typisierte* Sprachen. Sie gelten als sicherer und fehlerfreier, da der Datentyp einer Variable bereits zur Compile-Zeit √ºberpr√ºft wird. 

Eine Zuweisung geschieht durch den '=' Operator auf dessen linker Seite immer der Variablenname steht und rechts der Wert, der zugewiesen werden soll. In Python k√∂nnen Variablen beliebige Namen haben, solange sie den Regeln f√ºr Bezeichner entsprechen. Ein Bezeichner darf nur Buchstaben, Ziffern und Unterstriche enthalten, darf nicht mit einer Ziffer beginnen und darf keine reservierten Schl√ºsselw√∂rter der Programmiersprache verwenden.

In [None]:
nummer = 1  # variablenname = wert

Der Wert einer Variable kann mit `print(variablenname)` angezeigt werden

In [None]:
print(nummer)

In einem Notebook, wie diesem, wird automatisch auf die letzte Code-Zeile in einem Code-Block ein `print()` angewendet. Also k√∂nnen wir auch schreiben

In [None]:
nummer

Grunds√§tzlich sollte man bei der Benennung von Variablen darauf achten, dass sie aussagekr√§ftig sind und den Inhalt der Variable beschreiben. Das erleichtert das Verst√§ndnis des Codes und die Wartung des Programms. Es gibt hierbei einige Regeln

* Verwenden Sie Namen, die die Bedeutung und den Inhalt der Variablen klar vermitteln.
* Vermeiden Sie √ºberm√§√üig generische Namen wie "Daten" oder "v".
* Halten Sie die Namenskonventionen in Ihrem Code konsistent.
* Verwenden Sie Kleinbuchstaben mit Unterstrichen (_) zur Trennung von W√∂rtern (Snake Case), z.B. `meine_variable`.
* Vermeiden Sie Sonderzeichen wie √§, √∂, √º, √ü da diese in der Zeichenkodierung Probleme verursachen k√∂nnen.
* Verwenden Sie keine reservierten Schl√ºsselw√∂rter der Programmiersprache als Variablennamen (z.B. `if`, `for`, `while`).
* Vermeiden Sie Abk√ºrzungen oder Akronyme, es sei denn, sie sind allgemein verst√§ndlich (z.B. "BIP").
* Streben Sie nach einem Gleichgewicht zwischen Klarheit und K√ºrze.

Hier sind einige Beispiele f√ºr gute und schlechte Variablennamen:

Gut          | Schlecht | Beschreibung
-------------|----------|-----------------------------------------------
age          | a        | Steht eindeutig f√ºr das Alter einer Person.
first_name   | fn       | Beschreibt eindeutig den Vornamen.
birth_year   | by       | Eindeutig und verst√§ndlich f√ºr das Geburtsjahr.
email_address| email    | Verdeutlicht, dass es sich um eine E-Mail-Adresse handelt.
is_on        | on       | `is_` zeigt, dass es sich um einen Wahrheitswert handelt.
product_list | products | Macht deutlich, dass es sich um eine Liste handelt.
score_total  | score    | Zeigt, dass es sich um die Gesamtsumme handelt.
user_count   | count    | Gibt an, dass es sich um die Anzahl der Nutzer handelt.

## Datentypen

Es gibt verschiedene Datentypen, die in Python und in Programmiersprachen allgemein verwendet werden k√∂nnen. Man unterscheidet einfache und zusammengesetzte Datentypen. Einfache Datentypen (Primitive Datentypen) k√∂nnen nur einen Wert des entsprechenden Wertebereichs aufnehmen. Zusammengesetzte Datentypen (Komplexe Datentypen) sind ein Datenkonstrukt, welches aus einfacheren Datentypen besteht. Da sie theoretisch beliebig komplex werden k√∂nnen, werden sie auch h√§ufig schon zu den Datenstrukturen gez√§hlt.

![](images/02c_Datentypen/datentyp1.svg){width=250px}

Der Datentyp einer Variable wird mit `type(variablenname)` bestimmt und mit `print(type(variablenname))` ausgegeben.

In [None]:
print(type(nummer)) # in einem program nutzt man die print() funktion um eine ausgabe zu erzeugen

Da Python eine dynamisch typisierte Sprache ist, k√∂nnen wir den Datentyp einer Variable durch eine neue Zuweisung einfach √§ndern.

In [None]:
nummer = 2     # die Variable nummer hat jetzt den Wert 2, was immer noch numerisch ist
print("Wert: ", nummer, "\nDatentyp: ", type(nummer))

In [None]:
nummer = "text" # text ist kein numerischer Wert sondern ein Text-String
print("Wert: ", nummer, "\nDatentyp: ", type(nummer))

### Numerische Datentypen

Numerische Datentypen sind Datentypen, die zur Darstellung und Verarbeitung von Zahlen verwendet werden. Sie bilden die Grundlage f√ºr mathematische Berechnungen in Programmiersprachen. Zu den numerischen Datentypen z√§hlen ganze Zahlen (Integer), Gleitkommazahlen (Float) und komplexe Zahlen.

- **Ganze Zahlen (Integer):** Sie repr√§sentieren Zahlen ohne Nachkommastellen, sowohl positive als auch negative Werte. In vielen Programmiersprachen gibt es verschiedene Varianten, die sich durch ihre Speicherkapazit√§t unterscheiden, wie z.B. Short, Int oder Long.

- **Gleitkommazahlen (Float):** Diese Datentypen werden verwendet, um Zahlen mit Dezimalstellen darzustellen. Sie erm√∂glichen die Darstellung von Br√ºchen und sehr gro√üen oder sehr kleinen Zahlen durch eine wissenschaftliche Notation.

Die genaue Bezeichnung und Gr√∂√üe der numerischen Datentypen kann je nach Programmiersprache variieren. In Python werden numerische Werte automatisch dem passenden Typ zugeordnet, ohne dass der Programmierer die Gr√∂√üe oder das Vorzeichen explizit angeben muss.

![](images/02c_Datentypen/datentyp2.svg){width=500px}

Python unterscheidet intern nur zwischen `int` (Integer) und `float` (Gleitkommazahl). Es gibt keine speziellen Datentypen f√ºr Short, Long oder Double wie in anderen Programmiersprachen. Der Vorteil von Python als dynamisch typisierte Programmiersprache ist, dass Python intern die passende Repr√§sentation w√§hlt. Man kann also z.B. auch problemlos sehr lange Integer Werte speichern, welche in den meisten typisierten Sprachen nicht verarbeitet werden k√∂nnten, da die Zahl zu gro√ü ist. Dies ist insbesondere bei Berechnungen mit sehr gro√üen Zahlen (wie Multiplikation) sehr hilfreich, da dabei keine √úberl√§ufe passieren k√∂nnen, wenn die Ergebnisse den Zahlenbereich √ºberschreiten.

In [None]:
nummer = 3.14  # die Variable nummer hat jetzt den Wert 3.14, was eine Gleitkommazahl ist
print("Wert: ", nummer, "\nDatentyp: ", type(nummer))

In [None]:
nummer = 1232321361278362746384633213232142142131231312323123212132313231332132312 # die Variable nummer hat jetzt einen sehr langen Integer Wert
print("Wert: ", nummer, "\nDatentyp: ", type(nummer))

### Boolesche Datentypen

In allen Programmiersprachen gibt es boolesche Datentypen, um Wahrheitswerte auszudr√ºcken und logische Operationen auszuf√ºhren.


![](images/02c_Datentypen/datentyp4.svg){width=450px}


In Python gibt es den Datentyp `bool` und die Wahrheitswerte `True` und `False` f√ºr Wahr und Falsch. Zu beachten ist hierbei die Gro√üschreibung des Anfangsbuchstaben, da diese zwischen den Programmierspachen sehr stark variieren kann.

In [None]:
richtigoderfalsch = True
print("Wert: ", richtigoderfalsch, "\nDatentyp: ", type(richtigoderfalsch))

Die Variable `richtigoderfalsch` hat den Datentypen `bool`.

Die komplette Gro√üchreibung oder Kleinschreibung des Wahrheitswertes `True` ist z.B. nicht erlaubt.

In [None]:
richtigoderfalsch = TRUE

Bei einem Fehler wird der Code nicht ausgef√ºhrt also hat sich auch der Wert der Variable nicht ge√§ndert

In [None]:
print(richtigoderfalsch)

### Textuelle Datentypen

Textuelle Datentypen werden verwendet, um Buchstaben und Zeichenfolgen darzustellen. Ein einzelnes Zeichen wird als Char bezeichnet, w√§hrend eine Folge von mehreren Zeichen als String bezeichnet wird. Strings k√∂nnen auch als zusammengesetzte Datentypen betrachtet werden, da sie aus mehreren Zeichen bestehen.

![](images/02c_Datentypen/datentyp6.svg){width=450px}

Python unterscheidet zwischen Char und Strings nicht. F√ºr beide gibt es den Datentyp `str`. Ein String ist eine Zeichenkette, die aus einer beliebigen Anzahl von Zeichen besteht. Strings werden in Python in Anf√ºhrungszeichen gesetzt, entweder in einfachen (`'`) oder in doppelten (`"`) Anf√ºhrungszeichen.

In [None]:
zeichen = 'a'
print("Wert: ", zeichen, "\nDatentyp: ", type(zeichen))

In [None]:
zeichenkette = 'hallo welt'
print("Wert: ", zeichenkette, "\nDatentyp: ", type(zeichenkette))

Python unterscheidet diese Datentypen nicht und nutzt f√ºr beide den Datentyp `str`.

Das Zeichen ist in Python einfach ein `str` mit der L√§nge 1. Wir bestimmen die L√§nge mit der `len()` Funktion.

In [None]:
print(len(zeichen))

In [None]:
print(len(zeichenkette))

In Python kann eine Zeichenkette (String) im Code mit einfachen `'` oder doppelten `"` Anf√ºhrungszeichen geschrieben werden. Je nach dem welches Anf√ºhrungszeichen muss die Zeichenkette auch mit dem gleichen Anf√ºhrungszeichen beendet werden. Dies hat den Vorteil, dass sich verschachtelte Anf√ºhrungszeichen nicht extra kodiert (escaped) werden m√ºssen.

In [None]:
zeichenkette = "hallo 'welt'"
print("Wert: ", zeichenkette, "\nDatentyp: ", type(zeichenkette))

Sollte eine Kodierung (Escaping) notwendig sein, so geschieht sie in Python mit `\`. Also geht die alternative Schreibweise 

In [None]:
zeichenkette = 'hallo \'welt\''
print("Wert: ", zeichenkette, "\nDatentyp: ", type(zeichenkette))

Python hat auch einige besonders einfache Syntaxzucker. Zum Beispiel kann man Formatierte Zeichenketten einfach erzeugen, indem wir ein `f` vor die Zeichenkette schreiben. In dem String kann man dann direkt Variablenwerte schreiben mit `{variablenname}` die dann in der Zeichenketten vor Ausgabe ersetzt werden.

In [None]:
zeichenkette = f"der wert von nummer ist '{nummer}'"
print("Wert: ", zeichenkette, "\nDatentyp: ", type(zeichenkette))

### Bin√§re Datentypen

Im Computer werden alle Daten *bin√§r* gespeichert, also als eine Folge von 0 und 1. Hierf√ºr gibt es in Programmiersprachen spezifische bin√§re Datentypen, die es erm√∂glichen, Daten in dieser Form zu repr√§sentieren, ohne sie in andere Formate umzuwandeln (z.B. Text, Nummern, Bool). Bin√§re Datentypen k√∂nnen damit beliebige Zeichen repr√§sentieren. Sie kommen h√§ufig vor, um komplexe Dateien wie Bilder, Videos oder CAD-Dateien zu speichern.

Da sie an sich nur eine Zeichenkette sind, k√∂nnen sie auch als String interpretiert werden. Deshalb kann man sie Python erzeugen, indem man vor einem String `b` schreibt. Das erzeugt einen bin√§ren String (auch Bytearray), dessen Datentyp in Python ist `bytes`.

In [None]:
wort = b"byte"
print("Wert: ", wort, "\nDatentyp: ", type(wort))

Der Wert eines einzelnen `Byte` in dem Bytearray ist normalerweise eine nat√ºrliche Zahl von 0 bis 255. In Python wird hierf√ºr ein ¬¥int¬¥ benutzt. Das l√§sst sich zeigen, indem man auf den Index eines einzelnen Bytes in dem Bytearray zugreift. 

In [None]:
print("Wert: ", wort[0], "\nDatentyp: ", type(wort[0]))

### Sequenzen

Sequenzen sind eine geordnete Abfolge an Werten. Sequenzen werden in Programmiersprachen meist als `Array` bezeichnet. `Array` haben oft eine feste, unver√§nderliche L√§nge und nur Werte von einem Datentyp, der bei der Erzeugung definiert wird. Die Werte in dem Array sind allerdings ver√§nderlich.

Listen sind ein weiterer typischer Datentyp f√ºr Sequenzen. Listen haben oft keine feste L√§nge und k√∂nnen beliebig erweitert werden.

![](images/02c_Datentypen/datentyp10.svg){width=450px}


Python unterst√ºtzt den Datentyp `Array` nicht, sondern nur Listen (`list`) und Tupel (`tuple`). Beide k√∂nnen unterschiedliche Datentypen enthalten. `list` werden durch eckige Klammern deklariert, mit den einzelnen Werten die durch Komma getrennt werden. Diese Werte k√∂nnen unterschiedliche Datentypen haben.

In [None]:
liste = [1, 2, 3, "a", True]
print("Wert: ", liste, "\nDatentyp: ", type(liste))

Einzelne Werte in einer Liste k√∂nnen √ºberschrieben werden. Dazu kann man auf einzelne Indexe in der Liste zugreifen.

In [None]:
liste[1] = "anders"
print("Wert: ", liste)

Listen k√∂nnen modifiziert werden und dadurch ihre L√§nge √§ndern (weshalb sie keine Arrays sind). Um ein neuen Wert an die Liste anzuh√§ngen kann die `append()`-Funktion der Liste genutzt werden.

In [None]:
liste.append(False)
print("Wert: ", liste)

Die L√§nge der Liste kann mit der Funktion `len()` bestimmen.

In [None]:
print(len(liste))

`tuple` haben im Vergleich zu Listen eine feste L√§nge in Python. Da sie unterschiedliche Datentypen enthalten k√∂nnen, sind sie auch keine Arrays.


In [None]:
tuple = (1,2,3,"a", True)
print("Wert: ", tuple, "\nDatentyp: ", type(tuple))

`tuple` sind im Gegensatz zu Listen unver√§nderlich (*immutable*).

In [None]:
tuple[0]=True
print(tuple)

Zus√§tzlich gibt es den besonderen Datentyp `range` um Sequenz von ganzen Zahlen zu erzeugen. Sie werden mit der Funktion `range` erzeugt.

In [None]:
zahlenfolge = range(1,10)
print("Wert: ", zahlenfolge, "\nDatentyp: ", type(zahlenfolge))

Um auf ein Element zuzugreifen wird die Elementzahl in eine eckige Klammer geschrieben. In Python wird der Index in einer Liste ab 0 gez√§hlt (ab 1 in einigen Programmiersprachen).

In [None]:
print( liste[0] ) # gibt das erste Element aus
print( liste[1] ) # printed das zweite Element aus

Eine Besonderheit in Python ist, dass auch negative Indizes erlaubt sind um das Ende von Listen zuzugreifen (sowas nennt man unter Programmierern *Syntaxzucker*).

In [None]:
print( liste[-1] )             # gibt das letzte Element aus
print( liste[len(liste)-1] )   # w√§re die √ºbliche umst√§ndliche Variante das letze Elemente auszugeben √ºber die L√§nge len(x)

In Python kann auch auf Listenteile zugegriffen werden durch Slicing. Das kann man nutzen, um Teillisten zu erzeugen.

In [None]:
print(liste[0:10]) # greift auf die ersten zehn Element zu (ohne 10)
print(liste[:10])  # greift auch auf die ersten zehn Element zu (ohne 10)
print(liste[-10:]) # greift auf die letzten zehn Element zu

### Mengen

Mengen stellen eine Gruppe an Werten ohne Wiederholungen dar, so wie in der Mathematik.

![](images/02c_Datentypen/datentyp11.svg){width=450px}

Der Datentyp f√ºr Mengen in Python hei√üt `set`. Sie werden durch geschweifte Klammern deklariert.

In [None]:
menge = {1, 2, 3}
print(menge)
print(type(menge))

Mengen kann man gut nutzen, um z.B. alle einzigartigen Werte in einer Liste mit Wiederholungen zu finden wie aus einer Namensliste. 

In [None]:
listemitwiederholung = list([1,2,2,2,2,2,3])
menge = set(listemitwiederholung)
print("Wert: ", menge, "\nDatentyp: ", type(menge))

Ein andere wichtige Anwendung von Sets ist, um zu pr√ºfen ob ein Element in dem Set ist. Dies kann man mit dem Schl√ºsselwort `in` machen

In [None]:
1 in menge

Das geht genauso bei der Liste ist allerdings langsamer, insbesondere wenn die Liste sehr gro√ü ist (>> 1000 L√§nge).

In [None]:
1 in listemitwiederholung

### W√∂rterb√ºcher

W√∂rterb√ºcher werden in vielen Programmiersprachen genutzt, um Schl√ºssel-Wert-Paare zu verwalten, wie zum Beispiel die Eigenschaften und ihre Werte eines Datenobjektes.
W√∂rterb√ºcher bilden mathematisch eine Abbildung von einer Menge an Schl√ºsseln auf eine Menge an Werte dar (Key-Value). Die Menge der Schl√ºssel darf keine Wiederholung aufweisen, die Menge der Werte schon.

![](images/02c_Datentypen/datentyp11.svg){width=450px}


W√∂rterb√ºcher werden in den meisten Programmiersprachen als Map (von engl. Mapping = Abbildung) bezeichnet. In Python werden sie als `dict` bezeichnet. Sie werden durch geschweifte Klammern und Schl√ºssel/Wert-Paaren definiert.

In [None]:
haus = {
  "Geb√§udetyp": "Wohnhaus", 	
  "Baujahr": 2022
}
print("Wert: ", haus, "\nDatentyp: ", type(haus))

Neue Werte k√∂nnen den W√∂rterb√ºchern hinzugef√ºgt werden, indem man einem Schl√ºssel als Index einen Wert zuweist.

In [None]:
haus['Material'] = "Stein"
print("Wert: ", haus, "\nDatentyp: ", type(haus))

Auch hier kann man testen, ob ein Element im `dict` ist.

In [None]:
'Material' in haus

Werte k√∂nnen √ºber den Index auch gel√∂scht werden mit dem Schl√ºsselwort `del`.

In [None]:
del haus['Material']
print("Wert: ", haus, "\nDatentyp: ", type(haus))

### Null-Werte

In vielen Programmiersprachen gibt es auch einen Wert, um einen fehlenden Wert darzustellen, z.B. wenn etwas nicht da ist. 

![](images/02c_Datentypen/datentyp12.svg){width=450px}



Der Null-Wert in Python hei√üt `None` und sein Datentyp ist `NoneType`.

In [None]:
noch_kein_wert = None
print("Wert: ", noch_kein_wert, "\nDatentyp: ", type(noch_kein_wert))

Der `None` Wert wird oft genutzt, um zum Beispiel zu markieren, dass eine Variable zwar existiert, aber noch kein Wert zugewiesen wurde.

<div class="alert alert-block alert-warning">

Der Null-Wert ist in der Informatik umstritten, da er zu Fehlern f√ºhren kann, wenn Programmiersprachen ihn sehr oft benutzen (wie Java). Einige moderne Programmiersprachen haben ihn deshalb abgeschafft. 

Das Problem ist, dass man nicht unterscheiden kann, ob etwas `None` - nicht definiert - oder `None` - als Null definiert - ist.

Das passiert auch in Python. Die `get()` Funktion eines `dict` gibt z.B. den Wert f√ºr ein Schl√ºssel im W√∂rterbuch und `None` wenn dieser nicht vorhanden ist.

</div>

In [None]:
print(haus.get('schluessel_fehlt'))

Allerdings kann man auch `None` einem Wert im Dictionary zuweisen.

In [None]:
haus['ist_none'] = None
print(haus.get('ist_none'))

In beiden F√§llen gibt die `get()` Funktion `None` zur√ºck und k√∂nnen nicht mehr direkt unterscheiden, ob der Wert nicht da ist oder mit `None` belegt ist.

## Modifizierbarkeit (Mutability)

Grunds√§tzlich unterscheidet man in Programmiersprachen zwischen ver√§nderlichen (*mutable*) und unver√§nderlichen (*immutable*) Datentypen. 

<div class="alert alert-block alert-success">
    <b>üìò Definition: Mutability</b><br/>
Modifizierbarkeit beschreibt die Ver√§nderbarkeit von Datenstrukturen.

- Ist ein Datentyp *mutable* k√∂nnen Variablen von diesem Typ direkt ver√§ndert werden.
- Ist er *immutable* kann man diese nur durch eine komplette Neubelegung ver√§ndern.
</div>

Um Programmierfehler zu verhindern und Zugriffssicherheit (Datenschutz) zu gew√§hrleisten, unterscheiden einige Programmiersprachen sehr strikt zwischen mutable und  immutable Datentypen.

| Mutabel (√§nderbar) | Immutabel (nicht √§nderbar) |
|--------------------|----------------------------|
| `list`             | `tuple`                    |
| `set`              | `frozenset`                |
| `dict`             | `frozendict`               |
| `bytearray`        | `bytes`                    |

<div class="vslide">
  <div class="vslide-title">
    <p style="font-family: Protomolecule; font-size: 2.3em; line-height: 90%; margin: 0px auto; text-align: center; width: 100%;"><span style="letter-spacing: .04rem;">programmierung</span><br><span style="letter-spacing: .0rem;">und datenbanken</span></p>
<p class="author" style="font-family: Protomolecule; margin: 0px auto;  text-align: center; width: 100%; font-size: 1.2em;">Joern Ploennigs</p>
<p class="subtitle" style="font-family: Protomolecule; margin: 1em auto; text-align: center; width: 100%; font-size: 1.2em;">Datentypen</p>
    <figcaption>Midjourney: Datatype Jungle, ref. Henri Rousseau</figcaption>
  </div>
<script>
  function setSectionBackground(c,v){
    let e=document.currentScript.previousElementSibling;
    while(e&&e.tagName!=='SECTION')e=e.parentElement;
    if(e){
      if(c)e.setAttribute('data-background-color',c);
      if(v){
        e.setAttribute('data-background-video',v);
        e.setAttribute('data-background-video-loop','true');
        e.setAttribute('data-background-video-muted','true');
      }
    }
  }
  setSectionBackground('#000000', 'images/02c_Datentypen/mj_title.mp4');
</script>
<style>
.flex-row{display:flex; gap:2rem; align-items:flex-start; justify-content:space-between;}
.flex-row .col1{flex:1; min-width:10px}
.flex-row .col2{flex:2; min-width:10px}
.flex-row .col3{flex:3; min-width:10px}
.flex-row .col4{flex:4; min-width:10px}
.flex-row .col5{flex:5; min-width:10px}
.flex-row .col6{flex:6; min-width:10px}
.flex-row .col7{flex:7; min-width:10px}
.vcent{display:flex; align-items:center; justify-content:center}
</style>
</div>

## Ablauf

![](images/partA_3.svg)

## Variablen

<div class="alert alert-block alert-success">
<b>üìò Definition: Variablen</b>

Bei der Programmierung ist eine Variable ein Wert, der bei der Ausf√ºhrung eines Computerprogramms auftritt und meist ver√§ndert werden kann. Eine Variable wird normalerweise im Quelltext durch einen Namen bezeichnet, hat einen Datentypen und eine Adresse im Speicher des Computers.
</div>

<div class="alert alert-block alert-success">
<b>üìò Definition: Konstante</b>

Eine Konstante ist ein Wert, der nicht ver√§ndert werden kann, nachdem er einmal zugewiesen wurde.
</div>



## Variablen in Python

Variablen in Python m√ºssen nicht explizit deklariert werden (wie in vielen anderen Programmiersprachen), sondern werden durch Zuweisungsoperator (=) einem Wert zugeordnet.

Beispiel:
```python
a = 1  # a hat den Wert 1

a = 2 # a hat nun den Wert 2

a = "test" # a hat nun den Wert "test" 
```

Der Typ einer Variable kann mit der Funktion type(a) abgefragt werden.


## Variablennamen

* Verwenden Sie Namen, die die Bedeutung und den Inhalt der Variablen klar vermitteln.
* Vermeiden Sie √ºberm√§√üig generische Namen wie "Daten" oder "v".
* Halten Sie die Namenskonventionen in Ihrem Code konsistent.
* Verwenden Sie Kleinbuchstaben mit Unterstrichen (_) zur Trennung von W√∂rtern (Snake Case), z.B. `meine_variable`.
* Vermeiden Sie Sonderzeichen wie √§, √∂, √º, √ü da diese in der Zeichenkodierung Probleme verursachen k√∂nnen.
* Verwenden Sie keine reservierten Schl√ºsselw√∂rter der Programmiersprache als Variablennamen (z.B. `if`, `for`, `while`).
* Vermeiden Sie Abk√ºrzungen oder Akronyme, es sei denn, sie sind allgemein verst√§ndlich (z.B. "BIP").
* Streben Sie nach einem Gleichgewicht zwischen Klarheit und K√ºrze.


## Beispiele f√ºr gut und schlechte Variablennamen

| Gut          | Schlecht | Beschreibung                                          |
|--------------|----------|-------------------------------------------------------|
| age          | a        | Steht eindeutig f√ºr das Alter einer Person.          |
| first_name   | fn       | Beschreibt eindeutig den Vornamen.                   |
| birth_year   | by       | Eindeutig und verst√§ndlich f√ºr das Geburtsjahr.      |
| email_address| email    | Verdeutlicht, dass es sich um eine E-Mail-Adresse handelt. |
| is_on        | on       | `is_` zeigt, dass es sich um einen Wahrheitswert handelt. |
| product_list | products | Macht deutlich, dass es sich um eine Liste handelt.  |
| score_total  | score    | Zeigt, dass es sich um die Gesamtsumme handelt.      |
| user_count   | count    | Gibt an, dass es sich um die Anzahl der Nutzer handelt. |


## Datentyp

<div class="alert alert-block alert-success">
<b>üìò Definition: Datentyp</b>

Der Datentyp gibt die Art der Daten an, die mit ihm beschrieben werden und welche Operationen auf diesen ausgef√ºhrt werden k√∂nnen.
</div>

## Datentypen - Struktur

<div class="flex-row">
<div class="col1">

- Einfache Datentypen (Primitive Datentypen) k√∂nnen nur einen Wert des entsprechenden Wertebereichs aufnehmen.

- Zusammengesetzte Datentypen (Komplexe Datentypen) sind ein Datenkonstrukt, das sich aus einfacheren Datentypen zusammensetzt. Da sie theoretisch beliebig komplex werden k√∂nnen, werden sie auch h√§ufig schon zu den Datenstrukturen gez√§hlt.

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp1.svg)

</div>
</div>

## Einfache Datentypen - Numerisch

<div class="flex-row">
<div class="col1">

- Numerische Datentypen repr√§sentieren Zahlen.

- Ganze und Nat√ºrliche Zahlen werden als signed und unsigned Integer abgebildet. Nach Speicherkapazit√§t unterscheidet man
    - Short Integer (8 Bit), 
    - Integer (32 Bit) und 
    - Long (64 Bit).

- Reelle Zahlen werden als Gleitkommazahl 
    - Float (32 Bit) oder 
    - Double (64  Bit) abgebildet.

- Diese Varianten werden in verschiedenen Programmiersprachen unterschiedlich bezeichnet.

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp2.svg)

</div>
</div>

## Einfache Datentypen ‚Äì Numerisch in Python

<div class="flex-row">
<div class="col1">

- Ganze und Nat√ºrliche Zahlen werden in Python als Integer `int` abgebildet und nicht unterschieden.

- Reelle Zahlen werden als Gleitkommazahl `float` abgebildet.

- **Info**: Cython, eine typisierte Variante von Python die nach C compiliert wird (also nicht interpretiert) unterscheidet zwischen `(signed) short/int/long` Typen und `float/double` um schneller zu laufen.

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp3.svg)

</div>
</div>

## Einfache Datentypen - Logische

<div class="flex-row">
<div class="col1">

- Logische Datentypen repr√§sentieren bin√§re Werte wie Wahr oder Falsch.

- Wahrheitswerte werden als boolesche Werte bezeichnet.

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp4.svg)

</div>
</div>

##  Einfache Datentypen ‚Äì Logische in Python

<div class="flex-row">
<div class="col1">

- In Python werden boolesche (bin√§re) Werte als `bool` bezeichnet.

- Der Wert ‚ÄûWahr" wird in Python als `True` geschrieben und ‚ÄûFalsch" als `False`.

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp5.svg)

</div>
</div>

## Einfache Datentypen - Textuell

<div class="flex-row">
<div class="col1">

- Textuelle Datentypen repr√§sentieren Buchstaben.

- Einzelne textuelle Zeichen werden als Char bezeichnet.

- Mehrere textuelle Zeichen werden als String bezeichnet (Sie werden z. T. auch zu den zusammengesetzten Datentypen gez√§hlt).

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp6.svg)

</div>
</div>

## Einfache Datentypen ‚Äì Textuell in Python

<div class="flex-row">
<div class="col1">

- Einzelne textuelle Zeichen werden in Python als `str` mit der L√§nge 1 abgebildet. 

- Mehrere textuelle Zeichen werden in Python als `str` definiert.

- Ein `str` in Python kann mit einem `'` oder zwei `"` Anf√ºhrungsstrichen angefangen und beendet werden.

  ```python
  name = "Joern"
  name = 'Joern'
  ```

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp7.svg)

</div>
</div>

## Einfache Datentypen - Bin√§r

<div class="flex-row">
<div class="col1">

- Bin√§re Datentypen k√∂nnen beliebige Zeichen repr√§sentieren.

- Einzelne bin√§re Zeichen werden als Byte bezeichnet.

- Mehrere Zeichen werden als Bytearray oder Bytestring bezeichnet (Sie werden z.T. auch zu den zusammengesetzten Datentypen gez√§hlt).

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp8.svg)

</div>
</div>

## Einfache Datentypen ‚Äì Bin√§r in Python

<div class="flex-row">
<div class="col1">

- Bin√§re Datentypen k√∂nnen beliebige Zeichen repr√§sentieren.

- Einzelne bin√§re Zeichen werden in Python als `int` abgebildet.

- Mehrere bin√§re Zeichen werden als `bytes` bezeichnet.

- Ein bytes in Python wird als String deklariert mit einem f√ºhrendem `b`.

  ```python
  name = b"Joern"
  name = b'Joern'
  ```

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp9.svg)

</div>
</div>

## Zusammengesetzte Datentypen ‚Äì Sequenzen

<div class="flex-row">
<div class="col1">

- Sequenzen sind eine geordnete Abfolge an Werten, meist vom selben Datentyp.

- Sequenzen werden in Programmiersprachen meist als Array bezeichnet. Arrays haben oft eine feste, unver√§nderliche L√§nge, die bei der Erzeugung definiert wird. Die Werte sind ver√§nderlich.

  Beispiel in Cython:

  ```python
  cdef int a = 5 # Variablendeklaration
  cdef int a[5] = [0, 1, 2, 3, 4] #Array-Deklaration
  ```

- Listen sind ein weiterer typischer Datentyp f√ºr Sequenzen. Listen haben oft keine feste L√§nge und k√∂nnen beliebig erweitert werden.

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp10.svg)

</div>
</div>

## Zusammengesetzte Datentypen ‚Äì Sequenzen in Python

<div class="flex-row">
<div class="col1">

- Python unterst√ºtzt keine Arrays sondern nutzt `list` und `tuple`. Sie werden durch eckige oder runde Klammern deklariert.

	```python
  x = [0, 1, 2, 3, 1] # Liste
	x = (0, 1, 2, 3, 1) # Tuple
  ```

- `tuple` haben eine feste L√§nge in Python. Sie sind unver√§nderlich (immutable).

- Zus√§tzlich gibt es den besonderen Datentyp `range` um Sequenz von ganzen Zahlen zu erzeugen. 

	```python
  x = range(0,10) # Range Funktion
  ```

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp11a.svg)

</div>
</div>

## Zusammengesetzte Datentypen ‚Äì Sequenzen Zugriff auf Elemente

<div class="flex-row">
<div class="col1">

- Um auf ein Element zuzugreifen wird die Elementzahl in eine eckige Klammer geschrieben.

- In Python wird der Index in einer Liste ab 0 gez√§hlt (ab 1 in einigen Sprachen). 

  ```python
	x[0] # 1. Element
	x[1] # 2. Element
  ```

- Eine Besonderheit in Python ist dass auch negative Indizes erlaubt sind um das Ende von Listen zuzugreifen (a.k.a. Syntax-Suggar)

  ```python
	x[-1] # letzte Element
	x[len(x)‚Äì1] # alternatives Vorgehen
  ```

- In Python kann durch Slicing auch auf Listenteile zugegriffen werden

  ```python
	x[0:10] # ersten 10 Elemente (ohne 10)
	x[:10]  # ersten 10 Elemente (ohne 10)
	x[-10:] # letzten 10 Elemente
  ```

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp11a.svg)

</div>
</div>

## Zusammengesetzte Datentypen ‚Äì Mengen

<div class="flex-row">
<div class="col1">

- Mengen stellen eine Menge an Werten ohne Wiederholungen dar, so wie in der Mathematik.

- In den meisten Programmiersprachen werden Mengen als Set bezeichnet.

- Es wird h√§ufig auch zwischen Datentypen f√ºr sortierte und unsortierte Sets unterschieden.

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp11.svg)

</div>
</div>

## Zusammengesetzte Datentypen ‚Äì Mengen in Python

<div class="flex-row">
<div class="col1">

- Der Datentyp f√ºr Mengen in Python hei√üt `set`. Sie werden durch geschweifte Klammern deklariert.
  ```python
	x = {0, 1, 2, 3}
  ```

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp11b.svg)

</div>
</div>

## Zusammengesetzte Datentypen ‚Äì W√∂rterb√ºcher

<div class="flex-row">
<div class="col1">

- W√∂rterb√ºcher bilden eine Abbildung von einer Menge an Schl√ºsseln auf eine Menge an Werten (Key-Value). Die Menge der Schl√ºssel darf keine Wiederholung aufweisen, die Menge der Werte schon.

- W√∂rterb√ºcher werden in den meisten Programmiersprachen als Map (von engl. Mapping = Abbildung) bezeichnet.

- **Info**: Sets werden h√§ufig intern als Map ohne Werte gespeichert, weil Schl√ºssel keine Dopplung aufweisen d√ºrfen.
  
</div>
<div class="col1">

![](images/02c_Datentypen/datentyp11.svg)

</div>
</div>

## Zusammengesetzte Datentypen ‚Äì W√∂rterb√ºcher in Python

<div class="flex-row">
<div class="col1">

- W√∂rterb√ºcher bilden eine Abbildung einer Menge an Schl√ºsseln auf eine Menge an Werten (Key-Value).

- W√∂rterb√ºcher werden in Python als `dict` bezeichnet. Sie werden durch geschweifte Klammern und Schl√ºssel/Wert-Paaren definiert.
  ```python
  x = {
    "Geb√§udetyp": "Wohnhaus", 	
    "Baujahr": 2022
  }
  ```

- neue Werte k√∂nnen auch dynamisch zugewiesen werden:
  ```python
  x["Bauweise"] = "Holzbauweise"
  ```

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp11c.svg)

</div>
</div>

## Zusammengesetzte Datentypen ‚Äì W√∂rterb√ºcher Zugriff auf Elemente

<div class="flex-row">
<div class="col1">

- Um auf ein Element in einem `dict` zuzugreifen wird der Schl√ºssel in einer eckige Klammer geschrieben.

  ```python
  x["Baujahr"]
  ```
- Dies funktioniert nicht bei Mengen (`set`), da ja kein Wert dahinter steht, sondern nur interessant ist ob der Schl√ºssel in der Menge enthalten ist. Was man so abfragt

  ```python
  "Baujahr" in x
  ```
- Um Werte aus einem `dict` oder `set` zu entfernen, nutzt man

  ```python
  del x["Baujahr"]
  ```

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp11c.svg)

</div>
</div>

## Datentypen ‚Äì Undefinierte Werte

<div class="flex-row">
<div class="col1">

- In vielen Programmiersprachen gibt es auch einen Wert um einen undefinierten Wert darzustellen, z.B. wenn etwas nicht da ist.

- Dieser undefinierte Wert wird h√§ufig als `Null`-Wert bezeichnet.

<div class="alert alert-block alert-warning">

Die Notwendigkeit f√ºr einen Null-Wert ist heutzutage sehr umstritten, da Null-Werte schnell Fehler erzeugen. Deshalb haben einige moderne Sprachen keinen Null-Wert.

</div>
</div>
<div class="col1">

![](images/02c_Datentypen/datentyp12.svg)

</div>
</div>

## Datentypen ‚Äì Undefinierte Werte in Python

<div class="flex-row">
<div class="col1">

- Der Null-Wert in Python hei√üt `None`.

- Bedeutet dass eine Variable keinen Wert zugewiesen hat, oder eine Operation keinen Wert zur√ºck gibt.
- Der Datentyp einer Variable vom Wert `None` ist `NoneType`.

</div>
<div class="col1">

![](images/02c_Datentypen/datentyp12.svg)

</div>
</div>

## Datentypen ‚Äì Modifizierbarkeit (Mutability)

<div class="alert alert-block alert-success">
<b>üìò Definition: Mutability</b>

Modifizierbarkeit beschreibt die Ver√§nderbarkeit von Datenstrukturen.

- Ist ein Datentyp *mutable* k√∂nnen Variablen von diesem Typ direkt ver√§ndert werden.
- Ist er *immutable* kann man diese nur durch eine komplette Neubelegung ver√§ndern.

</div>

| Mutabel (√§nderbar) | Immutabel (nicht √§nderbar) |
|--------------------|----------------------------|
| `list`             | `tuple`                    |
| `set`              | `frozenset`                |
| `dict`             | `frozendict`               |
| `bytearray`        | `bytes`                    |

- Um Programmierfehler zu verhindern und Zugriffssicherheit (Datenschutz) zu gew√§hrleisten, unterscheiden einige Programmiersprachen sehr strikt zwischen mutable und  immutable Datentypen.

## Quiz


```{quizdown}
	---
	shuffleQuestions: true
	shuffleAnswers: true
	---

    ### Was sind die grundlegenden Kategorien von Datentypen?

    > Es gibt zwei Kategorien

    - [X] Einfache
    - [X] Zusammengesetzt
    - [ ] Text
    - [ ] Objekte
    - [ ] Zahlen


    ### Was sind einfache Datentypen?

    > Es gibt vier einfache Datentypen

    - [X] Numerisch
    - [X] Logisch
    - [X] Textuel
    - [X] Bin√§r
    - [ ] Sequenz
    - [ ] Mengen

    ### Was sind zusammengesetzte Datentypen?

    > Es gibt drei zusammengesetzte Datentypen

    - [ ] Ganze Zahlen
    - [ ] Textuel
    - [ ] Array
    - [X] Sequenz
    - [X] Mengen
    - [X] W√∂rterbuch

    ### Was sind numerisch Datentypen?

    > Es gibt drei numerisch Datentypen

    - [X] Ganze Zahlen
    - [ ] Halbe Zahlen
    - [X] Nat√ºrliche Zahlen
    - [ ] Unnat√ºrliche Zahlen
    - [X] Reelle Zahlen
    - [ ] Komplexe Zahlen

    ### Was sind textuelle Datentypen?

    > Es gibt zwei textuelle Datentypen

    - [ ] Ganze Zahlen
    - [X] String
    - [X] Char
    - [ ] Komplexe Zahlen
    - [ ] Blobs

    ### Was sind logische Datentypen?

    > Es gibt einen logischen Datentyp

    - [X] Boolean
    - [ ] String
    - [ ] Char
    - [ ] True/False

    ### Was sind bin√§re Datentypen?

    > Es gibt zwei bin√§re Datentypen

    - [ ] Ganze Zahlen
    - [X] Byte
    - [ ] Char
    - [X] Byte Array

    ### Welche Datentypen werden in Python mit `int` ausgedr√ºckt?

    > `int` wird f√ºr drei Datentypen benutzt

    - [X] Ganze Zahlen
    - [X] Nat√ºrliche Zahlen
    - [ ] Reelle Zahlen
    - [ ] Komplexe Zahlen
    - [X] Byte
    - [ ] Char

    ### Welche Datentypen werden in Python mit `str` ausgedr√ºckt?

    > `str` wird f√ºr zwei Datentypen benutzt

    - [X] String
    - [X] Char
    - [ ] Byte
    - [ ] Byte Array

    ### Welche Datentypen sind das?

    ```python
    variable = ["a", "b", "c"]
    ```

    > Zwei Datentypen sind richtig

    - [ ] String
    - [ ] Dict
    - [ ] Set
    - [X] List
    - [ ] Array
    - [X] Sequenz
    - [ ] Mengen
    - [ ] W√∂rterbuch

    ### Welche Datentypen sind das?

    ```python
    variable = {"a", "b", "c"}
    ```

    > Zwei Datentypen sind richtig

    - [ ] String
    - [ ] Dict
    - [X] Set
    - [ ] List
    - [ ] Array
    - [ ] Sequenz
    - [X] Mengen
    - [ ] W√∂rterbuch

    ### Welche Datentypen sind das?

    ```python
    variable = {"a":1, "b":2, "c":3}
    ```

    > Zwei Datentypen sind richtig

    - [ ] String
    - [X] Dict
    - [ ] Set
    - [ ] List
    - [ ] Sequenz
    - [ ] Mengen
    - [X] W√∂rterbuch

    ### Welche der folgenden Python-Datentypen sind **mutabel**?

    > Drei Datentypen sind richtig

    - [x] list
    - [x] set
    - [x] dict
    - [ ] tuple
    - [ ] str

    ### Welche Aussage zur Mutabilit√§t ist **korrekt**?

    - [ ] Ein `tuple` kann nach seiner Erstellung ver√§ndert werden.
    - [ ] `frozenset` ist eine mutierbare Variante von `set`.
    - [x] `bytearray` ist eine mutierbare Version von `bytes`.
    - [ ] Strings (`str`) in Python sind mutabel.


    ### Was bedeutet ‚Äûmutabel‚Äú im Kontext von Python-Datentypen?

    - [x] Der Inhalt eines Objekts kann nach der Erstellung ver√§ndert werden.
    - [ ] Das Objekt kann nicht kopiert werden.
    - [ ] Das Objekt belegt immer mehr Speicher als ein immutables Objekt.
    - [ ] Ein mutables Objekt kann nicht Teil eines Sets sein.
```

<div class="vslide">
  <div class="vslide-title">
    <p style="font-family: Protomolecule; font-size: 2.3em; margin: 0px auto; text-align: center; width: 100%;">fragen?</p>
  </div>
  <script>setSectionBackground('#000000', 'images/mj_questions.mp4');</script>
</div>