Data Science

Miguel Alvarez

kamapu.net

Data Science

  • Interdisziplinären Wissenschaftsfeld
  • Erfassung, Analyse und Visualisierung digitaler Daten

Lebenzyklus der Daten

Strategie für die Aufbewahrung und Verbendung von Daten

  • Technische Voraussetzungen
  • Zweck
  • Regelungen

Lebenzyklus der Daten

PPDAC


Nach Spiegelhalter (2018)

Datenmodellierung

  • Konzeptuelles Datenbankschema
  • Logisches Datenbankschema
  • Physisches Datenbankschema


Top-Down
Bottom-Up

erDiagram
  Bezirke {
    BezirkNr INT PK
    BezirkName CHAR
    StadtBezirk CHAR
    FlaecheKm2 DBL
  }
  Bevoelkerung {
    Id INT PK
    BezirkNr INT FK
    Jahr INT
    Gesamt INT
    DichteKm2 INT
    Maenner INT
    Frauen INT
    Zuwanderer INT
    Auslaender INT
  }
  Bezirke ||--o{ Bevoelkerung : ""

Datenmodellierung

  • Konzeptuelles Datenbankschema
  • Logisches Datenbankschema
  • Physisches Datenbankschema


Top-Down
Bottom-Up

Informationsintegration

Prozesse

  • ETL (Extract, Transform, Load)
  • ELT (Extract, Load, Transform)

Informationsintegration

Daten Umstrukturieren
Daten Umwandeln

Informationsintegration

DBMS
Datenbakmanagementsystem

Datenpipeline

targets

Siehe auch …