# Dateien Laden ----
download.file(url = "https://rstats.kamapu.net/Ressourcen/Dateien/KursDateien.zip",
              destfile = "KursDateien.zip")
unzip("KursDateien.zip", overwrite = TRUE)
unlink("KursDateien.zip")

# Daten in R laden
Bonn <- readRDS("BonnBevoelkerung.rds")

summary(Bonn)

# Anzahl von Bezirken
186/3
length(unique(Bonn$BezirkNr))

# Ein paar reihen ansehen
summary(Bonn$DichteKm2)

which(Bonn$DichteKm2 == max(Bonn$DichteKm2))
Bonn[which(Bonn$DichteKm2 == max(Bonn$DichteKm2)), ]

# Laden Infos von Bezirken
Bezirke <- readRDS("BonnBezirke.rds")
head(Bezirke)

# Daten mischen
Bonn <- merge(Bonn, Bezirke)
head(Bonn)
Bonn[which(Bonn$DichteKm2 == max(Bonn$DichteKm2)), ]

hist(Bonn$DichteKm2)

Bonn[Bonn$DichteKm2 > 15000, ]

# subset 
Bonn2021 <- subset(Bonn, Jahr == 2021)
unique(Bonn2021$Jahr)

# aggregate
aggregate(Gesamt ~ StadtBezirk + Jahr,
          data = Bonn, FUN = sum)
aggregate(Gesamt ~ Jahr + StadtBezirk,
          data = Bonn, FUN = sum)

# Frage bzgl. Berechnungen in summary
Einwohner <- aggregate(Gesamt ~ Jahr + StadtBezirk,
                       data = Bonn, FUN = sum)

Einwohner
sum(Einwohner$Gesamt[c(3,9)])

Bonn$StadtBezirk %in% c("Bonn", "Beuel") &
  Bonn$Jahr == 2021
sum(Bonn$Gesamt[Bonn$StadtBezirk %in%
                  c("Bonn", "Beuel") &
                  Bonn$Jahr == 2021])
Einwohner

aggregate(Gesamt ~ Jahr + StadtBezirk,
          data = Bonn, FUN = sum)

# Variablen berechnen
Bonn$FrauenProzent <- Bonn$Frauen/Bonn$Gesamt*100

summary(Bonn[ , c("Frauen", "FrauenProzent")])

Bonn$AuslaenderProzent <- with(Bonn, {
  Auslaender/Gesamt*100
})
summary(Bonn[,c("Auslaender", "AuslaenderProzent")])

# ggplots ----
hist(Bonn$Auslaender)
hist(Bonn$AuslaenderProzent)

library(ggplot2)

Histogramme <- ggplot(data = Bonn,
              aes(x = AuslaenderProzent)) +
  geom_histogram(bins = 10)

Histogramme +
  facet_wrap(~Jahr)

Histogramme +
  facet_wrap(~StadtBezirk + Jahr, ncol = 3)

# Boxplots
ggplot(data = Bonn, aes(x = StadtBezirk,
                        y = AuslaenderProzent,
                        fill = StadtBezirk)) +
  geom_boxplot() +
  facet_wrap(~Jahr)