# Dateien Laden ---- download.file(url = "https://rstats.kamapu.net/Ressourcen/Dateien/KursDateien.zip", destfile = "KursDateien.zip") unzip("KursDateien.zip", overwrite = TRUE) unlink("KursDateien.zip") # Daten in R laden Bonn <- readRDS("BonnBevoelkerung.rds") summary(Bonn) # Anzahl von Bezirken 186/3 length(unique(Bonn$BezirkNr)) # Ein paar reihen ansehen summary(Bonn$DichteKm2) which(Bonn$DichteKm2 == max(Bonn$DichteKm2)) Bonn[which(Bonn$DichteKm2 == max(Bonn$DichteKm2)), ] # Laden Infos von Bezirken Bezirke <- readRDS("BonnBezirke.rds") head(Bezirke) # Daten mischen Bonn <- merge(Bonn, Bezirke) head(Bonn) Bonn[which(Bonn$DichteKm2 == max(Bonn$DichteKm2)), ] hist(Bonn$DichteKm2) Bonn[Bonn$DichteKm2 > 15000, ] # subset Bonn2021 <- subset(Bonn, Jahr == 2021) unique(Bonn2021$Jahr) # aggregate aggregate(Gesamt ~ StadtBezirk + Jahr, data = Bonn, FUN = sum) aggregate(Gesamt ~ Jahr + StadtBezirk, data = Bonn, FUN = sum) # Frage bzgl. Berechnungen in summary Einwohner <- aggregate(Gesamt ~ Jahr + StadtBezirk, data = Bonn, FUN = sum) Einwohner sum(Einwohner$Gesamt[c(3,9)]) Bonn$StadtBezirk %in% c("Bonn", "Beuel") & Bonn$Jahr == 2021 sum(Bonn$Gesamt[Bonn$StadtBezirk %in% c("Bonn", "Beuel") & Bonn$Jahr == 2021]) Einwohner aggregate(Gesamt ~ Jahr + StadtBezirk, data = Bonn, FUN = sum) # Variablen berechnen Bonn$FrauenProzent <- Bonn$Frauen/Bonn$Gesamt*100 summary(Bonn[ , c("Frauen", "FrauenProzent")]) Bonn$AuslaenderProzent <- with(Bonn, { Auslaender/Gesamt*100 }) summary(Bonn[,c("Auslaender", "AuslaenderProzent")]) # ggplots ---- hist(Bonn$Auslaender) hist(Bonn$AuslaenderProzent) library(ggplot2) Histogramme <- ggplot(data = Bonn, aes(x = AuslaenderProzent)) + geom_histogram(bins = 10) Histogramme + facet_wrap(~Jahr) Histogramme + facet_wrap(~StadtBezirk + Jahr, ncol = 3) # Boxplots ggplot(data = Bonn, aes(x = StadtBezirk, y = AuslaenderProzent, fill = StadtBezirk)) + geom_boxplot() + facet_wrap(~Jahr)