add R evaluation commands

347bbde8 · lusy · e29bb9fd · 347bbde8
Commit 347bbde8 authored 7 years ago by lusy
--- a/report/attachments/rscript.txt
+++ b/report/attachments/rscript.txt
+data = read.table("e_mail_nutzung.csv", header = TRUE, sep = ",")
+library(lattice)
+densityplot(sort(data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche., decreasing=T)[c(-1,-2)], scales=list(log=F), log="", horizontal=T)
+empfangen = sort(data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche., decreasing=T)[c(-1,-2)]
+boxplot(as.numeric(empfangen[empfangen!=0]), scales=list(log=T), log="x", horizontal=T)
+
+gelesen = data$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.
+empfangen = data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.
+
+
+
+
+#Zusammenhang zwischen empfangenen und gelesenen Mails pro Proband
+
+plot(data$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)]~data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)])
+
+
+#logartihmisch
+
+plot(data$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)]~log(data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)]))
+
+
+# Code from http://www.cookbook-r.com/Graphs/Histogram_and_density_plot/
+plot.multi.dens <- function(s)
+{
+    junk.x = NULL
+    junk.y = NULL
+    for(i in 1:length(s)) {
+        junk.x = c(junk.x, density(s[[i]])$x)
+        junk.y = c(junk.y, density(s[[i]])$y)
+    }
+    xr <- range(junk.x)
+    yr <- range(junk.y)
+    plot(density(s[[1]]), xlim = xr, ylim = yr, main = "")
+    for(i in 1:length(s)) {
+        lines(density(s[[i]]), xlim = xr, ylim = yr, col = i)
+    }
+}
+
+
+#Vergleich von empfangenen E-Mails mit gelesenen
+
+plot.multi.dens(list(data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)], data$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)]))
+
+#Vorheriges + gesendet
+
+plot.multi.dens(list(data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)], data$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)], data$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)]))
+
+
+
+#Gleiche Analyse nur mit Tekkies
+
+tekkieData = subset(data, Ich.bin.technisch.versiert.im.Bezug.auf.den.Computer=="ja")
+
+which(tekkieData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < tekkieData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.)
+
+plot.multi.dens(list(tekkieData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[tekkieData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)], tekkieData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[tekkieData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)], tekkieData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[tekkieData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)]))
+
+
+
+
+#Gleiche Analyse mit nicht Tekkies (ACHTUNG: Womöglich falsche Analyse, denn es wurde alle betrachtet, die nicht ja angegeben haben bei der Frage, ob sie technisch versiert im Umgang mit dem Computer wären)
+
+nonTekkieData = subset(data, Ich.bin.technisch.versiert.im.Bezug.auf.den.Computer!="ja")
+
+plot.multi.dens(list(nonTekkieData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche., nonTekkieData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich., nonTekkieData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.))
+
+
+
+
+#Analyse anhand des Alters
+
+
+densityplot(data$Wie.alt.sind.Sie.)
+
+
+#Grenze zwischen jünger als 40 und rest ziehen
+
+youngData = subset(data, Wie.alt.sind.Sie. <= 39)
+
+#Bereinigung der Gruppe vorbereiten
+
+which(youngData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < youngData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.)
+
+plot.multi.dens(list(youngData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[youngData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-13], youngData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[youngData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-13], youngData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[youngData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-13]))
+
+
+oldData = subset(data, Wie.alt.sind.Sie. > 39)
+
+
+plot.multi.dens(list(oldData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[oldData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-1], oldData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[oldData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-1], oldData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[oldData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-1]))
+
+
+
+
+#Vergleich von jung und alt
+
+#schreiben
+
+plot.multi.dens(list(youngData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[youngData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-13], oldData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[oldData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-1]))
+
+
+#lesen
+plot.multi.dens(list(youngData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[youngData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-13], oldData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[oldData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-1]))
+
+
+
+#Arbeit im Büro (ACHTUNG gleiches Problem wie bei Tekkies)
+
+
+officeData = subset(data, data$Arbeiten.Sie.im.Büro. == "ja")
+
+nonOfficeData = subset(data, data$Arbeiten.Sie.im.Büro. != "ja")
+
+which(officeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < officeData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.)
+
+
+
+#office
+
+plot.multi.dens(list(officeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[officeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-8,-9)], officeData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[officeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-8,-9)], officeData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[officeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-8,-9)]))
+
+#nonOffice
+
+plot.multi.dens(list(nonOfficeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[nonOfficeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000], nonOfficeData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[nonOfficeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000], nonOfficeData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[nonOfficeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000]))
+
+
+#schreiben
+
+plot.multi.dens(list(officeData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[officeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-8,-9)], nonOfficeData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[nonOfficeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000]))
+
+#lesen
+
+plot.multi.dens(list(officeData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[officeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-8,-9)], nonOfficeData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[nonOfficeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000]))