Skip to content
Snippets Groups Projects
Commit 347bbde8 authored by lusy's avatar lusy
Browse files

add R evaluation commands

parent e29bb9fd
No related branches found
No related tags found
No related merge requests found
data = read.table("e_mail_nutzung.csv", header = TRUE, sep = ",")
library(lattice)
densityplot(sort(data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche., decreasing=T)[c(-1,-2)], scales=list(log=F), log="", horizontal=T)
empfangen = sort(data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche., decreasing=T)[c(-1,-2)]
boxplot(as.numeric(empfangen[empfangen!=0]), scales=list(log=T), log="x", horizontal=T)
gelesen = data$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.
empfangen = data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.
#Zusammenhang zwischen empfangenen und gelesenen Mails pro Proband
plot(data$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)]~data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)])
#logartihmisch
plot(data$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)]~log(data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)]))
# Code from http://www.cookbook-r.com/Graphs/Histogram_and_density_plot/
plot.multi.dens <- function(s)
{
junk.x = NULL
junk.y = NULL
for(i in 1:length(s)) {
junk.x = c(junk.x, density(s[[i]])$x)
junk.y = c(junk.y, density(s[[i]])$y)
}
xr <- range(junk.x)
yr <- range(junk.y)
plot(density(s[[1]]), xlim = xr, ylim = yr, main = "")
for(i in 1:length(s)) {
lines(density(s[[i]]), xlim = xr, ylim = yr, col = i)
}
}
#Vergleich von empfangenen E-Mails mit gelesenen
plot.multi.dens(list(data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)], data$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)]))
#Vorheriges + gesendet
plot.multi.dens(list(data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)], data$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)], data$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[data$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)]))
#Gleiche Analyse nur mit Tekkies
tekkieData = subset(data, Ich.bin.technisch.versiert.im.Bezug.auf.den.Computer=="ja")
which(tekkieData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < tekkieData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.)
plot.multi.dens(list(tekkieData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[tekkieData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)], tekkieData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[tekkieData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)], tekkieData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[tekkieData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-13,-14)]))
#Gleiche Analyse mit nicht Tekkies (ACHTUNG: Womöglich falsche Analyse, denn es wurde alle betrachtet, die nicht ja angegeben haben bei der Frage, ob sie technisch versiert im Umgang mit dem Computer wären)
nonTekkieData = subset(data, Ich.bin.technisch.versiert.im.Bezug.auf.den.Computer!="ja")
plot.multi.dens(list(nonTekkieData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche., nonTekkieData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich., nonTekkieData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.))
#Analyse anhand des Alters
densityplot(data$Wie.alt.sind.Sie.)
#Grenze zwischen jünger als 40 und rest ziehen
youngData = subset(data, Wie.alt.sind.Sie. <= 39)
#Bereinigung der Gruppe vorbereiten
which(youngData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < youngData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.)
plot.multi.dens(list(youngData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[youngData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-13], youngData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[youngData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-13], youngData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[youngData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-13]))
oldData = subset(data, Wie.alt.sind.Sie. > 39)
plot.multi.dens(list(oldData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[oldData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-1], oldData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[oldData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-1], oldData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[oldData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-1]))
#Vergleich von jung und alt
#schreiben
plot.multi.dens(list(youngData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[youngData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-13], oldData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[oldData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-1]))
#lesen
plot.multi.dens(list(youngData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[youngData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-13], oldData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[oldData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][-1]))
#Arbeit im Büro (ACHTUNG gleiches Problem wie bei Tekkies)
officeData = subset(data, data$Arbeiten.Sie.im.Büro. == "ja")
nonOfficeData = subset(data, data$Arbeiten.Sie.im.Büro. != "ja")
which(officeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < officeData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.)
#office
plot.multi.dens(list(officeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[officeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-8,-9)], officeData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[officeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-8,-9)], officeData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[officeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-8,-9)]))
#nonOffice
plot.multi.dens(list(nonOfficeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche.[nonOfficeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000], nonOfficeData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[nonOfficeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000], nonOfficeData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[nonOfficeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000]))
#schreiben
plot.multi.dens(list(officeData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[officeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-8,-9)], nonOfficeData$Wie.viele.E.Mails.senden.Sie..schätzungsweise..durchschnittlich.in.einer.Woche.[nonOfficeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000]))
#lesen
plot.multi.dens(list(officeData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[officeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000][c(-8,-9)], nonOfficeData$Wie.viele.dieser.E.Mails.lesen.Sie.tatsächlich.[nonOfficeData$Wie.viele.E.Mails..Spam.ausgeschlossen..bekommen.Sie.schätzungsweise.durchschnittlich.in.einer.Woche. < 12000]))
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment