Skip to content
Snippets Groups Projects
Commit 026c8d50 authored by Ivan Condric's avatar Ivan Condric
Browse files

ü in ue verwandelt

parent be7d505d
No related branches found
No related tags found
No related merge requests found
...@@ -24,7 +24,7 @@ public class Cleaner { ...@@ -24,7 +24,7 @@ public class Cleaner {
System.out.println(topLayerCleaned.length); System.out.println(topLayerCleaned.length);
writer.write("id; handle; text; is_retweet; original_author; time; in_reply_to_screen_name; retweet_count; favorite_count" + System.getProperty("line.separator")); writer.write("id; handle; text; is_retweet; original_author; time; in_reply_to_screen_name; retweet_count; favorite_count" + System.getProperty("line.separator"));
/** /**
* iteriere über die Elemente des Arrays * iteriere ueber die Elemente des Arrays
* jedes Element ist eine Zeile * jedes Element ist eine Zeile
*/ */
for(String line : topLayerCleaned) { for(String line : topLayerCleaned) {
...@@ -52,7 +52,7 @@ public class Cleaner { ...@@ -52,7 +52,7 @@ public class Cleaner {
/** /**
* initiiere reader * initiiere reader
* in unserem Fall nutzen wir einen CSVReader * in unserem Fall nutzen wir einen CSVReader
* der frei verfügbaren opencsv-library, * der frei verfuegbaren opencsv-library,
* was das Splitten der einzelnen Zeilen verinfacht, * was das Splitten der einzelnen Zeilen verinfacht,
* da CSVReader auch Angaben wie ";;" korrekt liest * da CSVReader auch Angaben wie ";;" korrekt liest
*/ */
...@@ -60,7 +60,7 @@ public class Cleaner { ...@@ -60,7 +60,7 @@ public class Cleaner {
reader = new CSVReader(bufferedReader, ';', '\"', '\\'); reader = new CSVReader(bufferedReader, ';', '\"', '\\');
/** /**
* überspringen der Bezeichner-Zeile * ueberspringen der Bezeichner-Zeile
*/ */
reader.readNext(); reader.readNext();
...@@ -74,10 +74,10 @@ public class Cleaner { ...@@ -74,10 +74,10 @@ public class Cleaner {
/** /**
* Iteriert über jede einzelne Zeile des CSV-files und * Iteriert ueber jede einzelne Zeile des CSV-files und
* beurteilt, ob die relevanten Spalteneinträge korrekt sind. * beurteilt, ob die relevanten Spalteneinträge korrekt sind.
* Beinhaltet außerdem einen counter id, der zu jeder Tweet- * Beinhaltet außerdem einen counter id, der zu jeder Tweet-
* Zeile hinzgefügt wird, um einen besseren Primärschlüssel zu haben * Zeile hinzgefuegt wird, um einen besseren Primärschluessel zu haben
*/ */
private String[] makeCleaned(CSVReader reader, String[] cleaned) throws IOException { private String[] makeCleaned(CSVReader reader, String[] cleaned) throws IOException {
String[] tweet; String[] tweet;
...@@ -92,7 +92,7 @@ public class Cleaner { ...@@ -92,7 +92,7 @@ public class Cleaner {
} }
/** /**
* überprüft, ob das Handle tatsächlich einer der * ueberprueft, ob das Handle tatsächlich einer der
* Präsidentschaftskandidaten ist * Präsidentschaftskandidaten ist
*/ */
...@@ -109,13 +109,13 @@ public class Cleaner { ...@@ -109,13 +109,13 @@ public class Cleaner {
/** /**
* entfernt Zeilenumbrüche aus den Texten * entfernt Zeilenumbrueche aus den Texten
*/ */
tweet[1] = splitFor(tweet[1], "\n"); tweet[1] = splitFor(tweet[1], "\n");
/** /**
* überprüft, ob is_retweet einen Boolean darstellt * ueberprueft, ob is_retweet einen Boolean darstellt
*/ */
boolean isRetweet = true; boolean isRetweet = true;
boolean validRetweet = false; boolean validRetweet = false;
...@@ -129,18 +129,18 @@ public class Cleaner { ...@@ -129,18 +129,18 @@ public class Cleaner {
} }
/** /**
* überprüft, ob time einen tatsächlichen * ueberprueft, ob time einen tatsächlichen
* timestamp darstellt * timestamp darstellt
* Da alle Timestamps in der Form "yyyy-MM-ddT HH:mm:ss", * Da alle Timestamps in der Form "yyyy-MM-ddT HH:mm:ss",
* also mit einem T, das nicht geparset werden kann, gegeben sind, * also mit einem T, das nicht geparset werden kann, gegeben sind,
* splittet diese Methode den Timestamp nach dem T auf und fügt ihn ohne * splittet diese Methode den Timestamp nach dem T auf und fuegt ihn ohne
* das T wieder zusammen. * das T wieder zusammen.
*/ */
tweet[4] = splitFor(tweet[4], "T"); tweet[4] = splitFor(tweet[4], "T");
boolean validTP = isValidTimestamp(tweet[4]); boolean validTP = isValidTimestamp(tweet[4]);
/** /**
* überprüft, ob retweet_Count und favorite_Count * ueberprueft, ob retweet_Count und favorite_Count
* Integer darstellen * Integer darstellen
*/ */
boolean validRTCount = true; boolean validRTCount = true;
...@@ -173,8 +173,8 @@ public class Cleaner { ...@@ -173,8 +173,8 @@ public class Cleaner {
} }
/** /**
* versucht den angegebenen String mit dem gewünschten Format * versucht den angegebenen String mit dem gewuenschten Format
* zu parsen. Bei Erfolg wird true, bei Fehler false zurückgegeben * zu parsen. Bei Erfolg wird true, bei Fehler false zurueckgegeben
*/ */
public boolean isValidTimestamp(String timeString) { public boolean isValidTimestamp(String timeString) {
SimpleDateFormat format = new java.text.SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); SimpleDateFormat format = new java.text.SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
...@@ -188,7 +188,7 @@ public class Cleaner { ...@@ -188,7 +188,7 @@ public class Cleaner {
/** /**
* Diese Methode splittet den gegebenen String * Diese Methode splittet den gegebenen String
* nach dem "splitfor" auf und fügt ihn ohne * nach dem "splitfor" auf und fuegt ihn ohne
* das "splitfor" wieder zusammen. * das "splitfor" wieder zusammen.
*/ */
private String splitFor(String timeString, String splitfor) { private String splitFor(String timeString, String splitfor) {
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Please register or to comment