Skip to content
GitLab
Explore
Sign in
Primary navigation
Search or go to…
Project
D
DBS-Project
Manage
Activity
Members
Labels
Plan
Issues
Issue boards
Milestones
Wiki
Requirements
Code
Merge requests
Repository
Branches
Commits
Tags
Repository graph
Compare revisions
Snippets
Locked files
Deploy
Releases
Container registry
Model registry
Monitor
Incidents
Analyze
Value stream analytics
Contributor analytics
Repository analytics
Code review analytics
Issue analytics
Insights
Model experiments
Help
Help
Support
GitLab documentation
Compare GitLab plans
Community forum
Contribute to GitLab
Provide feedback
Keyboard shortcuts
?
Snippets
Groups
Projects
Show more breadcrumbs
iso
DBS-Project
Commits
026c8d50
Commit
026c8d50
authored
8 years ago
by
Ivan Condric
Browse files
Options
Downloads
Patches
Plain Diff
ü in ue verwandelt
parent
be7d505d
No related branches found
No related tags found
No related merge requests found
Changes
1
Show whitespace changes
Inline
Side-by-side
Showing
1 changed file
iteration2/cleaner.java
+15
-15
15 additions, 15 deletions
iteration2/cleaner.java
with
15 additions
and
15 deletions
iteration2/cleaner.java
+
15
−
15
View file @
026c8d50
...
@@ -24,7 +24,7 @@ public class Cleaner {
...
@@ -24,7 +24,7 @@ public class Cleaner {
System
.
out
.
println
(
topLayerCleaned
.
length
);
System
.
out
.
println
(
topLayerCleaned
.
length
);
writer
.
write
(
"id; handle; text; is_retweet; original_author; time; in_reply_to_screen_name; retweet_count; favorite_count"
+
System
.
getProperty
(
"line.separator"
));
writer
.
write
(
"id; handle; text; is_retweet; original_author; time; in_reply_to_screen_name; retweet_count; favorite_count"
+
System
.
getProperty
(
"line.separator"
));
/**
/**
* iteriere
ü
ber die Elemente des Arrays
* iteriere
ue
ber die Elemente des Arrays
* jedes Element ist eine Zeile
* jedes Element ist eine Zeile
*/
*/
for
(
String
line
:
topLayerCleaned
)
{
for
(
String
line
:
topLayerCleaned
)
{
...
@@ -52,7 +52,7 @@ public class Cleaner {
...
@@ -52,7 +52,7 @@ public class Cleaner {
/**
/**
* initiiere reader
* initiiere reader
* in unserem Fall nutzen wir einen CSVReader
* in unserem Fall nutzen wir einen CSVReader
* der frei verf
ü
gbaren opencsv-library,
* der frei verf
ue
gbaren opencsv-library,
* was das Splitten der einzelnen Zeilen verinfacht,
* was das Splitten der einzelnen Zeilen verinfacht,
* da CSVReader auch Angaben wie ";;" korrekt liest
* da CSVReader auch Angaben wie ";;" korrekt liest
*/
*/
...
@@ -60,7 +60,7 @@ public class Cleaner {
...
@@ -60,7 +60,7 @@ public class Cleaner {
reader
=
new
CSVReader
(
bufferedReader
,
';'
,
'\"'
,
'\\'
);
reader
=
new
CSVReader
(
bufferedReader
,
';'
,
'\"'
,
'\\'
);
/**
/**
*
ü
berspringen der Bezeichner-Zeile
*
ue
berspringen der Bezeichner-Zeile
*/
*/
reader
.
readNext
();
reader
.
readNext
();
...
@@ -74,10 +74,10 @@ public class Cleaner {
...
@@ -74,10 +74,10 @@ public class Cleaner {
/**
/**
* Iteriert
ü
ber jede einzelne Zeile des CSV-files und
* Iteriert
ue
ber jede einzelne Zeile des CSV-files und
* beurteilt, ob die relevanten Spalteneinträge korrekt sind.
* beurteilt, ob die relevanten Spalteneinträge korrekt sind.
* Beinhaltet außerdem einen counter id, der zu jeder Tweet-
* Beinhaltet außerdem einen counter id, der zu jeder Tweet-
* Zeile hinzgef
ü
gt wird, um einen besseren Primärschl
ü
ssel zu haben
* Zeile hinzgef
ue
gt wird, um einen besseren Primärschl
ue
ssel zu haben
*/
*/
private
String
[]
makeCleaned
(
CSVReader
reader
,
String
[]
cleaned
)
throws
IOException
{
private
String
[]
makeCleaned
(
CSVReader
reader
,
String
[]
cleaned
)
throws
IOException
{
String
[]
tweet
;
String
[]
tweet
;
...
@@ -92,7 +92,7 @@ public class Cleaner {
...
@@ -92,7 +92,7 @@ public class Cleaner {
}
}
/**
/**
*
ü
berpr
ü
ft, ob das Handle tatsächlich einer der
*
ue
berpr
ue
ft, ob das Handle tatsächlich einer der
* Präsidentschaftskandidaten ist
* Präsidentschaftskandidaten ist
*/
*/
...
@@ -109,13 +109,13 @@ public class Cleaner {
...
@@ -109,13 +109,13 @@ public class Cleaner {
/**
/**
* entfernt Zeilenumbr
ü
che aus den Texten
* entfernt Zeilenumbr
ue
che aus den Texten
*/
*/
tweet
[
1
]
=
splitFor
(
tweet
[
1
],
"\n"
);
tweet
[
1
]
=
splitFor
(
tweet
[
1
],
"\n"
);
/**
/**
*
ü
berpr
ü
ft, ob is_retweet einen Boolean darstellt
*
ue
berpr
ue
ft, ob is_retweet einen Boolean darstellt
*/
*/
boolean
isRetweet
=
true
;
boolean
isRetweet
=
true
;
boolean
validRetweet
=
false
;
boolean
validRetweet
=
false
;
...
@@ -129,18 +129,18 @@ public class Cleaner {
...
@@ -129,18 +129,18 @@ public class Cleaner {
}
}
/**
/**
*
ü
berpr
ü
ft, ob time einen tatsächlichen
*
ue
berpr
ue
ft, ob time einen tatsächlichen
* timestamp darstellt
* timestamp darstellt
* Da alle Timestamps in der Form "yyyy-MM-ddT HH:mm:ss",
* Da alle Timestamps in der Form "yyyy-MM-ddT HH:mm:ss",
* also mit einem T, das nicht geparset werden kann, gegeben sind,
* also mit einem T, das nicht geparset werden kann, gegeben sind,
* splittet diese Methode den Timestamp nach dem T auf und f
ü
gt ihn ohne
* splittet diese Methode den Timestamp nach dem T auf und f
ue
gt ihn ohne
* das T wieder zusammen.
* das T wieder zusammen.
*/
*/
tweet
[
4
]
=
splitFor
(
tweet
[
4
],
"T"
);
tweet
[
4
]
=
splitFor
(
tweet
[
4
],
"T"
);
boolean
validTP
=
isValidTimestamp
(
tweet
[
4
]);
boolean
validTP
=
isValidTimestamp
(
tweet
[
4
]);
/**
/**
*
ü
berpr
ü
ft, ob retweet_Count und favorite_Count
*
ue
berpr
ue
ft, ob retweet_Count und favorite_Count
* Integer darstellen
* Integer darstellen
*/
*/
boolean
validRTCount
=
true
;
boolean
validRTCount
=
true
;
...
@@ -173,8 +173,8 @@ public class Cleaner {
...
@@ -173,8 +173,8 @@ public class Cleaner {
}
}
/**
/**
* versucht den angegebenen String mit dem gew
ü
nschten Format
* versucht den angegebenen String mit dem gew
ue
nschten Format
* zu parsen. Bei Erfolg wird true, bei Fehler false zur
ü
ckgegeben
* zu parsen. Bei Erfolg wird true, bei Fehler false zur
ue
ckgegeben
*/
*/
public
boolean
isValidTimestamp
(
String
timeString
)
{
public
boolean
isValidTimestamp
(
String
timeString
)
{
SimpleDateFormat
format
=
new
java
.
text
.
SimpleDateFormat
(
"yyyy-MM-dd HH:mm:ss"
);
SimpleDateFormat
format
=
new
java
.
text
.
SimpleDateFormat
(
"yyyy-MM-dd HH:mm:ss"
);
...
@@ -188,7 +188,7 @@ public class Cleaner {
...
@@ -188,7 +188,7 @@ public class Cleaner {
/**
/**
* Diese Methode splittet den gegebenen String
* Diese Methode splittet den gegebenen String
* nach dem "splitfor" auf und f
ü
gt ihn ohne
* nach dem "splitfor" auf und f
ue
gt ihn ohne
* das "splitfor" wieder zusammen.
* das "splitfor" wieder zusammen.
*/
*/
private
String
splitFor
(
String
timeString
,
String
splitfor
)
{
private
String
splitFor
(
String
timeString
,
String
splitfor
)
{
...
...
This diff is collapsed.
Click to expand it.
Preview
0%
Loading
Try again
or
attach a new file
.
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Save comment
Cancel
Please
register
or
sign in
to comment