Wednesday, 11 July 2012

Latex Vorlage für Ausarbeitung

Das Latex-Template für die schriftliche Ausarbeitung könnt ihr hier herunterladen:

Latex-Template

Bitte denkt daran, die Ausarbeitung und Euren Code bis

31. August 2012

abzugeben!

Monday, 23 April 2012

We speak English

Since we have some non-german speaking participants in this seminar, we will switch the language of the blog to English.

Wednesday, 18 April 2012

Group Appointments

Next week we are going to continue with individual group meetings:

Group 1: Matthias, Michael, Sebastian - Tuesday, 11.00 AM in Room H-1.38
Group 2: Rakesh, Robert, Walter - Monday, 11.00 AM in Room H-1.38

Nachtrag zum Einführungsworkshop

Ihr könnt nun unter Materialien die Folien vom Einführungsworkshop und vom Kick-Off Termin herunterladen.

Außerdem hab ich unter Related Work noch ein paar Seiten zu sed und awk hinterlegt.

Da der Bibsonomy Dump anscheinend nur unter Einsatz einer mysql DB vernünftigt verarbeitbar ist, habe ich für Euch eine Datei mit den Content_Ids, Titel, Autoren und Tags zusammengestellt (siehe bibsonomy-Daten unter Materialien). In der Datei ist jeder einzelne Tag in einer Zeile. Das heisst, wenn eine Publikation mit mehreren Tags versehen wurde, gibt es für diese Publikation mehrere Zeilen.
Ihr könnt nun mal versuchen, die Tags pro Publikation zu konkatenieren:

gawk 'BEGIN{FS="\t"}{a[$1]=$2;b[$1]=$3;c[$1]=c[$1]","$4}END{for(i in a) print(i"\t"a[i]"\t"b[i]"\t"gensub(/^,/,"","g",c[i]))}' input > output

Möglicherweise müsstet ihr gawk nachinstallieren, oder ihr benutzt diesen Befehl:

awk 'BEGIN{FS="\t"}{a[$1]=$2;b[$1]=$3;c[$1]=c[$1]","$4}END{for(i in a) print(i"\t"a[i]"\t"b[i]"\t"c[i])}' local_select2.txt | sed 's/ ,/      /g' > output

Beim letzten Befehl übernimmt sed die Ersetzung der vorangesetzten Kommas in der Spalte mit den tag Konkatenierung.

Bitte schaut Euch für den nächsten Termin die Tags des Bibsonomy Dumps an und schaut mal unter http://www.w3.org/wiki/DataSetRDFDumps,  ob ihr passende Datensätze findet, die die Publikation der Bibsonomy repräsentieren könnte.
Bitte lest Euch auch die unter Related Work hinterlegten Arbeiten der Gewinner der Challenge von 2009 durch, damit ihr einen ersten Eindruck bekommt, wie deren Algorithmen aussahen und womit sie die Challenge gewonnen haben.

Tuesday, 17 April 2012

Heute: Hands-On Übung zum Text Processing

Liebe Studenten,

heute machen wir, wie gestern besprochen, ein paar Übungen zum Text Processing im Umgang mit den Linked Data Dumps.
Hilfreich wäre, wenn Euch ein Unix-basiertes Terminal zur Verfügung stehen würde.

Bis gleich!

Saturday, 14 April 2012

Einführungsworkshop am 16.04.

Liebe Studenten,

am Montag, 16.04.2012, 11 Uhr machen wir einen Einführungsworkshop (Raum A-2.2), in dem wir Euch die wichtigsten Wissensbasen, Tools etc. für das Seminar vorstellen. Zunächst kommt also ein wenig Theorie, aber wir können auch gern direkt ein paar Hands-On Übungen machen. Das stimmen wir aber am Montag ab, je nach dem wie Eure Kenntnisse sind...

Bis Montag!

Tuesday, 10 April 2012

Team Formation

Liebe Studenten,
bitte findet euch per Doodle zu Gruppen zusammen. Die Gruppen sollten zwei (notfalls auch drei) Studenten umfassen. Die endgültige Gruppeneinteilung erfolgt dann zum übernächsten Seminartermin (17.04.).