Diplomarbeit am Fraunhoferinstitut (WS 2005/06)

Aufgrund der Tatsache, daß die Diplomstelle unbezahlt ist, muß[te] ich meine Arbeit ab und an unterbrechen um Geld zu verdienen.
Nichtsdestotrotz machte die Arbeit Spaß. :-)

Das Diplom ist in das Gesamtprojekt "Emotion in der Mensch-Maschine-Kommunikation" eingegliedert und hat zur Aufgabe die Datenvorverarbeitung und Klassifikation von emotionsbezogenen Meßdaten weitestgehend zu automatisieren. Das konkrete Thema lautete:
"Entwicklung eines Frameworks zur Automatisierung der Datenvorverarbeitung und Klassifikation emotionsbezogener Sensordaten."

Es werden verschiedene Anwendungen genutzt, die hier kurz vorgestellt werden sollen.

  • Weka: Eine Data Mining Werkzeug, das frei verfügbar ist und eine Vielzahl von Filtern und Algorithmen zur Verfügung stellt.
  • OmniRoute: Ein am Fraunhofer entwickeltes Sensorsystem für emotionsbezogene Untersuchungen von Daten.
  • EmoTetris: Eine Tetrisvariante, die zur Erzeugung von Emotionen genutzt wird und verschiedene Möglichkeiten hat auf Nutzeremotionen zu reagieren.

Der erste Teil der Diplomarbeit bestand darin, die Datenvorverarbeitung per XML-Datei konfigurierbar zu machen und den Rest möglichst automatisch ablaufen zu lassen. Dazu war es notwendig, aus den vorhandenen Daten den Kopf für das Weka-spezifische ARFF-Dateiformat automatisch zu generieren und anschließend die in der XML-Datei konfigurierten Filter auf die Daten anzuwenden. Die daraus resultierende ARFF-Datei kann dann zur Klassifikation genutzt werden.

Im zweiten Teil der Arbeit ging es darum die Klassifikationsergebnisse zu verbessern und alternative Methoden zur Erhöhung der Generalisierungsfähigkeit zu testen. Hier wurde eine Diskretisierung der Meßwerte untersucht und festgestellt, daß im Vergleich zur Anwendung einer Fisherprojektion mit Tagesmatrix durchaus äquivalente Ergebnisse erzielt werden können.

Die Arbeit ist beendet, verteidigt und wurde mit 1,7 benotet. Für den geneigten Leser ist diese im Anhang zu finden.

AnhangGröße
diplomarbeit.pdf989.02 KB