Archive | Visualisierung RSS feed for this section

SuTeCo – Nachrichten an eine Gruppe bzw. ihren einzelnen Mitglieder senden

9 Jan

Der nächste Schritt bei der Entwicklung von SuTeCo, war es, den Systemnutzer die Möglichkeit zu geben eigene und beobachtete Gruppen bzw. deren Mitglieder anzuschreiben.
Das Einfügen von Empfängern funktioniert nach dem Drag&Drop Prinzip. Es gipt zwei Möglichkeiten eine Gruppe oder deren einzelne Mitglieder auf die Empfängerliste zu setzen: Weiterlesen

SuTeCo – People- und Gruppentagging, Activity Liste

12 Dez

Wie ich in meiner letzten Post erwähne, habe ich mich in den letzten mit Konzept People Tagging beschäftigt. Es wurde ein Modell angelegt, das zum Tagging von Personen und Gruppen verwendet sollte. Im Modell zeigten sich Schwachstellen, die während der Implementierung als große Problemen herausstellen.

Nach eingehender Überlegung habe ich mich dafür entschieden, die bestehende Lösung für Tagging in Form eines Plug-Ins namens „Django-Tagging“ zu verwenden. Dieses Plug-In stellt ein bereit fertiges Tagging-Modell als auch umfangreiche Funktionalität zum Erstellen, Verwalten und Darstellen von Tags zur Verfügung. Weiterlesen

IKNOW-ANALYSE

23 Nov

In diesem Beitrag stelle ich kurz das Thema der Masterarbeit vor und gehe auf den Abschnitt der Datenbereinigung ein.

  • Was ist das Thema der Masterarbeit?

Analyse des IKNOW Forschungsnetzwerkes und Visualisierung von Forschungstrends – Datenbereinigung, Analyse mit Trenderkennung und Visualisierung

In meiner Masterarbeit beschäftige ich mich mit der Analyse der eingereichten Paper der Konferenz IKNOW.
Weiterhin sollen die Ergebnisse grafisch dargestellt werden.

Datenbereinigung

  • Warum ist das nötig?

Um aussagekräftige Analysen mit korrekten Daten zu erhalten, müssen die Quelldaten eine möglichst hohe Qualität aufweisen.
Durch die automatische Erkennung des KnowAAN-Tools ist diese Qualität nicht gewährleistet.
Eine manuelle Datenbereinigung erhöht die Qualität der Daten und ermöglicht erst Auswertungen zum Inhalt der vorhandenen Konferenzpaper.

  • Welche Daten sind vorhanden?

Die IKNOW-Konferenz hat bisher jährlich von 2001-2012 stattgefunden.
Die vorhandenen, eingereichten Paper wurden in das KnowAAN-Tool, das durch die PG KnowAAN erstellt wurde, geladen.
Bisher sind insgesamt 622 Paper im System.
Diese können mit dem KnowAAN-Documentbrowser exploriert, und mit einer Editionsmaske bearbeitet werden.
Weitere Paper sind auf den Konferenzseiten aufgeführt, konnten aber noch nicht in das System geladen werden.
Die Konferenzseite zählt zusammen 663 Paper auf.

  • Aufwandsschätzung im Vorfeld:

Um den Aufwand für die manuelle Datenbereinigung abzuschätzen, wurde die folgende Rechnung erstellt.
Bei einem Paper werden die Kopfdaten und die Referenzen bearbeitet.
Als Schätzung wurden 10 Minuten für die Kopfdaten und 20 Minuten für die Referenzen pro Paper angenommen.
Dabei werden 20 Referenzen pro Paper vermutet und jeweils 1 Minute pro Referenz gerechnet.
Bearbeitung gesamt: 30 Min. / Paper

Bei einer maximal geplanten Bearbeitungszeit zur Datenbereinigung von 2-2.5 Monaten steht folgende Zeit zur Verfügung.
Arbeitszeit: 6 Stunden / Tag ; 5 Tage / Woche (Mehr Zeit kann hier für diese Aufgabe nicht eingesetzt werden, da die Konzentration nachlässt und Fehler entstehen.)
12 Paper / Tag
60 Paper / Woche
in 10 Wochen sind somit 600 Paper bearbeitbar

Vorgehen:
Aufteilen der Korrekturen in 2 Phasen / Durchläufe.
Phase 1: Kopfdaten bereinigen
Phase 2: Referenzen bereinigen

Nachteil: Jedes Paper wird doppelt bearbeitet.
Vorteil: Man erhält schneller einen Überblick über alle Paper, da die kürzere Aufgabe zunächst für alle Paper durchgeführt wird.
Als Folge können mögliche Probleme eher erkannt werden und der weitere Aufwand kann besser abgeschätzt werden.

 

  • PHASE 1: Kopfdaten bereinigen umfasst: Titel, Name Autor(en), Arbeitsstelle Autor(en), Ort der Arbeitsstelle, Schlüsselwörter, Jahr der Konferenz.

Die Arbeit mit 2 Bildschirmen (Editiermaske, Paper als PDF) ist sinnvoll.
Die Paper sollten der Reihenfolge nach bearbeitet werden.
Die Sortierung nach Jahr und eine alphabetische Sortierung innerhalb eines Jahres hat sich als sinnvoll erwiesen.
Man sollte hierbei mit den früheren Jahren beginnen, da man bei Papern aus späteren Jahren auf bereits korrigierte Paper aus früheren Jahren zurückgreifen kann.
Die bearbeiteten Paper sollte man sich merken/notieren.

Bei den Kopfdaten soll der Ort der Arbeitsstelle für jeden Autor erfasst werden.
Die Ortsangaben werden für Kartenansichten benötigt, die die Herkunft der Autoren darstellen.
Als Genauigkeitsmaßstab werden im Allgemeinen die Stadt und das Land angegeben.
In einigen Papern ist die Stadt jedoch nicht angegeben.
Hier ist eine zusätzliche Recherche erforderlich (mit Autor und Firma).
Die Angaben zu Abkürzungen von Kategorien werden als Schlüsselwörter mit aufgenommen.

Die Korrektureingabemaske ermöglicht die Speicherung erst dann, wenn alle Pflichtfelder gefüllt sind.
Durch fehlerhafte Erkennung in der automatischen Vorverarbeitung der Paper ist es möglich, dass die Referenzen nicht in einem „korrekten“ Zustand sind.
Daher werden die vorhandenen, erkannten Referenzen soweit korrigiert, dass diese Änderungen gespeichert werden können.

 

 

SuTeCo – People Tagging

23 Nov

Ein weiteres Konzept, das im Rahmen meiner Masterarbeit implementiert werden soll, ist das „People Tagging“.

Jeder Benutzer der Web-Applikation SuTeCo soll die Möglichkeit haben, einen anderen Benutzer dieser Applikation mit Schlagwörtern zu versehen bzw. zu taggen.  Außerdem soll es möglich sein, sowohl eigene als auch Follow-Gruppen zu taggen.

Die entstandene Datenbank mit Tags wird später für die Suche nach Ansprechpartnern bzw. deren Kompetenzen eingesetzt. Weiterlesen

Evaluation von ADORE! Mitmachen!

31 Okt

Meine Bachelor-Arbeit neigt sich dem Ende zu. Zum Ende möchte ich ADORE gerne auf mutige Tester loslassen. Da sich ADORE vielseitig einsetzen lässt, habe ich mich entschlossen, die Evaluation aufzuteilen. Wer sich als typischer Besucher einer Website sieht, der möge sich bitte den ersten Unterabschnitt durchlesen. Leute mit etwas Vorwissen in Richtung JSON und/oder CSS sollten sich den zweiten Unterabschnitt durchlesen. Natürlich ist es auch erlaubt, an beiden Evaluationsteilen teilzunehmen.

Ich bin gespannt, denn es ist ein komisches Gefühl, ein Stück Software auf die Welt „loszulassen“, von dem man selbst genau weiß, dass es noch nicht ganz perfekt ist ;-)

Weiterlesen