Tag Archives: informationsqualität

Präsentation der BA Prototypische Implementierung einer MediaWiki Extension zur Bewertung der Informationsqualität von Artikeln

2 Apr

Hallo,

dies ist nun auch mein letzter Post. Die Folien der Präsentation der BA habe ich für Interessierte online gestellt.

 

Advertisements

Aufruf zur Teilnahme an Benutzerevaluation

21 Mrz

Hallo,

für den Abschluss meiner Bachelorarbeit, in der es darum ging eine prototypische MediaWiki Erweiterung zur Bewertung der Informationsqualität von Artikeln zu implementieren, möchte ich nun einen Test zur Gebrauchstauglichkeit meiner Erweiterung durchführen.

Wenn du dich an der Evaluation beteiligen willst, dann gehe bitte zuerst auf den Artikel über den Parliament Act und reflektiere, was dir an dem Artikel auffällt. Wie würdest du die Informationsqualität des Artikels bewerten? Nutze dazu die oben eingebundene Erweiterung. Dort kannst du auch sehen wie der Artikel bisher bewertet wurde und wie sich die Bewertung über die Zeit verändert hat. Nachdem du die Informationsqualität für den Artikel bewertet hast, ruf entweder den Artikel Sela (Stadt)  und tue das gleiche.

Nachdem du die Informationsqualität der beiden Artikel bewertet hast, fülle bitte den unter Fragebogen zur Erweiterung aus.

Ich würde mich freuen, wenn viele bei der Evaluation mitmachen :o)

Letzte Änderungen an der MediaWiki Erweiterung

8 Mrz

Die letzten fehlenden Funktionen sind nun auch in der Erweiterung enthalten.  Es werden relevante Informationen über den Artikel angezeigt, wie Erstellungsdatum oder Anzahl der Verlinkungen auf diesen Artikel. Weiterhin werden nun die Kriterien mit der gewichteten Funktion berechnet, in der alle Indikatoren einfließen. Die Indikatoren werden anhand einer Bewertungsvorschrift Werten zwischen eins bis fünf zugeteilt. Dafür können die Grenzen selbst definiert werden,  da die durchschnittlichen Werte wahrscheinlich je nach Unternehmen variieren. Zum Schluss wurden noch Sparklines für die automatischen Indikatoren hinzugefügt, kleinere Fehler behoben und die englischen Nachrichten ergänzt.

Weiterlesen

Masterarbeit: Near Copy Detection in large text corpora (ODIN): Was bisher geschah! (Stemming, Stopword, Numberremoval, Symbolremoval)

2 Mrz

Dies ist der vorerst letzte Artikel zum Thema Textvorverarbeitung. Hier werden kurz die Techniken Stemming, Stopworts, Numberremoval und Symbolremoval, die ebenfalls als API und Hadoop Map-Reduce implementiert sind, beschrieben. Die folgenen Artikel werden sind mehr mit dem Detectieren von kopierten stellen und der Verarbeitung mittels Hadoop  zu tun haben.

Weiterlesen

Masterarbeit: Near Copy Detection in large text corpora (ODIN): Was bisher geschah! (Wordnet;Synonym findung)

27 Feb

In dem nächsten spannenden Teil meiner Blogserie „ODIN! Was bisher geschah!“ widme ich mich dem Desynonymifizieren (entfernen von Synonymen wegen der Aussprache). Oft werden kopierte Textstellen abgewandelt um die Herkunft zu verschleiern. Diese Abwandlungen können sein, dass Umstellen von Sätzen, das Entfernen oder Hinzufügen von Worten, das Ändern von numerischen Werten oder das austauschen von Worten gegen Synonyme. Die letzte Möglichkeit ist Thema diese Blogposts.
Weiterlesen