Gillmeier, StephanHengartner, UrsPedrazzini, Sandro2018-01-162018-01-1620102010https://dl.gi.de/handle/20.500.12116/14574enDas automatische Zuweisen von Themengebieten zu beliebigen Dokumenten ist eine der anspruchsvollsten Aufgaben in der Computerlinguistik. Um dies technisch überhaupt bewerkstelligen zu können, setzt es ein gewisses »Verständnis« eines Textes voraus. Üblicherweise werden bei solchen Verfahren groβe — von Hand erstellte — thematisch vorsortierte Datenbanken benutzt. In dieser Arbeit wird zusammen mit statistischen Datenanalysen die »Datenbank« Wikipedia verwendet, um mit ihren semantischen Strukturen automatisch passende Themen von Dokumenten zu identifizieren und anschlieβend zuzuordnen. Darüber hinaus wird mit einem weiteren Verfahren gezeigt, wie das Auffinden ähnlicher Dokumente verbessert werden kann.Wie man mit der Wikipedia semantische Verfahren verbessern kannText/Journal Article2198-2775