Auflistung nach Autor:in "Molitor, Paul"
1 - 4 von 4
Treffer pro Seite
Sortieroptionen
- ZeitschriftenartikelDifferenzanalyse komplexer Textvarianten(Datenbank-Spektrum: Vol. 15, No. 1, 2015) Gießler Medek, André; Pöckelmann, Marcus; Bremer, Thomas; Solms, Hans-Joachim; Molitor, Paul; Ritter, JörgEine der zentralen Aufgaben bei editionsphilologischen Vorhaben ist die Feststellung der Abhängigkeiten von zu unterschiedlichen Zeitpunkten entstandenen Textzeugnissen. Für die Edition handschriftlicher Textzeugnisse beispielsweise bezieht sich dies auf die editionsphilologisch zentrale Frage des Zusammenhangs unterschiedlicher Handschriften und ihrer Filiation untereinander und bei Texten, die starke Überarbeitungsprozesse erfahren haben, auf die Frage der Textgenese. Mit leistungsstarken Werkzeugen zum Textvergleich kann sich der Editor viel monotone Arbeit ersparen und auf die wirklich interessanten Inhalte konzentrieren. Die Vergleichswerkzeuge müssen in der Lage sein, über die verschiedenen Textvarianten hinweg ähnliche Textpassagen zu identifizieren, diese zu alignieren und die Abweichungen, soweit sie für die angedachte Edition von Interesse sind, präzise aufzulisten. Sie müssen mit großen Textmengen umgehen können und trotz dieser Datenmengen kurze Reaktionszeiten haben, um ein flüssiges Arbeiten zu erlauben. Der Beitrag diskutiert das Problem des Textvergleiches an zwei Fallbeispielen, der ‚Wundarznei‛ des Heinrich von Pfalzpaint, ein frühneuhochdeutscher Text aus dem 15. Jahrhundert mit Überlieferungen aus dem 15. und 16. Jahrhundert [8], und der ‚Histoire philosophique et politique des établissements et du commerce des Européens dans les deux Indes‛ von Guillaume Thomas François Raynal, ein französischer Text aus dem 18. Jahrhundert, der mehrere starke Überarbeitungen erfuhr.
- ZeitschriftenartikelDigital methods for intertextuality studies(it - Information Technology: Vol. 62, No. 2, 2020) Molitor, Paul; Ritter, JörgArticle Digital methods for intertextuality studies was published on April 1, 2020 in the journal it - Information Technology (volume 62, issue 2).
- ZeitschriftenartikelFast paraphrase extraction in Ancient Greek literature(it - Information Technology: Vol. 62, No. 2, 2020) Pöckelmann, Marcus; Dähne, Janis; Ritter, Jörg; Molitor, PaulIn this paper, A shorter version of the paper appeared in German in the final report of the Digital Plato project which was funded by the Volkswagen Foundation from 2016 to 2019. [35], [28]. we present a method for paraphrase extraction in Ancient Greek that can be applied to huge text corpora in interactive humanities applications. Since lexical databases and POS tagging are either unavailable or do not achieve sufficient accuracy for ancient languages, our approach is based on pure word embeddings and the word mover’s distance (WMD) [20]. We show how to adapt the WMD approach to paraphrase searching such that the expensive WMD computation has to be computed for a small fraction of the text segments contained in the corpus, only. Formally, the time complexity will be reduced from O(N·K3·logK)\mathcal{O}(N\cdot {K^{3}}\cdot \log K) to O(N+K3·logK)\mathcal{O}(N+{K^{3}}\cdot \log K), compared to the brute-force approach which computes the WMD between each text segment of the corpus and the search query. N is the length of the corpus and K the size of its vocabulary. The method, which searches not only for paraphrases of the same length as the search query but also for paraphrases of varying lengths, was evaluated on the Thesaurus Linguae Graecae ® (TLG ® ) [25]. The TLG consists of about 75·10675\cdot {10^{6}} Greek words. We searched the whole TLG for paraphrases for given passages of Plato. The experimental results show that our method and the brute-force approach, with only very few exceptions, propose the same text passages in the TLG as possible paraphrases. The computation times of our method are in a range that allows its application in interactive systems and let the humanities scholars work productively and smoothly.
- Zeitschriftenartikel„im Zentrum eines Netzes [...] geistiger Fäden“. Erschließung und Erforschung thematischer Zusammenhänge in heterogenen Briefkorpora(Datenbank-Spektrum: Vol. 15, No. 1, 2015) Hildenbrandt, Vera; Kamzelak, Roland S.; Molitor, Paul; Ritter, JörgIn diesem Beitrag stellen wir einen semi-automatischen Ansatz zur Unterstützung der kollaborativ und disloziert vorgenommenen Verschlagwortung heterogener Briefkorpora vor und diskutieren Vor- und Nachteile, insbesondere in Bezug auf die Qualität der Verschlagwortung einerseits und auf den Aufwand händischer Nachbesserung andererseits. Die rein manuelle Verschlagwortung kann durch die automatische Extraktion vermeintlich sinntragender Stichwörter unterstützt werden. Dies erfolgt in der einfachsten Variante durch die Berechnung von normierten Vorkommens- und inversen Dokumenthäufigkeiten. In unserem Beitrag gehen wir dieser Idee nach und diskutieren eine Verschlagwortung durch automatische, rein quantitative Stichwortextraktion mit anschließender semi-automatischer Zuordnung der Schlagwörter zu Stichwörtern. Durch Anpassung der automatischen Stichwortextraktion an das gegebene Briefkorpus lässt sich der Ansatz qualitativ verbessern. So können in dem von uns betrachteten Briefkorpus bekannte Eigennamen (von Personen, Orten, Werken, Körperschaften und Periodika) ausgeblendet werden. Die Zuordnung der Schlagwörter zu Stichwörtern kann durch interaktive Werkzeuge erleichtert werden. Darüber hinaus führt die Einbindung von Thesauri zu einer weiteren Erleichterung bei der manuellen Bestimmung der Schlagwörter und deren Verknüpfung untereinander.