Logo des Repositoriums
 

Datenbank Spektrum 15(1) - März 2015

Autor*innen mit den meisten Dokumenten  

Auflistung nach:

Neueste Veröffentlichungen

1 - 10 von 12
  • Zeitschriftenartikel
    Differenzanalyse komplexer Textvarianten
    (Datenbank-Spektrum: Vol. 15, No. 1, 2015) Gießler Medek, André; Pöckelmann, Marcus; Bremer, Thomas; Solms, Hans-Joachim; Molitor, Paul; Ritter, Jörg
    Eine der zentralen Aufgaben bei editionsphilologischen Vorhaben ist die Feststellung der Abhängigkeiten von zu unterschiedlichen Zeitpunkten entstandenen Textzeugnissen. Für die Edition handschriftlicher Textzeugnisse beispielsweise bezieht sich dies auf die editionsphilologisch zentrale Frage des Zusammenhangs unterschiedlicher Handschriften und ihrer Filiation untereinander und bei Texten, die starke Überarbeitungsprozesse erfahren haben, auf die Frage der Textgenese. Mit leistungsstarken Werkzeugen zum Textvergleich kann sich der Editor viel monotone Arbeit ersparen und auf die wirklich interessanten Inhalte konzentrieren. Die Vergleichswerkzeuge müssen in der Lage sein, über die verschiedenen Textvarianten hinweg ähnliche Textpassagen zu identifizieren, diese zu alignieren und die Abweichungen, soweit sie für die angedachte Edition von Interesse sind, präzise aufzulisten. Sie müssen mit großen Textmengen umgehen können und trotz dieser Datenmengen kurze Reaktionszeiten haben, um ein flüssiges Arbeiten zu erlauben. Der Beitrag diskutiert das Problem des Textvergleiches an zwei Fallbeispielen, der ‚Wundarznei‛ des Heinrich von Pfalzpaint, ein frühneuhochdeutscher Text aus dem 15. Jahrhundert mit Überlieferungen aus dem 15. und 16. Jahrhundert [8], und der ‚Histoire philosophique et politique des établissements et du commerce des Européens dans les deux Indes‛ von Guillaume Thomas François Raynal, ein französischer Text aus dem 18. Jahrhundert, der mehrere starke Überarbeitungen erfuhr.
  • Zeitschriftenartikel
    Internet Corpora: A Challenge for Linguistic Processing
    (Datenbank-Spektrum: Vol. 15, No. 1, 2015) Horbach, Andrea; Thater, Stefan; Steffen, Diana; Fischer, Peter M.; Witt, Andreas; Pinkal, Manfred
    Natural language processing tools are mostly developed for and optimized on newspaper texts, and often show a substantial performance drop when applied to other types of texts such as Twitter feeds, chat data or Internet forum posts. We explore a range of easy-to-implement methods of adapting existing part-of-speech taggers to improve their performance on Internet texts. Our results show that these methods can improve tagger performance substantially.
  • Zeitschriftenartikel
    Das Gesamtkunstwerk Oper aus Datensicht
    (Datenbank-Spektrum: Vol. 15, No. 1, 2015) Röwenstrunk, Daniel; Prätzlich, Thomas; Betzwieser, Thomas; Müller, Meinard; Szwillus, Gerd; Veit, Joachim
    Das vom BMBF geförderte Projekt Freischütz Digital setzt ein genuin digitales Editionskonzept für musikalische Werke in einem multimedialen Archiv u. a. mit Notentexten, Textbüchern und Aufnahmen in Form von Ton- und Videodokumenten um. Dies ermöglicht eine dichte Verknüpfung und Annotierung der Inhalte. Durch die Veröffentlichung der Ergebnisse unter einer Open-Access-Lizenz in einem Grid-basierten System mit Persistent Identifiern entsteht eine stabile Referenzierbarkeit und langfristige Verfügbarkeit für nachnutzende Forschungsprojekte. Die Potentiale dieses Konzepts werden dadurch evident, dass detailierte Codierungen der musikalischen Texte zur adhoc-Darstellung beliebiger, auch varianter Ausschnitte der Partituren genutzt werden können. Ebenso können das Libretto mit seiner Genese gleichberechtigt integriert, Annotationen der Datenobjekte (Text, Bild und Ton) erstellt und – aufgrund von Forschungsergebnissen zur zeitlichen und spektralen Segmentierung akustischer Datenströme – Notentexte und Aufnahmen mittels automatisch erstellter Verlinkung synchron angezeigt bzw. abgespielt werden.
  • Zeitschriftenartikel
    Content Analysis between Quality and Quantity
    (Datenbank-Spektrum: Vol. 15, No. 1, 2015) Lemke, Matthias; Niekler, Andreas; Schaal, Gary S.; Wiedemann, Gregor
    Social science research using Text Mining tools requires—due to the lack of a canonical heuristics in the digital humanities—a blended reading approach. Integrating quantitative and qualitative analyses of complex textual data progressively, blended reading brings up various requirements for the implementation of Text Mining infrastructures. The article presents the Leipzig Corpus Miner (LCM), developed in the joint research project ePol—Post-Democracy and Neoliberalism and responding to social science research requirements. The functionalities offered by the LCM may serve as best practice of processing data in accordance with blended reading.
  • Zeitschriftenartikel
    Konzeption und Implementierung eines Werkzeuges zur automatisierten Identifikation und Analyse von Argumentationsstrukturen anhand der Entscheidungen des Bundesverfassungsgerichts im Digital-Humanities-Projekt ARGUMENTUM
    (Datenbank-Spektrum: Vol. 15, No. 1, 2015) Houy, Constantin; Niesen, Tim; Calvillo, Jesús; Fettke, Peter; Loos, Peter; Krämer, Annika; Schmidt, Klaas; Herberger, Maximilian; Speiser, Iris; Gass, Alfred; Schneider, Luc; Philippi, Tim
    Die Entwicklung überzeugender Argumentation ist – ebenso wie die Analyse gegebener Argumentationsstrukturen – eine wichtige Aufgabe sowohl in der Rechtswissenschaft als auch in der juristischen Praxis. Beide Aufgaben gestalten sich intellektuell anspruchsvoll und sollten sich auf möglichst viele relevante Hintergrundinformationen stützen. Einer ständig wachsenden Anzahl verfügbarer Informationsquellen steht dabei die beschränkte menschliche Informationsverarbeitungskapazität gegenüber. Um diesen Problemen zu begegnen, wird im Rahmen des vom BMBF geförderten Konsortialprojektes ARGUMENTUM ein Software-Werkzeug entwickelt, das eine automatische Identifikation und Analyse von Argumentationsstrukturen in den elektronisch verfügbaren Entscheidungen des Bundesverfassungsgerichts unterstützen soll. Im vorliegenden Beitrag werden Konzept, Architektur und Implementierung des ARGUMENTUM-Werkzeuges präsentiert und Einblicke in mögliche Anwendungen gegeben.
  • Zeitschriftenartikel
    Modellierung einer raumbezogenen Datenbank zur Repräsentation und Analyse syntaktischer und semantischer Merkmale von Keilschrifttafeln
    (Datenbank-Spektrum: Vol. 15, No. 1, 2015) Müller, Gerfrid G.W.; Weichert, Frank; Fisseler, Denis; Cammarosano, Michele; Bachmann, Daniel; Günnewig, Jörg
    Die vorliegende Arbeit zeigt eine neuartige Herangehensweise zur Analyse von Keilschrifttafeln sowie zur Rekonstruktion von dreidimensionalen Schriftträgern über eine raumbezogene relationale Datenbank auf. Dabei ist bereits die integrierte Datenhaltung von dreidimensionalen syntaktischen und semantischen Merkmalen für Keilschrifttafeln innovativ, absolutes Neuland wird mit der Datenbank-gestützten Ermittlung von 3D-Joins auf Basis von geometrischen Informationen sowie zeit- und ortsspezifischen paläographischen Kriterien betreten. In Kombination mit dieser zur Verfügung stehenden Veredelung bestehender Daten und einer nachhaltigen Erweiterung der Datenbasis, werden neue Möglichkeiten zur Gewinnung philologischer Erkenntnisse zur Verfügung stehen und vorhandene Ansätze effektiviert.
  • Zeitschriftenartikel
    Dissertationen
    (Datenbank-Spektrum: Vol. 15, No. 1, 2015)
  • Zeitschriftenartikel
    Editorial
    (Datenbank-Spektrum: Vol. 15, No. 1, 2015) Henrich, Andreas; Heyer, Gerhard; Schlieder, Christoph; Härder, Theo
  • Zeitschriftenartikel
    30 Jahre „Datenbanksysteme für Business, Technologie und Web“
    (Datenbank-Spektrum: Vol. 15, No. 1, 2015)
  • Zeitschriftenartikel
    „im Zentrum eines Netzes [...] geistiger Fäden“. Erschließung und Erforschung thematischer Zusammenhänge in heterogenen Briefkorpora
    (Datenbank-Spektrum: Vol. 15, No. 1, 2015) Hildenbrandt, Vera; Kamzelak, Roland S.; Molitor, Paul; Ritter, Jörg
    In diesem Beitrag stellen wir einen semi-automatischen Ansatz zur Unterstützung der kollaborativ und disloziert vorgenommenen Verschlagwortung heterogener Briefkorpora vor und diskutieren Vor- und Nachteile, insbesondere in Bezug auf die Qualität der Verschlagwortung einerseits und auf den Aufwand händischer Nachbesserung andererseits. Die rein manuelle Verschlagwortung kann durch die automatische Extraktion vermeintlich sinntragender Stichwörter unterstützt werden. Dies erfolgt in der einfachsten Variante durch die Berechnung von normierten Vorkommens- und inversen Dokumenthäufigkeiten. In unserem Beitrag gehen wir dieser Idee nach und diskutieren eine Verschlagwortung durch automatische, rein quantitative Stichwortextraktion mit anschließender semi-automatischer Zuordnung der Schlagwörter zu Stichwörtern. Durch Anpassung der automatischen Stichwortextraktion an das gegebene Briefkorpus lässt sich der Ansatz qualitativ verbessern. So können in dem von uns betrachteten Briefkorpus bekannte Eigennamen (von Personen, Orten, Werken, Körperschaften und Periodika) ausgeblendet werden. Die Zuordnung der Schlagwörter zu Stichwörtern kann durch interaktive Werkzeuge erleichtert werden. Darüber hinaus führt die Einbindung von Thesauri zu einer weiteren Erleichterung bei der manuellen Bestimmung der Schlagwörter und deren Verknüpfung untereinander.