Workshop INF-DH - 2018

https://dl.gi.de/handle/20.500.12116/16989

GI-Workshop: "Im Spannungsfeld zwischen Tool-Building und Forschung auf Augenhöhe – Informatik und die Digital Humanities" (25.9.2018, Berlin)

Auflistung nach:

1 - 10 von 17

Workshopbeitrag
Merging Community Knowledge and Self-Interest to Build Language Resources: Architecture and Quality Management of a Take-and-Share-Approach of Word Annotations
(INF-DH-2018, 2018) Peukert, Hagen
Research data collected in the humanities reveal a tremendous degree of heterogeneity ranging from mere texts in written, spoken, transcribed, or otherwise enriched forms by glosses or handwritten markings, to formal and informal proofs, test series, musical scores, archaeological 3D-models, and e.g. complex multi-layered audio-visual annotated corpus collections. A central argument brought forward in the humanities, is that high quality data is expensive to collect, but easy to exploit by others even if one’s own research is not finished. This paper suggests a possible solution to humanities projects in general and the annotation of words in large text corpora in particular, in which very specific requirements needed impinge on applying standard computational methods ready to use. As a case in point, high quality annotations of texts are time- and resource-intensive and hence expensive. Even if sufficient funds are supplied for manual tagging -- still the gold standard of annotating texts -- it remains an error-prone process, in which quality control soon reaches its limits. In addition, often a very limited number of users are in need of particular annotations required for very particular research questions so that economies of scale and scope of a larger research community could not easily be exploited. This paper addresses this issue taking into account research from Social Psychology and considering the specific properties of texts. As a result of the interdisciplinary analyses, the design of a web architecture is suggested that has the potential of overcoming the above mentioned dilemma and significantly improve the quality of text annotations.
Workshopbeitrag
Herausforderungen für Sentiment Analysis-Verfahren bei literarischen Texten
(INF-DH-2018, 2018) Schmidt, Thomas; Burghardt, Manuel; Wolff, Christian
In diesem Beitrag wird über die Ergebnisse eines laufenden Digital Humanities-Projekt zur Sentiment Analysis in literarischen Texten berichtet und die Implikation von diesem diskutiert. In dem Projekt werden verschiedene Methoden der Sentiment Analysis auf Texte historischer Dramen des 18. Jahrhunderts von G. E. Lessing implementiert und gegeneinander evaluiert. Zur Evaluation wurde ein von Menschen bezüglich Sentiment annotiertes Testkorpus erstellt. Basierend auf den ersten Erfahrungen des Projekts diskutieren wir über Probleme und Herausforderungen, die sich aus der Perspektive der Informatik zur Sentiment Analysis historischer Dramen ergaben. Es wird deut-lich, dass bestehende Standardlösungen der Sentiment Analysis für dieses spezifische Szenario nicht ohne Weiteres anwendbar sind. Vielmehr ist die Informatik gefordert, die bestehenden Methoden anzupassen, weiterzuentwickeln und sich mit besonderen Eigenheiten der Textform historischer literarischer Texte auseinanderzusetzen.
Workshopbeitrag
Digital Humanities: An Explication
(INF-DH-2018, 2018) Piotrowski, Michael
The relationship between computer science and digital humanities and the potential contributions of computer science to digital humanities cannot be reasonably discussed without defining what we mean by “digital humanities.” With a view to enabling this important discussion, we propose a concise definition of digital humanities centered around the construction of formal models.
Workshopbeitrag
Generierung von Trainingsdaten für die Handschrifterkennung aus TEI annotierten Dokumenten – Ein Erfahrungsbericht aus dem EU-Projekt READ
(INF-DH-2018, 2018) Bryan, Maximilian; Hodel, Tobias; Philipp, Nathanael
Zum Trainieren maschineller Lernverfahren zur Erkennung von Handschriften werden Textdaten mit korrespondierenden Bildern benötigt. Die Textdaten liegen häufig im TEI-Format das diverse Möglichkeiten eröffnet, um textuelle und semantische Phänomene auszuzeichnen, weiter können gar eigene Tags oder Auszeichnungsarten eingeführt werden. In diesem Beitrag wird ein im EU-Projekt READ entwickeltes parametrisierbares Tool beschrieben, das mit unterschiedlichen Auszeichnungsstilen in TEI umgehen kann und Textdateien auf Seitenbasis liefert, die zur Zuordnung von Text zu Bilddaten (text-to-image) genutzt werden können und somit zur Aufbereitung von Trainingsdaten für Modelle der Handschriftenerkennung dienen. Die gezeigten Beispiele und Anwendungen stammen alle aus Projekten, die ihre Daten für READ zur Verfügung stellten.
Workshopbeitrag
Analysis and Classification of Prosodic Styles in Post-modern Spoken Poetry
(INF-DH-2018, 2018) Meyer-Sickendiek, Burkhard; Hussein, Hussein; Baumann, Timo
We present our research on computer-supported analysis of prosodic styles in post-modern poetry. Our project is unique in making use of both the written as well as the spoken form of the poem as read by the original author. In particular, we use speech and natural language processing technology to align speech and text and to perform textual analyses. We then explore, based on literary theory, the quantitative value of various types of features in dierentiating various prosodic classes of post-modern poetry using machine-learning techniques. We contrast this feature-driven approach with a theoretically less informed neural networks-based approach and explore the relative strengths of both models, as well as how to integrate higher-level knowledge into the NN. In this paper, we give an overview of our project, our approach, and particularly focus on the challenges encountered and lessons learned in our interdisciplinary endeavour. The classification results of the rhythmical patterns (six classes) using NN-based approaches are better than by feature-based approaches.
Workshopbeitrag
Visualisierungswerkzeuge zur Erklärung historischer Ereignisse: geschichtstheoretische Anforderungsanalyse und zeichentheoretisches Rahmenwerk
(INF-DH-2018, 2018) Frank, Ingo
In vielen Digital Humanities-Projekten scheint die Informatik nur als eine Art IT-Dienstleister für die Werkzeugentwicklung zu dienen. Anhand von ausgewählten Beispielprojekten und einer eigenen Fallstudie im Bereich der Digital History wird das Potential von Geschichtstheorie und Zeichentheorie als Vermittler und Übersetzer zwischen Informatik und Geisteswissenschaft demonstriert. Ein wissenschaftstheoretischer Blick auf die Geschichtsforschung zeigt, wie Historiker historische Ereignisse erklären und welche Anforderungen dabei an unterstützende Werkzeuge bestehen. Die Zeichentheorie liefert mit den Konzepten des diagrammatischen Denkens und des abduktiven Schließens das explanatorische Rahmenwerk für die Entwicklung und den Einsatz von Visualisierungswerkzeugen zur Unterstützung der Erklärung historischer Ereignisse. Über den Ansatz der formalen Modellierung kann die Informatik einen wesentlichen Beitrag zur Entwicklung von Methoden und Visualisierungswerkzeugen zum diagrammatischen Denken in den digitalen Geisteswissenschaften leisten, indem sie etwa Formalismen wie die Modallogik oder Fuzzylogik für die kontrafaktische Exploration und multiperspektivische Analyse historischer Ereignisse nutzbar macht oder auf ihre Erfahrung und lange Praxis mit graphischen Modellierungssprachen zurückgreift, um neue Diagrammtypen für Visualisierungswerkzeuge zu konstruieren.
Workshopbeitrag
Borderlands of text mapping: Experiments on Fontane's Brandenburg
(INF-DH-2018, 2018) Barbaresi, Adrien
This article deals with the detection and projection of spatial patterns in text collections. Especially for historical corpora, researchers face a lack of general-purpose tooling. In these experiments, different maps focusing on Brandenburg at the second half of the 19th century are created based on literary works by Theodor Fontane. Using a common ground for hypothesis testing and visualization, issues related to data curation and preparation, text processing and geocoding are presented and discussed: the abstract, static nature of the results should be made up for by particular scrutiny and contextualization, by critical machine reading and by adding depth through visual cues.
Workshopbeitrag
From Eye-to-Eye to Hand-in-Hand: Collaborative Solution Building in Interdisciplinary Manuscript Research
(INF-DH-2018, 2018) Rajan, Vinodh; Stiehl, H. Siegfried
Among the various interdisciplinary domains, Digital Humanities is one of the most interesting as it attempts to bring two competing cultures together. But this interestingness eventually comes with its own problems when trying to produce practical solutions. How does one ideally approach to build an Informatics-based solution for a research question in the Humanities? We particularly focus on the field of Interdisciplinary Manuscript Research and propose a methodology inspired by design thinking to collaboratively build solutions through interactive exploration. To this end, we present our laboratory, where this methodology is to be actively put into practice.
Workshopbeitrag
Übersetzungsprobleme zwischen Kunstgeschichte und Computer Vision
(INF-DH-2018, 2018) Heinicker, Paul; Kienbaum, Janna
Das Mixed Method-Projekt mit dem Namen anci (analysing networked climate images) widmet sich dem Thema des Klimawandels und dessen visueller Kommunikation. Anhand so genannter Schlagbilder werden evidente Klimabilder, die das gegenwärtige Weltbild zum Klimawandel in ihrer Vielfalt zwischen Politik, Wissenschaft, Kunst und Populärkultur repräsentieren und beeinflussen, miteinander verglichen und mittels qualitativer und quantitativer Methoden auf Ähnlichkeiten hin untersucht.
Workshopbeitrag
Historische Wetterdaten im Spannungsfeld von OCR und UCD
(INF-DH-2018, 2018) Lehenmeier, Constantin; Burghardt, Manuel
Dieser Beitrag beschreibt informatische Herausforderungen im Kontext eines Digital Humanities-Projekts zur Erschließung und Analyse historischer Wetteraufzeichnungen im Zeitraum 1774 - 1827. Bei der Erschließung der handschriftlichen Aufzeichnungen, die Besonderheiten wie numerische Messwerte in Tabellenstruktur und überlagernde Notizen enthalten, soll langfristig ein entsprechend trainierter OCR-Ansatz (optical character recognition) zum Einsatz kommen. Für die Erstellung entsprechender Trainingsdaten sowie für die manuelle Korrektur der automatisch erkannten Daten ergeben sich zunächst softwareergonomische Herausforderungen aus Perspektive der Medieninformatik. Der Fokus dieses Beitrags liegt daher auf der Erstellung von Tools unter Berücksichtigung von Prinzipien des usability engineering und des user-centered design (UCD) speziell für geisteswissenschaftliche Forschungsvorhaben.

Auflistung Workshop INF-DH - 2018 nach Erscheinungsdatum

Treffer pro Seite

Sortieroptionen