Auflistung nach Schlagwort "Text-Mining"
1 - 2 von 2
Treffer pro Seite
Sortieroptionen
- TextdokumentComparing Link Grammars and Dependency Grammars for parsing German histological reports(SKILL 2022, 2022) Dörenberg, JulianThe availability of structured data is becoming an increasingly critical factor in medical research. Still, pathologists in Germany document their findings in running text instead of in a structured form. In order to obtain structured data from these report texts, hey have to be converted to a more useful form. Link Grammars (LGs) and Dependency Grammars (DGs) both can be used to parse the texts. Hence, LGs and DGs can be used for information extraction on histological reports. This paper aims to compare LGs and DGs, to show why DGs are superior and to evaluate the performance of a DG parser on a corpus of 200 histological reports randomly selected from breast biopsy reports. The DG parser achieved an Unlabelled Attachment Score of 96, a Labelled Accuracy of 95 and a Labelled Attachment Score of 93. Further evaluation shows that the occurrence of medical words which have not been part of the training data does not affect the parsers performance.
- TextdokumentExtraktion und Analyse von Schlüsselwörtern in einer Literaturrecherche zu Quantum Computing(INFORMATIK 2022, 2022) Copurkuyu,Mazlum; Barton,ThomasDurch die große Menge an wissenschaftlichen Publikationen, die meist als unstrukturierte Daten vorliegt, nehmen Komplexität und Arbeitsaufwand eines Literature-Review Prozesses stetig zu. Auch im Forschungsgebiet Quantum Computing hat sich die Anzahl wissenschaftlicher Veröffentlichungen in den letzten Jahren stark erhöht. Dieser Beitrag gibt einen Überblick, wie man Text-Mining-Methoden zur Informationsextraktion bei der Literaturrecherche zu Quantum Computing einsetzen kann. Das zentrale Forschungsziel besteht in der Anwendung von Text-Mining zur automatischen Extraktion und Visualisierung von Schlüsselwörtern auf Basis der Abstracts von wissenschaftlichen Publikationen. Dieser Ansatz verwendet zum einen die TF-IDF-Methode und auf der anderen Seite den Word2Vec-Algorithmus, um die automatische Erfassung sowie die Verarbeitung relevanter Literatur zu ermöglichen. Anschließend wird eine visuelle Darstellung der Ergebnisse wie z.B. dynamische Word-Clouds durchgeführt. Aus der Analyse werden Erkenntnisse für den Forschungsbereich Quantum Computing abgeleitet.