Konferenzbeitrag
Herausforderungen bei der Extraktion von biochemischen Daten aus der Literatur
Lade...
Volltext URI
Dokumententyp
Text/Conference Paper
Dateien
Zusatzinformation
Datum
2010
Autor:innen
Zeitschriftentitel
ISSN der Zeitschrift
Bandtitel
Verlag
Gesellschaft für Informatik e.V.
Zusammenfassung
Biochemische Daten in der wissenschaftlichen Literatur liegen in einem nur wenig strukturierten und standardisierten Format vor. Um diese Informationen nutzen und automatisieren zu können, entstand eine Vielzahl von Datenbanken, für die publizierte Daten größtenteils manuell aus der Literatur extrahiert werden, um sie Biowissenschaftlern zur Nutzung zur Verfügung zu stellen. Die Herausforderung bei dem Betrieb solcher Datenbanken besteht unter anderem in der Sicherung der Qualität der Daten. Dies bedeutet, dass viel Zeit von biologischen Experten investiert werden muss, um die Daten aus der Literatur zu extrahieren und für die Eingabe in die Datenbank vorzubereiten, um sie bestehenden Standards anzupassen. Dies erzeugt einen Großteil der zum Betrieb erforderlichen Kosten und beeinflusst damit direkt die Machbarkeit von Projekten. In dieser Publikation beschreiben wir anhand der Datenbank SABIO-RK, welche Probleme von eventuellen automatischen Methoden gelöst werden müssten, um menschliche Arbeitskraft zu ersetzen.