Konferenzbeitrag
Hybride Integration von molekularbiologischen Annotationsdaten
Lade...
Volltext URI
Dokumententyp
Text/Conference Paper
Zusatzinformation
Datum
2005
Autor:innen
Zeitschriftentitel
ISSN der Zeitschrift
Bandtitel
Verlag
Gesellschaft für Informatik e.V.
Zusammenfassung
Wir präsentieren einen Ansatz, um Annotationsdaten von molekularbiologischen Objekten wie Genen, Proteinen und Pathways aus öffentlichen Datenquellen für datenintensive Expressionsanalysen verwendbar zu machen. Die Expressionsdaten sind mit Experimentbeschreibungen physisch in einem Data Warehouse integriert, um schnelle Auswertungen zu unterstützen. Die öffentlichen Annotationsdaten werden virtuell über einen Mediatoransatz integriert und bedarfsgesteuert für Analysen abgerufen. Für die einheitliche Anbindung der Datenquellen wird das verbreitete Tool SRS (Sequence Retrieval System) der Fa. LION bioscience genutzt. Die Kopplung zwischen dem Warehouse und SRS erfolgt über einen Query-Mediator unter Nutzung explizit gespeicherter Beziehungen (Mappings) zwischen den Instanzen der öffentlichen Datenquellen. Dieser hybride In- tegrationsansatz wurde als Erweiterung des Leipziger Data Warehouse für Genexpressionsdaten (http://www.izbi.de/GEWARE) implementiert und wird für die Einbindung von GeneOntology, LocusLink und Ensemble in Analysen eingesetzt. Neben der Darstellung des Integrationskonzepts und seiner Realisierung werden auch Ergebnisse erster Performanzmessungen präsentiert.