Auflistung nach Autor:in "Hinneburg, Alexander"
1 - 5 von 5
Treffer pro Seite
Sortieroptionen
- KonferenzbeitragÄhnlichkeitssuche in Musik-Datenbanken mit Hilfe von Visualisierungen(BTW 2003 – Datenbanksysteme für Business, Technologie und Web, Tagungsband der 10. BTW Konferenz, 2003) Hinneburg, Alexander; Hinneburg, AlexanderÄhnlichkeitssuche in Datenbanken wurde bisher in vielen Bereichen erfolgreich angewendet. Jedoch gibt es vergleichsweise wenige Arbeiten, die sich mit Ähnlichkeitssuche in Musikdaten beschäftigen. Da derzeit immer mehr Musik über das Internet verfügbar wird, stößt dieser Bereich zunehmend bei vielen Anwendungsgruppen auf reges Interesse. Bisherige Suchverfahren lassen sich aber nur im beschränkten Maße an die vielfältigen Anwendungsszenarien anpassen. Meist läßt sich dies nur über die Auswahl einer abstrakten Metrik realisieren. Jedoch ist es ein ungelöstes Problem, wie der Benutzer dem Suchsystem mitteilen kann, welche Aspekte bei der Suche für eine Aufgabe relevant sind. Diese Arbeit stellt einen Ansatz vor, der versucht, die sogenannte semantische Lücke zwischen Benutzer und System durch einer Kombination aus konventioneller Ähnlichkeitssuche mit interaktiven Visualisierungen zu überbrücken. Dafür wurde eine neue Feature-Extraktionsmethode für Musikdaten entwickelt, die gleichzeitig für eine Visualisierung geeignet ist. Die abgeleitete Visualisierung beschreibt statistische Eigenschaften des Musikstücks. Mit Hilfe der Visualisierung kann die Ähnlichkeit zweier Musikstücke auf herkömmliche Weise akustisch, aber auch visuell bewertet werden. Der visuelle Weg ist viel schneller als das akustische Durchhören verschiedener Resultate und ermöglicht so die Verwendung von Relevance Feedback, mittels dessen das System sich iterativ an die Vorstellungen des Benutzers anpassen kann. Wir haben unseren Ansatz mit einer bekannten Methode für Musik- Ähnlichkeitssuche verglichen und demonstrieren die Effektivität anhand von Anwendungsbeispielen.
- KonferenzbeitragAn application of latent topic document analysis to large-scale proteomics databases(German conference on bioinformatics – GCB 2007, 2007) Klie, Sebastian; Martens, Lennart; Vizcaino, Juan Antonio; Cote, Richard; Jones, Phil; Apweiler, Rolf; Hinneburg, Alexander; Hermjakob, HenningSince the advent of public data repositories for proteomics data, readily accessible results from high-throughput experiments have been accumulating steadily. Several large-scale projects in particular have contributed substantially to the amount of identifications available to the community. Despite the considerable body of information amassed, very few successful analysis have been performed and published on this data, levelling off the ultimate value of these projects far below their potential. In order to illustrate that these repositories should be considered sources of detailed knowledge instead of data graveyards, we here present a novel way of analyzing the information contained in proteomics experiments with a ’latent semantic analysis’. We apply this information retrieval approach to the peptide identification data contributed by the Plasma Proteome Project. Interestingly, this analysis is able to overcome the fundamental difficulties of analyzing such divergent and heterogeneous data emerging from large scale proteomics studies employing a vast spec- trum of different sample treatment and mass-spectrometry technologies. Moreover, it yields several concrete recommendations for optimizing pro- teomics project planning as well as the choice of technologies used in the experiments. It is clear from these results that the analysis of large bodies of publicly available proteomics data holds great promise and is currently underexploited.
- TextdokumentDensity-based clustering in large databases using projections and visualizations(Ausgezeichnete Informatikdissertationen 2002, 2003) Hinneburg, AlexanderEs wurde ein Rahmensystem für Clusteranalyse entwickelt, daß Cluster-Primitive für verschiedene Aufgabenstellungen bereit hält. Alle Cluster-Primitive basieren auf Dichteschätzung, die von der eigentlichen Clusteranalyse getrennt wurde. Diese Trennung führte zu Algorithmen mit besser Laufzeitkomplexität. Um hoch-dimensionale Daten zu bearbeiten wurde ein neuer Algorithmus vorgeschlagen, der Cluster in verschiedenen Projektionen Abbildung 2: HD-Eye Screenshot Version 1 and Version 2, Erklärung der Teilfenster in der oberen Abbildung im Uhrzeigersinn von Oben: Separator Baum, Icon Repräsentation von 1D Projektionen, 1D Projektion-Histogramm, 1D Dichte Diagramm, Icon Repräsentation für multi dimensionale Projektionen and 2D Dichte Diagramme. Density-Based Clustering in Large Databases (a) Color (b) Histogramm Abbildung 3: Beispiel für ein-dimensionale Color-Density Plots Abbildung 4: Beispiel für einen zwei-dimensionalen Color-Density Plot (a) 1 dimensional (b) multidimensional Abbildung 5: Struktur der Icons (a) ein-dimensional (b) mehr-dimensional Abbildung 6: Beispiele für Icons passend zu den vorhergehenden Color-Density Plot in Abb.3 und 4 (a) (b) (c) (d) Abbildung 7: (a) zeigt Color-Density Plots von molekular-biologischen Daten mit den separarierenden Minima für die Rauschschwelle $ξ= 0$. Aufgrund der Visulisierungen erhöht der Anwender die Rauschschwelle auf 2\%. $Teil(b)$ zeigt die veränderten Density-Plots, wobei die Intervalle mit einer Dichte unterhalb der Rauschschwelle gelb gezeichnet sind. Mit Hilfe der Rauschschwelle werden Trennpunkte entfernt, die durch leichte Schwankungen in der Datenverteilung verursacht werden. Die Teile (c,d) zeigen wie eine größere Menge von Repräsentanten die Approximationsqualität der Cluster verbessert. In dem Beispiel werden in den Daten des US Census Büros die dichten geclusterten Gebiete der Westund Ostküste getrennt. Density-Based Clustering in Large Databases des hoch-dimensionalen Datenraumes finden kann. Der neue Algorithmus kann Cluster finden, die von anderen bekannten Verfahren nicht gefunden werden. Zum Abschluß wurde das HD-Eye-System entwickelt, das automatische Verfahren mit Visualisierungstechniken verknüpft, um dem Nutzer eine bessere Grundlage für seine Entscheidungen zu liefern und um das Verständnis und die Einschätzung der Ergebnisse zu erleichtern. In zukünftigen Arbeiten kann der Algorithmus um das Finden von Clustern mit abhängigen Attributen erweitert werden. In diesem Rahmen gibt es auch Potential zur Entwicklung neuer Visualisierungstechniken. Ebenso können Verfahren für nominale Daten (im Gegensatz zu den hier genutzten nummerischen Daten) untersucht werden. Literatur [AGGR98] Agrawal, R., Gehrke, J., Gunopulos, D., und Raghavan, P.: Automatic subspace clustering of high dimensional data for data mining applications. In: SIGMOD 1998, Proceedings ACM SIGMOD International Conference on Management of Data, 1998, Seattle, Washington, USA. S. 94-105. ACM Press. 1998. [HAK00] Hinneburg, A., Aggarwal, C. C., und Keim, D. A.: What is the nearest neighbor in high dimensional spaces? In: VLDB'2000, Proceedings of 26th International Conference on Very Large Data Bases, Cairo, Egypt. S. 506-515. Morgan Kaufmann. 2000. [HK98] Hinneburg, A. und Keim, D.: An efficient approach to clustering in large multimedia databases with noise. In: KDD'98, Proc. of the 4th Int. Conf. on Knowledge Discovery and Data Mining. S. 58-65. AAAI Press. 1998. [HK99] Hinneburg, A. und Keim, D. A.: Optimal grid-clustering: Towards breaking the curse of dimensionality in high-dimensional clustering. In: VLDB'99, Proceedings of 25th International Conference on Very Large Data Bases, September 7-10, 1999, Edinburgh, Scotland, UK. S. 506-517. Morgan Kaufmann. 1999. [HKW02] Hinneburg, A., Keim, D. A., und Wawryniuk, M.: Hdeye: Visual mining of highdimensional data (demo). In: SIGMOD 2002, Proceedings ACM SIGMOD International Conference on Management of Data, June 3-6, 2002, USA. ACM Press. 2002. [HKW03a] Hinneburg, A., Keim, D. A., und Wawryniuk, M.: Using projections to visually cluster high-dimensional data. IEEE Computing in Science \& Engineering. $5(2)$:14-25. 2003. [HKW03b] Hinneburg, A., Keim, D. A., und Wawryniuk, M.: Hdeye: Visual mining of highdimensional data (demo). In: ICDE 2003, Proceedings of the 19th International Conference on Data Engineering, ICDE, India. IEEE Press. 2003. [HWK99] Hinneburg, A., Wawryniuk, M., und Keim, D. A.: Hdeye: Visual mining of highdimensional data. Computer Graphics \& Applications Journal. $19(5)$:22-31. September/October 1999. [Sc92] Scott, D.: Multivariate Density Estimation. Wiley and Sons. 1992. [Si86] Silverman, B. W.: Density Estimation for Statistics and Data Analysis. Chapman \& Hall. 1986.
- KonferenzbeitragRanked Set Search in Medline Documents(INFORMATIK 2010. Service Science – Neue Perspektiven für die Informatik. Band 2, 2010) Mittag, Kristin; Hinneburg, AlexanderInformation needs like searching scientific literature that involve high recall rates are difficult to satisfy with ad hoc keyword search. We propose to state queries implicitly by the specification of a set of query documents. The result of such a query is a set of answer documents that are ranked within the answer set. We describe efficient techniques to process such queries. Preliminary experiments using data from the TREC Genomics track 2005 are reported.
- KonferenzbeitragSemantic Watermarks for Detecting Cheating in Online Database Exams(BTW 2023, 2023) Brass, Stefan; Hinneburg, AlexanderDue to the COVID-19 pandemic,we were forced to conduct the exam for a database course as an online exam.An essential part of the exam was to write non-trivial SQL queries for given tasks.In order to ensure that cheating has a certain risk,we used several techniques to detect cases of plagiarism.One technique was to use a kind of ``watermarks'' invariants of the exercises that are randomly assigned to the students.Each variant is marked by small variationsthat need to be included in submitted solutions.Those markers might go through undetectedwhen a student decides to copy a solution from someone else.In this case,the student would reveal to know a ``secret''that he cannot know without the forbidden communication with another student.This can be used as a proof for plagiarisminstead of just a subjective feeling about the likelihoodof similar solutions without communication.We also used a log of SQL queries that were tried during the exam.Finally,we evaluated similarity-based techniques for SQL plagiarism detection.