Auflistung nach Schlagwort "Clustering"
1 - 10 von 14
Treffer pro Seite
Sortieroptionen
- KonferenzbeitragApplikation des DBSCAN Clustering-Verfahrens zur Generierung von Ground-Truth Fingerabdruck-Minutien(BIOSIG 2010: Biometrics and Electronic Signatures. Proceedings of the Special Interest Group on Biometrics and Electronic Signatures, 2010) Abt, Sebastian; Busch, Christoph; Nickel, ClaudiaBiometrische Verfahren werden häufig im Rahmen der Authentifizierung zum Schutz wichtiger Daten und Systeme eingesetzt. Hierzu werden biometrische Referenzen gespeichert, die Informationen über biometrische Charakteristika der betroffenen Individuen enthalten. Um diese biometrischen Referenzen in offenen und verteilten biometrischen Systemen nutzen zu können, ist eine Standardisierung der Datenaustauschformate notwendig. Eine gute Erkennungsleistung ist nur erzielbar, wenn ausgetauschte Datensätze auch standardkonform erstellt werden. Das Einhalten dieser Standards muss mittels geeigneter syntaktischer und semantischer Konformitätstests sichergestellt werden. Im Rahmen eines semantischen Konformitätstests wird geprüft, ob die gespeicherten Referenzen ein wahres Abbild der biometrischen Charakteristika darstellen. Zur Durchführung semantischer Konformitätstests ist jedoch die Existenz eines entsprechenden Referenzdatensatzes unbedingte Voraussetzung. Derartige Referenzdatensätze werden zur Zeit jedoch erst erstellt. Diese Arbeit leistet einen Beitrag zur Erzeugung eines solchen Referenzdatensatzes am Beispiel von Fingerabdruck-Minutien. Hierzu wird das DBSCAN Clustering-Verfahren auf Datenpunkte angewendet, die von daktyloskopischen Experten durch manuelle Analyse von Fingerabdruck-Bildern bestimmt wurden. Mit Hilfe des Clustering-Verfahrens werden Ground-Truth Fingerabdruck-Minutien erzeugt, die als Referenzdatensatz zum Durchführen semantischer Konformitätstests von automatischen Fingerabdruckidentifikationssystemen genutzt werden können.
- KonferenzbeitragAutomatisierte Unterscheidung von Feldarbeit und Straßenfahrt für Landmaschinen mit Hilfe von unüberwachten KI-Methoden(44. GIL - Jahrestagung, Biodiversität fördern durch digitale Landwirtschaft, 2024) Manuel Geil, Jan-Henrik HelmigManuel Geil, Jan-Henrik Helmig1, Julian Jour1, Bodo Mistele1, Jens Peters1, Katharina Stahl1 und Andreas Wübbeke1 Abstract: Die Dokumentation von Daten in der Agrarwirtschaft erweist sich für Landwirte als zunehmend aufwändige Tätigkeit, welche meist immer noch manuell erfolgt. Ziel unserer Forschungsarbeit ist es, Maschinendaten zu nutzen, um zwischen Feldarbeit und Straßenfahrt automatisch zu klassifizieren. Die Maschinendaten werden als kontinuierlicher Strom vom Maschinenstart bis zum Ausschalten der Maschine übermittelt und können Daten aus unterschiedlichen Tätigkeiten enthalten. Um ein manuelles Labeling als auch Erfassen der Feldgrenzen zu vermeiden, wird ein Ansatz verfolgt, mittels eines dichtebasierten Clustering-Verfahrens die Daten zu klassifizieren. Dieses Verfahren schien aufgrund der Dichte der Datenpunkte auf den Schlägen als vielversprechend. Im weiteren Verlauf konnte die Methode durch das Hinzuziehen der Fahrtgeschwindigkeit und das Bilden konvexer Hüllen weiter verbessert werden.
- TextdokumentThe Borda Social Choice Movie Recommender(BTW 2019, 2019) Kastner, Johannes; Ranitovic, Nemanja; Endres, MarkusIn this demo paper we present a recommender system, which exploits the Borda social choice voting rule for clustering recommendations in order to produce comprehensible results for a user. Considering existing clustering techniques like k-means, the overhead of normalizing and preparing the preferred user data is dropped. In our demo showcase we facilitate a comparison of our clustering approach to the well known k-means++ with traditional distance measures.
- ZeitschriftenartikelChain-detection Between Clusters(Datenbank-Spektrum: Vol. 19, No. 3, 2019) Held, Janis; Beer, Anna; Seidl, ThomasChains connecting two or more different clusters are a well known problem of clustering algorithms like DBSCAN or Single Linkage Clustering. Since already a small number of points resulting from, e. g., noise can form such a chain and build a bridge between different clusters, it can happen that the results of the clustering algorithm are distorted: several disparate clusters get merged into one. This single-link effect is rather known but to the best of our knowledge there are no satisfying solutions which extract those chains, yet. We present a new algorithm detecting not only straight chains between clusters, but also bent and noisy ones. Users are able to choose between eliminating one dimensional and higher dimensional chains connecting clusters to receive the underlying cluster structure. Also, the desired straightness can be set by the user. As this paper is an extension of [ 8 ], we apply our technique not only in combination with DBSCAN but also with single link hierarchical clustering. On a real world dataset containing traffic accidents in Great Britain we were able to detect chains emerging from streets between cities and villages, which led to clusters composed of diverse villages. Additionally, we analyzed the robustness regarding the variance of chains in synthetic experiments.
- TextdokumentCluster Flow - an Advanced Concept for Ensemble-Enabling, Interactive Clustering(BTW 2021, 2021) Obermeier, Sandra; Beer, Anna; Wahl, Florian; Seidl, ThomasEven though most clustering algorithms serve knowledge discovery in fields other than computer science, most of them still require users to be familiar with programming or data mining to some extent. As that often prevents efficient research, we developed an easy to use, highly explainable clustering method accompanied by an interactive tool for clustering. It is based on intuitively understandable kNN graphs and the subsequent application of adaptable filters, which can be combined ensemble-like and iteratively and prune unnecessary or misleading edges. For a first overview of the data, fully automatic predefined filter cascades deliver robust results. A selection of simple filters and combination methods that can be chosen interactively yield very good results on benchmark datasets compared to various algorithms.
- KonferenzbeitragDipTransformation: Enhancing the Structure of a Dataset and thereby improving Clustering(INFORMATIK 2019: 50 Jahre Gesellschaft für Informatik – Informatik für Gesellschaft, 2019) Schelling, Benjamin; Plant, Claudia
- TextdokumentExtended Affinity Propagation Clustering for Multi-source Entity Resolution(BTW 2021, 2021) Lerm, Stefan; Saeedi, Alieh; Rahm, ErhardEntity resolution is the data integration task of identifying matching entities (e.g. products, customers) in one or several data sources. Previous approaches for matching and clustering entities between multiple (>2) sources either treated the different sources as a single source or assumed that the individual sources are duplicate-free, so that only matches between sources have to be found. In this work we propose and evaluate a general Multi-Source Clean Dirty (MSCD) scheme with an arbitrary combination of clean (duplicate-free) and dirty sources. For this purpose, we extend a constraint-based clustering algorithm called Affinity Propagation (AP) for entity clustering with clean and dirty sources (MSCD-AP). We also consider a hierarchical version of it for improved scalability. Our evaluation considers a full range of datasets containing 0% to 100% of clean sources. We compare our proposed algorithms with other clustering schemes in terms of both match quality and runtime.
- KonferenzbeitragHierarchical Distributed Consensus for Smart Grids(SICHERHEIT 2020, 2020) Stübs, MariusReaching consensus in distributed systems is a topic with a long record of suggestions, discussions and approaches to solve. One instance of such a distributed system is the emerging Internet-of-Energy: Thousands of Smart Grid service providers participate in the orchestration of a multitude of intelligent energy devices and distributed energy resources (DER), to keep the balance between consumption and injection of electrical power. The traditional approach of reaching consensus with Paxos has serious drawbacks regarding scalability and dynamicality of node participation. Our work builds upon the results of Paxos and a number of its successors, such as Raft and Flexible Paxos, and takes on a more topologically driven perspective: We discuss a variant of Paxos that provides two important innovations towards applicability in future Smart Grids. First, leader election is explicitly bound to a number of nodes that are affected of the desired transaction, forming an election cluster. Election clusters (EC) are agreed upon dynamically in each round to achieve parallelizability of consensus depending on the grid topology and inter-dependability of nano- and micro-grids. Second, we describe a hierarchical extension of this scheme, where an aggregation of the achieved consensus is part of a higher level consensus scheme encompassing all nodes. This way, we achieve loose coupling combined with partial order of events, implementing a hierarchically distributed global consensus.
- KonferenzbeitragKonzept eines Gamification-Moduls für das Smart Learning Projekt: ein „data-driven“ Ansatz(DeLFI 2018 - Die 16. E-Learning Fachtagung Informatik, 2018) An, Truong-Sinh; Merceron, Agathe; Edriss, MajdMit der Smart Learning Infrastruktur wurde ein neuartiges didaktisches Konzept für Kurse in der Weiterbildung entwickelt. Diese Infrastruktur ist vielfältig anwendbar. Erste Analysen von Kursen zeigen, dass TeilnehmerInnen, die alle Übungen korrekt abgearbeitet haben, eine bessere Note erreichen als die Durchschnittsnote. Dieser Beitrag beschreibt ein Konzept für ein Gamification-Modul, welches mit spielerischen Elementen möglichst frühzeitig dazu animiert, alle Übungen eines Kurses korrekt und mit Verstand abzuarbeiten.
- TextdokumentMulti-Party Privacy Preserving Record Linkage in Dynamic Metric Space(BTW 2021, 2021) Sehili, Ziad; Rohde, Florens; Franke, Martin; Rahm, ErhardWe propose and evaluate several approaches for multi-party privacy-preserving record linkage (MP-PPRL) for multiple data sources. To reduce the number of comparisons for scalability we propose a new pivot-based metric space approach that dynamically adapts the selection of pivots for additional sources and growing data volume. We investigate so-called early and late clustering schemes that either cluster matching records per additional source or holistically for all sources. A comprehensive evaluation for different datasets confirms the high effectiveness and efficiency of the proposed methods.