Auflistung nach Autor:in "Pretzsch, Florian"
1 - 1 von 1
Treffer pro Seite
Sortieroptionen
- KonferenzbeitragDuplikaterkennung in der Graph-Processing-Platform GRADOOP(Datenbanksysteme für Business, Technologie und Web (BTW 2017) - Workshopband, 2017) Pretzsch, FlorianDie zunehmende Bedeutung von Graphdaten im Kontext von Big Data erfordert wirksame Verfahren zur Erkennung von Duplikaten, d. h. Knoten, welche das selbe Realweltobjekt repräsentieren. Dieser Beitrag stellt die Integration von Techniken zur Duplikaterkennung innerhalb des Graphverarbeitungs-Frameworks GRADOOP vor. Dazu werden dem GRADOOP-Framework neue Operatoren zur Duplikaterkennung hinzugefügt, die u. a. in der Lage sind, Ähnlichkeiten zwischen Knoten von einem oder mehreren Graphen zu bestimmen und ermittelte Duplikate als neue Kanten zu repräsentieren. Das vorgestellte Konzept wurde prototypisch implementiert und evaluiert.