Logo des Repositoriums
 

Duplikaterkennung in der Graph-Processing-Platform GRADOOP

dc.contributor.authorPretzsch, Florian
dc.contributor.editorMitschang, Bernhard
dc.contributor.editorNicklas, Daniela
dc.contributor.editorLeymann, Frank
dc.contributor.editorSchöning, Harald
dc.contributor.editorHerschel, Melanie
dc.contributor.editorTeubner, Jens
dc.contributor.editorHärder, Theo
dc.contributor.editorKopp, Oliver
dc.contributor.editorWieland, Matthias
dc.date.accessioned2017-06-21T11:24:40Z
dc.date.available2017-06-21T11:24:40Z
dc.date.issued2017
dc.description.abstractDie zunehmende Bedeutung von Graphdaten im Kontext von Big Data erfordert wirksame Verfahren zur Erkennung von Duplikaten, d. h. Knoten, welche das selbe Realweltobjekt repräsentieren. Dieser Beitrag stellt die Integration von Techniken zur Duplikaterkennung innerhalb des Graphverarbeitungs-Frameworks GRADOOP vor. Dazu werden dem GRADOOP-Framework neue Operatoren zur Duplikaterkennung hinzugefügt, die u. a. in der Lage sind, Ähnlichkeiten zwischen Knoten von einem oder mehreren Graphen zu bestimmen und ermittelte Duplikate als neue Kanten zu repräsentieren. Das vorgestellte Konzept wurde prototypisch implementiert und evaluiert.de
dc.identifier.isbn978-3-88579-660-2
dc.identifier.pissn1617-5468
dc.language.isode
dc.publisherGesellschaft für Informatik e.V.
dc.relation.ispartofDatenbanksysteme für Business, Technologie und Web (BTW 2017) - Workshopband
dc.relation.ispartofseriesLecture Notes in Informatics (LNI) - Proceedings, Volume P-266
dc.subjectGRADOOP
dc.subjectDuplikaterkennung
dc.subjectSimilarity
dc.subjectBlocking
dc.subjectLastbalancierung
dc.subjectGraphen
dc.titleDuplikaterkennung in der Graph-Processing-Platform GRADOOPde
dc.typeText/Conference Paper
gi.citation.endPage334
gi.citation.publisherPlaceBonn
gi.citation.startPage321
gi.conference.date6.-10. März 2017
gi.conference.locationStuttgart
gi.conference.sessiontitleStudierendenprogramm

Dateien

Originalbündel
1 - 1 von 1
Lade...
Vorschaubild
Name:
paper37.pdf
Größe:
2.14 MB
Format:
Adobe Portable Document Format