Logo des Repositoriums
 
Konferenzbeitrag

Dublettenbereinigung nach dem Record Linkage Algorithmus

Lade...
Vorschaubild

Volltext URI

Dokumententyp

Text/Conference Paper

Zusatzinformation

Datum

2005

Zeitschriftentitel

ISSN der Zeitschrift

Bandtitel

Verlag

Gesellschaft für Informatik e.V.

Zusammenfassung

Unter Dublettenbereinigung versteht man das Entfernen mehrfach gespeicherter Datensätze, die auf dasselbe Objekt verweisen. Der bekannteste Algorithmus hierzu ist der Record Linkage Algorithmus nach Fellegi und Sunter. Hierbei wird ein Gesamtgewicht auf Grundlage eines Vergleichs einzelner Attribute von zwei Datensätzen errechnet. Neben dem exakten Vergleich von Attributen sind vor allem Algorithmen notwendig, die orthographische oder typographische Fehler berücksichtigen.

Beschreibung

Cordts, Sönke; Müller, Burkhard (2005): Dublettenbereinigung nach dem Record Linkage Algorithmus. Informatik 2005 – Informatik Live! Band 2. Bonn: Gesellschaft für Informatik e.V.. PISSN: 1617-5468. ISBN: 3-88579-397-0. pp. 428-432. Regular Research Papers. Bonn. 19. bis 22. September 2005

Schlagwörter

Zitierform

DOI

Tags