Logo des Repositoriums
 

Automatisierte Verarbeitung natürlichsprachlich repräsentierter Sachverhalte zur Identifizierung von Kandidaten für Bezeichner in Datenmodellen

dc.contributor.authorChrist, Sven
dc.contributor.authorStrecker
dc.contributor.authorStefan
dc.contributor.editorGiese, Holger
dc.contributor.editorRosenthal
dc.contributor.editorKristina
dc.date.accessioned2024-03-12T05:30:26Z
dc.date.available2024-03-12T05:30:26Z
dc.date.issued2024
dc.description.abstractFür das Bestimmen von Kandidaten für Bezeichner von Modellelementen (Entitätstypen, Beziehungstypen, Attributen) aus natürlichsprachlich repräsentierten Sachverhaltsbeschreibungen werden für die Datenmodellierung mit der Modellierungssprache „Entity-Relationship Model“ (ERM) Heuristiken vorgeschlagen, die an Morphologie und Grammatik der natürlichen Sprache orientiert sind. Bereits seit den 1990er Jahren werden diese Heuristiken in Verbindung mit Ansätzen des „Natural Language Processing“ (NLP) eingesetzt, um für das Erstellen von Datenmodellen eine (teil-) automatisierte Modellierungsunterstützung zu realisieren. In diesem Beitrag kontrastieren wir die für das Modellierungswerkzeug TOOL implementierte NLP-basierte Modellierungsunterstützung mit drei Transformer-basierten künstlichen neuronalen Netzen, „Large Language Model“ (LLM), hinsichtlich fünf unterschiedlich komplexen Aufgaben des Identifizierens von Kandidaten für Bezeichner von Modellelementen in einer Variante des ERM. Die vorliegenden, noch vorläufigen Ergebnisse deuten an, dass die verwendeten LLM dem kontrastierten regelbasierten NLP-Ansatz deutlich überlegen sind.de
dc.identifier.doi10.18420/modellierung2024-ws-020
dc.identifier.urihttps://dl.gi.de/handle/20.500.12116/43771
dc.language.isode
dc.pubPlaceBonn
dc.publisherGesellschaft für Informatik e.V.
dc.relation.ispartofModellierung 2024 Satellite Events
dc.subjectDatenmodellierung
dc.subjectEntity-Relationship Model
dc.subjectNatural Language Processing
dc.subjectLarge Language Model
dc.subjectIdentifier Reconstruction
dc.titleAutomatisierte Verarbeitung natürlichsprachlich repräsentierter Sachverhalte zur Identifizierung von Kandidaten für Bezeichner in Datenmodellende
dc.typeText/Conference Paper
gi.conference.date12. - 15. März
gi.conference.locationPotsdam
gi.conference.sessiontitleTools & Demos

Dateien

Originalbündel
1 - 1 von 1
Vorschaubild nicht verfügbar
Name:
20_Automatisierte Verarbeitung natürlichsprachlich repräsentierter Sachverhalte zur Identifizierung von Kandidaten für Bezeichner in Datenmodellen.pdf
Größe:
338.07 KB
Format:
Adobe Portable Document Format