Automatisierte Verarbeitung natürlichsprachlich repräsentierter Sachverhalte zur Identifizierung von Kandidaten für Bezeichner in Datenmodellen

Christ, Sven; Strecker; Stefan

Automatisierte Verarbeitung natürlichsprachlich repräsentierter Sachverhalte zur Identifizierung von Kandidaten für Bezeichner in Datenmodellen

dc.contributor.author	Christ, Sven
dc.contributor.author	Strecker
dc.contributor.author	Stefan
dc.contributor.editor	Giese, Holger
dc.contributor.editor	Rosenthal
dc.contributor.editor	Kristina
dc.date.accessioned	2024-03-12T05:30:26Z
dc.date.available	2024-03-12T05:30:26Z
dc.date.issued	2024
dc.description.abstract	Für das Bestimmen von Kandidaten für Bezeichner von Modellelementen (Entitätstypen, Beziehungstypen, Attributen) aus natürlichsprachlich repräsentierten Sachverhaltsbeschreibungen werden für die Datenmodellierung mit der Modellierungssprache „Entity-Relationship Model“ (ERM) Heuristiken vorgeschlagen, die an Morphologie und Grammatik der natürlichen Sprache orientiert sind. Bereits seit den 1990er Jahren werden diese Heuristiken in Verbindung mit Ansätzen des „Natural Language Processing“ (NLP) eingesetzt, um für das Erstellen von Datenmodellen eine (teil-) automatisierte Modellierungsunterstützung zu realisieren. In diesem Beitrag kontrastieren wir die für das Modellierungswerkzeug TOOL implementierte NLP-basierte Modellierungsunterstützung mit drei Transformer-basierten künstlichen neuronalen Netzen, „Large Language Model“ (LLM), hinsichtlich fünf unterschiedlich komplexen Aufgaben des Identifizierens von Kandidaten für Bezeichner von Modellelementen in einer Variante des ERM. Die vorliegenden, noch vorläufigen Ergebnisse deuten an, dass die verwendeten LLM dem kontrastierten regelbasierten NLP-Ansatz deutlich überlegen sind.	de
dc.identifier.doi	10.18420/modellierung2024-ws-020
dc.identifier.uri	https://dl.gi.de/handle/20.500.12116/43771
dc.language.iso	de
dc.pubPlace	Bonn
dc.publisher	Gesellschaft für Informatik e.V.
dc.relation.ispartof	Modellierung 2024 Satellite Events
dc.subject	Datenmodellierung
dc.subject	Entity-Relationship Model
dc.subject	Natural Language Processing
dc.subject	Large Language Model
dc.subject	Identifier Reconstruction
dc.title	Automatisierte Verarbeitung natürlichsprachlich repräsentierter Sachverhalte zur Identifizierung von Kandidaten für Bezeichner in Datenmodellen	de
dc.type	Text/Conference Paper
gi.conference.date	12. - 15. März
gi.conference.location	Potsdam
gi.conference.sessiontitle	Tools & Demos

Dateien

Originalbündel

1 - 1 von 1

Name:: 20_Automatisierte Verarbeitung natürlichsprachlich repräsentierter Sachverhalte zur Identifizierung von Kandidaten für Bezeichner in Datenmodellen.pdf
Größe:: 338.07 KB
Format:: Adobe Portable Document Format

Herunterladen

Sammlungen

Modellierung 2024 - Workshopband