Automatisierte Verarbeitung natürlichsprachlich repräsentierter Sachverhalte zur Identifizierung von Kandidaten für Bezeichner in Datenmodellen
dc.contributor.author | Christ, Sven | |
dc.contributor.author | Strecker | |
dc.contributor.author | Stefan | |
dc.contributor.editor | Giese, Holger | |
dc.contributor.editor | Rosenthal | |
dc.contributor.editor | Kristina | |
dc.date.accessioned | 2024-03-12T05:30:26Z | |
dc.date.available | 2024-03-12T05:30:26Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Für das Bestimmen von Kandidaten für Bezeichner von Modellelementen (Entitätstypen, Beziehungstypen, Attributen) aus natürlichsprachlich repräsentierten Sachverhaltsbeschreibungen werden für die Datenmodellierung mit der Modellierungssprache „Entity-Relationship Model“ (ERM) Heuristiken vorgeschlagen, die an Morphologie und Grammatik der natürlichen Sprache orientiert sind. Bereits seit den 1990er Jahren werden diese Heuristiken in Verbindung mit Ansätzen des „Natural Language Processing“ (NLP) eingesetzt, um für das Erstellen von Datenmodellen eine (teil-) automatisierte Modellierungsunterstützung zu realisieren. In diesem Beitrag kontrastieren wir die für das Modellierungswerkzeug TOOL implementierte NLP-basierte Modellierungsunterstützung mit drei Transformer-basierten künstlichen neuronalen Netzen, „Large Language Model“ (LLM), hinsichtlich fünf unterschiedlich komplexen Aufgaben des Identifizierens von Kandidaten für Bezeichner von Modellelementen in einer Variante des ERM. Die vorliegenden, noch vorläufigen Ergebnisse deuten an, dass die verwendeten LLM dem kontrastierten regelbasierten NLP-Ansatz deutlich überlegen sind. | de |
dc.identifier.doi | 10.18420/modellierung2024-ws-020 | |
dc.identifier.uri | https://dl.gi.de/handle/20.500.12116/43771 | |
dc.language.iso | de | |
dc.pubPlace | Bonn | |
dc.publisher | Gesellschaft für Informatik e.V. | |
dc.relation.ispartof | Modellierung 2024 Satellite Events | |
dc.subject | Datenmodellierung | |
dc.subject | Entity-Relationship Model | |
dc.subject | Natural Language Processing | |
dc.subject | Large Language Model | |
dc.subject | Identifier Reconstruction | |
dc.title | Automatisierte Verarbeitung natürlichsprachlich repräsentierter Sachverhalte zur Identifizierung von Kandidaten für Bezeichner in Datenmodellen | de |
dc.type | Text/Conference Paper | |
gi.conference.date | 12. - 15. März | |
gi.conference.location | Potsdam | |
gi.conference.sessiontitle | Tools & Demos |
Dateien
Originalbündel
1 - 1 von 1
Lade...
- Name:
- 20_Automatisierte Verarbeitung natürlichsprachlich repräsentierter Sachverhalte zur Identifizierung von Kandidaten für Bezeichner in Datenmodellen.pdf
- Größe:
- 338.07 KB
- Format:
- Adobe Portable Document Format