Logo des Repositoriums
 

Modulare and Parameter-effiziente Fine-abstimmung von Sprachmodellen

dc.contributor.authorPfeiffer, Jonas
dc.contributor.editorReischuk, Rüdiger
dc.date.accessioned2024-10-02T09:07:06Z
dc.date.available2024-10-02T09:07:06Z
dc.date.issued2024
dc.description.abstractTransferlernen ist zum führenden Paradigma in der Verarbeitung natürlicher Sprache (NLP) geworden, wobei vortrainierte Modelle für nachgelagerte Aufgaben mit minimalen Beispielen feinabgestimmt (fine-tuned) werden. Diese Dissertation befasst sich mit der Herausforderung, Modelle zu entwickeln, die effizient neue Informationen aufnehmen und ohne negativen Transfer verallgemeinern. Modulares Deep Learning, das Berechnungseinheiten innerhalb von Modulen effizient und asynchron aktualisiert, bietet hierfür eine Schlüssellösung. Diese Module, zwischen neuronalen Schichten (Layern) integriert oder mit vortrainierten Parametern verknüpft, ermöglichen eine kompositionelle Generalisierung durch die Neustrukturierung von Wissen. Diese Dissertation bietet einen umfassenden Blick auf Modularität in NLP, aufgeteilt in vier Dimensionen: Berechnungsfunktionen, Routingfunktionen, Aggregationsfunktionen und das Trainingsszenario. Zu den Kernbeiträgen zählen ein vielseitiges Forschungsframework, eine innovative “attention”-basierte Aggregationsfunktion zur Integration von Modulen, Routingmechanismen für cross-linguale Szenarien, Strategien für multimodales und multilinguales Lernen sowie eine modulare Vortrainingsstrategie, um katastrophale Interferenzen in heterogenen Daten zu mindern.de
dc.identifier.doi10.18420/Diss2023-21
dc.identifier.isbn978-3-88579-982-5
dc.identifier.urihttps://dl.gi.de/handle/20.500.12116/44718
dc.language.isode
dc.publisherGesellschaft für Informatik e.V.
dc.relation.ispartofAusgezeichnete Informatikdissertationen 2023 (Band 24)
dc.titleModulare and Parameter-effiziente Fine-abstimmung von Sprachmodellende
gi.citation.endPage220
gi.citation.publisherPlaceBonn
gi.citation.startPage211
gi.conference.date05.05.-08.05.24
gi.conference.locationSchoss Dagstuhl, Deutschland

Dateien

Originalbündel
1 - 1 von 1
Vorschaubild nicht verfügbar
Name:
Pfeiffer-Jonas.pdf
Größe:
3.98 MB
Format:
Adobe Portable Document Format