Logo des Repositoriums
 

Few-Shot Learning mit Sprachmodellen

dc.contributor.authorSchick, Timo
dc.contributor.editorReischuk, Rüdiger
dc.date.accessioned2023-11-09T13:38:07Z
dc.date.available2023-11-09T13:38:07Z
dc.date.issued2023
dc.description.abstractWir untersuchen die für KI-Systeme essentielle Herausforderung des Few-Shot Learnings, also des Erlernens neuer Fähigkeiten aus möglichst wenigen Beispielen. Dazu entwickeln wir Methoden, die es vortrainierten Sprachmodellen ermöglichen, ausgehend von nur einer Handvoll an Beispielen neue Aufgaben zu lösen und neue Wörter zu verstehen. Für ersteres Problem basiert unser Ansatz auf der Idee, diesen Systemen textuelle Erklärungen der zu lösenden Aufgaben zur Verfügung zu stellen. Das resultierende Lernen aus Instruktionen ermöglicht es ihnen, neue Aufgaben menschenähnlicher zu erfassen und so deutlich weniger Beispiele zu benötigen. Um KI-Systemen neue Wörter beizubringen, lassen wir uns ebenfalls von Menschen inspirieren: Wir trainieren sie, durch Lernen aus Kontexten hochwertige Repräsentationen für neue Wörter zu bestimmen und so ihr Sprachverständnis zu verbessern.de
dc.identifier.isbn978-3-88579-981-8
dc.identifier.urihttps://dl.gi.de/handle/20.500.12116/42602
dc.language.isode
dc.publisherGesellschaft für Informatik e.V.
dc.relation.ispartofAusgezeichnete Informatikdissertationen 2022 (Band D23)
dc.titleFew-Shot Learning mit Sprachmodellende
dc.typeText/Conference Paper
gi.citation.endPage260
gi.citation.publisherPlaceBonn
gi.citation.startPage251
gi.conference.date14.-17.05.2023
gi.conference.locationSchloss Dagstuhl, Deutschland

Dateien

Originalbündel
1 - 1 von 1
Lade...
Vorschaubild
Name:
Schick-Timo.pdf
Größe:
1.07 MB
Format:
Adobe Portable Document Format