Auflistung S18 - SKILL 2022 - Studierendenkonferenz Informatik nach Titel
1 - 10 von 14
Treffer pro Seite
Sortieroptionen
- TextdokumentAutomatische Transformierung multilingualer Spracheingaben in Datenbankabfragen(SKILL 2022, 2022) Franzen, MarcelModerne Datenbanksysteme gelten als eine fundamentale Innovation, um die immer größer werdenen Datenmengen speichern-und verwalten zu können. Da die meisten Menschen jedoch kein Wissen über Datenbanksprachen wie SQL besitzen, existiert eine Barriere zwischen ihnen und den Vorteilen, die eine Datenbank bietet. Um die Nutzung von Datenbanken zu vereinfachen, werden im Rahmen dieser Arbeit SQL-Abfragen auf Basis einer Fragestellung und dem Datenbankschema in Form der Spaltennamen erzeugt. Hierzu werden mehrere Neuronale Netze eingesetzt, die einzelne Teile der SQL-Abfrage vorhersagen. Darüber hinaus wird die Verwendung von multilingualen Worteinbettungen zur Repräsentation der Frage und Tabellenspalten untersucht. Durch die Nutzung der Worteinbettungen können auch Synonyme auf die Spaltennamen abgebildet werden und die im Trainingsprozess verwendete Sprache wird irrelevant. Die Ergebnisse zeigen, dass das entstandene Modell sowohl tabellenunabhängig als auch sprachunabhängig funktioniert. Demnach erfordert die Nutzung einer Datenbank nur noch wenig Wissen über das Datenbankschema und die Sprache der Spaltennamen.
- TextdokumentBerechnung optimaler Wege im öffentlichen Verkehr(SKILL 2022, 2022) Sander, JurekIn dieser Arbeit stellen wir einen neuen Algorithmus zur Berechnung optimaler Wege in öffentlichen Verkehrsnetzen vor, der auf dem Round-Based Public Transit Routing (RAPTOR) Algorithmus von Delling et al. (2015) basiert. Im Gegensatz zu den meisten bestehenden Arbeiten wählen wir als Optimalitätskriterium nicht die planmäßige, sondern die erwartete Ankunftszeit. Wir berücksichtigen somit mögliche Verspätungen durch die Definition eines geeigneten Wahrscheinlichkeitsmodells und erreichen dadurch eine deutlich höhere Planungssicherheit. Unser Algorithmus ist darüber hinaus in der Lage, weitere Kriterien wie beispielsweise die maximale Anzahl der Umstiege in der Berechnung optimaler Routen zu berücksichtigen und ist deshalb flexibler einsetzbar als der einzige bereits bekannte Algorithmus dieser Art.
- TextdokumentBisecting K-Prototypes: Effizientes hierarchisches Clustering gemischter Datensets(SKILL 2022, 2022) Dröse, HannesDieses Paper stellt ein neuartiges effizientes hierarchisches Top-down-Clustering-Verfahren für gemischte Datensets vor: Bisecting K-Prototypes. Der Algorithmus ist speziell für die Verarbeitung komplexer (numerischer und kategorischer) Datensets mit vielen fehlende Werten geeignet. Dabei ist keine exzessive Vorverarbeitung des Datensets nötig. Zusätzlich werden Erweiterungen des Algorithmus vorgestellt, welche für die Verarbeitung von Multi-Select-und Freitext-Feldern (multi-kategorische und String-Attribute) geeignet sind. Der Algorithmus wurde implementiert und gegen ein entsprechend komplexes Datenset getestet und evaluiert.
- TextdokumentComparing Link Grammars and Dependency Grammars for parsing German histological reports(SKILL 2022, 2022) Dörenberg, JulianThe availability of structured data is becoming an increasingly critical factor in medical research. Still, pathologists in Germany document their findings in running text instead of in a structured form. In order to obtain structured data from these report texts, hey have to be converted to a more useful form. Link Grammars (LGs) and Dependency Grammars (DGs) both can be used to parse the texts. Hence, LGs and DGs can be used for information extraction on histological reports. This paper aims to compare LGs and DGs, to show why DGs are superior and to evaluate the performance of a DG parser on a corpus of 200 histological reports randomly selected from breast biopsy reports. The DG parser achieved an Unlabelled Attachment Score of 96, a Labelled Accuracy of 95 and a Labelled Attachment Score of 93. Further evaluation shows that the occurrence of medical words which have not been part of the training data does not affect the parsers performance.
- TextdokumentComputing Treewidth with Constraint Programming(SKILL 2022, 2022) Voboril, FlorentinaIn this paper, we revisit a known SAT encoding for the fundamental combinatorial treewidth problem. Based on this encoding, we rework it within the constraint modeling language MiniZinc. Two MiniZinc encodings for treewidth are created and their performance is compared in an experimental evaluation. A further dimension for comparison is added by choosing between different backbone solvers supported by MiniZinc.
- TextdokumentGaining insights into the information distribution of Light Fields and enabling adaptive Light Field processing(SKILL 2022, 2022) Kremer, RobinThanks to smartphones with several cameras, capturing a scene from multiple view points has become increasingly more available. Together with the evolving computing capabilities of modern hardware, light field processing has gained a lot of attention in the last years [Br20; Fl19; Mi20]. These techniques rely on neural networks to generate representations of the light field data. Other work assumes certain scene properties to enable light field processing (like lambertian radiation). The work shown here uses depth maps to transform the light field into a froxel (frustum + voxel)[Ev15] centered representation enabling unique post processing steps and analysis of the ray distribution in a scene. But more importantly it paves the way to quantify the information distribution within a scene. Based on this information appropriate adaptive filtering techniques can be applied. The transformation into the froxel centric representation is compatible with techniques like NERF.
- TextdokumentGenerierung und Abdeckung repräsentativer Pfadmengen in Straßennetzwerken(SKILL 2022, 2022) Berner, LukasFür die Suche nach kürzesten Pfaden in sehr großen Graphen wurden verschiedene Beschleunigungstechniken, wie z.B. Contraction Hierarchies, Hub-Labels oder Transit Node Routing, entwickelt. Um optimale Anfragezeiten und Speicherverbrauch zu erreichen, benötigen viele Beschleunigungstechniken eine Menge wichtiger Knoten. In dieser Arbeit wird eine Methode zur Berechnung wichtiger Knoten eines Graphen vorgestellt. Um diese Knoten zu finden, wird auf einer repräsentativen Pfadmenge ein Hitting Set Problem mit einem Greedy-Algorithmus gelöst. Die repräsentative Pfadmenge, die möglichst unterschiedliche kürzeste Pfade des Graphen enthalten soll, wird mit einer well-separated pair decomposition und einem Quadtree berechnet. Das Verfahren wurde mit dem deutschen Straßennetzwerk (25M Knoten) getestet und liefert hier einige tausend wichtige Knoten, mit denen bereits etwa 99.9% aller kürzesten Pfade im Graph abgedeckt sind.
- TextdokumentIdentifying Alternatives and Deciding Factors for a Data Mesh Architecture(SKILL 2022, 2022) Voß, ClaraThe data mesh was introduced in 2019 as a new type of data architecture. It promises a more democratic and scalable way of data production and consumption, while also solving data engineering problems of siloed and hyper-specialized data engineering knowledge, a growing number of dependencies within data pipelines, and the rigidness of centralized monoliths. This paper used expert interviews to identify the most significant current alternatives to the data mesh and abstract factors, with which companies can evaluate whether a data mesh can further their move to a data-driven, democratized future. The results show that the motivation, company culture, company structure, IT history and IT structure should be evaluated before implementing a data mesh. This paper is based on a bachelor thesis.
- TextdokumentImplementierung und Analyse von Gradientenberechnung in Quantenalgorithmen(SKILL 2022, 2022) Schmidt, MoritzQuantencomputer bieten die theoretische Möglichkeit, verschiedenste Probleme präziser und schneller zu lösen als klassische Computer. Auch im Gebiet des maschinellen Lernens, welches in den letzten Jahren in einem immer größer werdenden Spektrum an Disziplinen Anwendung findet, hofft man das Potential des Quantencomputers zu entfalten. Viele Algorithmen des maschinellen Lernens sind im Kern Optimierungsprobleme. Um eine möglichst genaue Lösung für diese Probleme zu finden, werden oft gradientenbasierte Verfahren als Kompromiss zwischen Rechenaufwand und Qualität der Lösung verwendet. In dieser Arbeit werden verschiedene Methoden zur Bestimmung von Gradienten von Funktionen, die durch Quantenschaltkreise implementiert werden, analysiert und verglichen. Die Ergebnisse zeigen, wie die inhärente Varianz von Messungen auf Quantencomputern zu einem Dilemma bei der Wahl von Hyperparametern von numerischen Verfahren führt, warum das analytische Parameter-Shift Verfahren einzelne Gradienten nicht nur exakt, sondern auch effizient berechnet und warum das SPSA Verfahren vor allem zur Gradientenberechnung auf großen Schaltkreisen mit vielen Parametern eine gute numerische Alternative sein kann. Dies kann als Entscheidungsgrundlage zur Gradientenberechnung für zukünftige Implementierungen von Algorithmen des maschinellen Lernens auf Quantencomputern dienen.
- TextdokumentMethode für Vorhersagen über die Fortführung von Handbewegungen(SKILL 2022, 2022) Rall, Philipp; Bender, NicolasDie vorliegende Arbeit befasst sich mit der Entwicklung einer Methode zur Echtzeit-Vorhersage von Trajektorien seitlicher Greifbewegungen zur Kollisionsvermeidung in der kollaborativen Robotik. Ein Neuronales Netz sagt hierfür anhand des Verlaufs der Anfangsbewegung in einem Regressionsansatz die Endposition und Dauer des gesamten Greifvorgangs voraus. Durch das Minimum Jerk Model für gekrümmte Punkt-zu-Punkt-Bewegungen lässt sich daraufhin der weitere Verlauf der Trajektorie präzise berechnen. Die Arbeit legt besonderen Fokus auf die Entwicklung einer automatisierten Pipeline zur Datenvorverarbeitung, die aufgenommene Rohdaten von natürlichen Greifbewegungen in mehreren modularen Verarbeitungsphasen zur qualitativ hochwertigen und vereinheitlichten Trainingsdaten transformiert sowie fehlerbehaftete Messdaten aussortiert.