Auflistung nach Schlagwort "Reinforcement Learning"
1 - 10 von 10
Treffer pro Seite
Sortieroptionen
- TextdokumentAIDA-Vis – Automatic Data Visualization with Human Preferences(INFORMATIK 2022, 2022) Laurito,Walter; Höllig,Jacqueline; Lachowitzer,Jonas; Thoma,Steffen; Budde,Matthias; Philipp,PatrickData visualization is a complex task that typically requires human expertise, acquired through a large number of professional working hours. The automatic generation of reasonable visualizations would be a good solution for inexperienced laypeople. However, existing approaches fall short since they are quite static and rely only on traditional supervised learning. This results in models which recommend a single visualization solely based on the dataset features. User preferences and goals are not taken into account. We propose a more flexible solution that is iteratively updated with the individual user's preferences and outputs a ranked list of visualizations for a given dataset.
- ZeitschriftenartikelContinuous support for rehabilitation using machine learning(it - Information Technology: Vol. 61, No. 5-6, 2019) Philipp, Patrick; Merkle, Nicole; Gand, Kai; Gißke, CarolaProviding a suitable rehabilitation at home after an acute episode or a chronic disease is a major issue as it helps people to live independently and enhance their quality of life. However, as the rehabilitation period usually lasts some months, the continuity of care is often interrupted in the transition from the hospital to the home. Relieving the healthcare system and personalizing the care or even bringing care to the patients’ home to a greater extent is, in consequence, the superior need. This is why we propose to make use of information technology to come to participatory design driven by users needs and the personalisation of the care pathways enabled by technology. To allow this, patient rehabilitation at home needs to be supported by automatic decision-making, as physicians cannot constantly supervise the rehabilitation process. Thus, we need computer-assisted patient rehabilitation, which monitors the fitness of the current patient plan to detect sub-optimality, proposes personalised changes for a patient and eventually generalizes over patients and proposes better initial plans. Therefore, we will explain the use case of patient rehabilitation at home, the basic challenges in this field and machine learning applications that could address these challenges by technical means.
- ZeitschriftenartikelEVA 2.0: Emotional and rational multimodal argumentation between virtual agents(it - Information Technology: Vol. 63, No. 1, 2021) Rach, Niklas; Weber, Klaus; Yang, Yuchi; Ultes, Stefan; André, Elisabeth; Minker, WolfgangPersuasive argumentation depends on multiple aspects, which include not only the content of the individual arguments, but also the way they are presented. The presentation of arguments is crucial – in particular in the context of dialogical argumentation. However, the effects of different discussion styles on the listener are hard to isolate in human dialogues. In order to demonstrate and investigate various styles of argumentation, we propose a multi-agent system in which different aspects of persuasion can be modelled and investigated separately. Our system utilizes argument structures extracted from text-based reviews for which a minimal bias of the user can be assumed. The persuasive dialogue is modelled as a dialogue game for argumentation that was motivated by the objective to enable both natural and flexible interactions between the agents. In order to support a comparison of factual against affective persuasion approaches, we implemented two fundamentally different strategies for both agents: The logical policy utilizes deep Reinforcement Learning in a multi-agent setup to optimize the strategy with respect to the game formalism and the available argument. In contrast, the emotional policy selects the next move in compliance with an agent emotion that is adapted to user feedback to persuade on an emotional level. The resulting interaction is presented to the user via virtual avatars and can be rated through an intuitive interface.
- KonferenzbeitragExplainable Online Reinforcement Learning for Adaptive Systems(Software Engineering 2023, 2023) Feit, Felix; Metzger, Andreas; Pohl, KlausThis talk presents our work on explainable online reinforcement learning for self-adaptive systems published at the 3rd IEEE Intl. Conf. on Autonomic Computing and Self-Organizing Systems.
- ConferencePaperFeature-Modell-geführtes Online Reinforcement Learning für Selbst-adaptive Systeme(Software Engineering 2021, 2021) Metzger, Andreas; Quinton, Clément; Mann, Zoltán; Baresi, Luciano; Pohl, KlausWir stellen Lernstrategien für selbst-adaptive Systeme vor, welche Feature-Modelle aus der Software-Produktentwicklung nutzen, um den Lernprozess zur Laufzeit zu beschleunigen.
- TextdokumentKOBRA: Praxisfähige lernbasierte Verfahren zur automatischen Konfiguration von Business-Regeln in Duplikaterkennungssystemen(INFORMATIK 2020, 2021) Braun, Simone; Alkhouri, Georges; Peukert, EricDuplikaterkennung, -suche und -konsolidierung für Kunden-und Geschäftspartnerdaten, sog. „Identity Resolution“, ist die Voraussetzung für erfolgreiches Customer Relationship Management und Customer Experience Management, aber auch für das Risikomanagement zur Minimierung von Betrugsrisiken und Einhaltung regulatorischer Vorschriften und viele weitere Anwendungsfälle. Diese Systeme sind jedoch hochkomplex und müssen individuell an die kundenspezifischen Anforderungen angepasst werden. Der Einsatz lernbasierter Verfahren bietet großes Potenzial zur automatisierten Anpassung. In diesem Beitrag präsentieren wir für ein KMU praxisfähige, lernbasierte Verfahren zur automatischen Konfiguration von Business-Regeln in Duplikaterkennungssystemen. Dabei wurden für Fachanwender Möglichkeiten entwickelt, um beispielgetrieben das Match-System an individuelle Business-Regeln (u.a. Umzugserkennung, Sperrlistenabgleich) anzupassen und zu konfigurieren. Die entwickelten Verfahren wurden evaluiert und in einer prototypischen Lösung integriert. Wir konnten zeigen, dass unser Machine-Learning-Verfahren, die von einem Domainexperten erstellten Business-Regeln für das Duplikaterkennungssystem „identity“ verbessern konnte. Zudem konnte der hierzu erforderliche Zeitaufwand verkürzt werden.
- TextdokumentKonzeption eines Machine-Learnings-Verfahrens zum Lösen von Green Vehicle Routing Problemen(INFORMATIK 2022, 2022) Stockhausen,Pablo; Johannsen,Andreas; Maurer,RobertDieser Beitrag entwickelt ein Konzept zur praktischen Umsetzung eines Machine- Learning-Verfahrens zum Lösen von Vehicle Routing Problemen im Kontext einer nachhaltigen “Letzte-Meile”-Logistik, welches durch einen Prototyp umgesetzt und getestet wurde. Dabei wurden Aspekte von kombinatorischen Optimierungsalgorithmen in Form eines Ameisenalgorithmus zur Unterstützung des angewendeten Machine-Learning-Systems verwendet. Der Prototyp basiert auf einem “Reinforcement Learning”-System und verwendet als Algorithmus “REINFORCE mit Baseline”. In einer Vergleichsanalyse wird der Prototyp mit dem bekannten Vertreter für kombinatorische Optimierungsalgorithmen, Google-OR, an Hand von zwei Anwendungsszenarien verglichen. Die kombinatorischen Optimierungsalgorithmen konnten sich hinsichtlich der Lösungsqualität gegenüber dem Prototyp durchsetzen. Dafür überzeugt der Prototyp in der Laufzeit und dem Automatismus. Es wurde festgestellt, dass der verwendete Machine-Learning-Kontext für kleine bis mittelgroße Logistikdomänen nur geringe Vorteile ergibt. Eine Verwendung von lernenden Systemen für das Vehicle Routing Problem empfiehlt sich bei einem größeren Stoppvolumen und einer erweiterten IT-Infrastruktur. Letztlich bietet der Prototyp in diesem Beitrag eine Alternative gegenüber dem Outsourcing an Drittanbietern zum Lösen von Routingproblemen.
- TextdokumentMultiple Sequence Alignment using Deep Reinforcement Learning(SKILL 2021, 2021) Joeres, RomanMultiple sequence alignment (MSA) is one of the primal problems in biology and bioinformatics. The question of how to align multiple sequences correctly is crucial for many other fields of research, e.g., gaining information about the evolutionary distance of two or more sequences and therefore about their corresponding species, finding protein targets for drugs, or finding a drug for a certain target protein. Reinforcement learning (RL), and especially deep reinforcement learning (DRL), has become popular in recent years. To name just a few, DRL has shown major success in complex games such as Atari Games, Chess, and Go. We model the problem of aligning multiple sequences as a Markov decision process (MDP) and examine the performance of different (D)RL algorithms compared to state-of-the-art tools.
- ZeitschriftenartikelReinforcement Learning Schritt für Schritt in Schulprojekten(Informatische Bildung in Schulen (IBiS): Vol. 2, No. 1, 2024) Rau, ThomasIn diesem Artikel werden kleine Unterrichtsprojekte vorgestellt, anhand derer man sich dem Thema Reinforcement Learning – einem Teilbereich des Machine Learning, wie auch überwachtes und überwachtes Lernen – in mehreren Schritten in der Sekundarstufe II nähern kann. Jeder Schritt stößt am Ende auf Grenzen, so dass sich jeweils die nächste Erweiterung anbietet. Am Anfang steht das manuelle Anlegen einer einfachen handschriftlichen Tabelle über entscheidende Züge in einem Spiel. Weil das nur bei einfachen Spielen geht, ist der nächste Schritt das Anlegen und Anpassen einer Q-Tabelle mit kontinuierlicher Evaluation sämtlicher Züge. Im dritten Schritt wird die für manche Fälle nicht mehr ausreichende Q-Tabelle durch ein Neuronales Netz ersetzt.
- KonferenzbeitragTechnology Readiness Levels of Reinforcement Learning methods for simulation-based production scheduling(INFORMATIK 2023 - Designing Futures: Zukünfte gestalten, 2023) Seipolt, Arne; Buschermöhle, Ralf; Höfinghoff, Maximilian; Korn, Goy-Hinrich; Schumacher, MarcelDigital Twins (DT) are nowadays widely used and provide a benefit for the companies using it. One service of the DT is the simulation of a production process. This enables an optimization of the production process by simulation optimization, for example with Reinforcement Learning (RL). To support researchers and practitioners in deciding which algorithm is suitable for an implementation under real-life conditions, a literature research is performed, and a Machine Learning Technology Readiness Level is assigned to the different RL-Algorithms. It can be shown that recent research focuses mainly on model free value based and evolutionary algorithms, and both are suitable for an implementation in a real-world scenario. Both algorithms can outperform widely applied dispatching rules. Nevertheless, it should be evaluated why other algorithms are not in the focus of recent research and how the algorithms perform in comparison to each other.