Auflistung nach Schlagwort "Information Retrieval"
1 - 10 von 22
Treffer pro Seite
Sortieroptionen
- ZeitschriftenartikelAnswering Comparative Questions with Arguments(Datenbank-Spektrum: Vol. 20, No. 2, 2020) Bondarenko, Alexander; Panchenko, Alexander; Beloucif, Meriem; Biemann, Chris; Hagen, MatthiasQuestion answering platforms such as Yahoo! Answers or Quora always contained questions that ask other humans for help when comparing two or more options. Since nowadays more and more people also “talk” to their devices, such comparative questions are also part of the query stream that major search engines receive. Interestingly, major search engines answer some comparative questions pretty well while for others, they just show the “standard” ten blue links. But a good response to a comparative question might be very different from these ten blue links—for example, a direct answer could show an aggregation of the pros and cons of the different options. This observation motivated our DFG-funded project “ACQuA: Answering Comparative Questions with Arguments” for which we describe the achieved results so far, and ongoing activities like the first shared task on argument retrieval.
- ZeitschriftenartikelAutomated Traceability Link Recovery Between Requirements and Source Code(Softwaretechnik-Trends Band 44, Heft 2, 2024) Hey, TobiasEfficient development, maintenance, and management of software systems rely heavily on understanding the relationships between the various software artifacts. Manual creation and maintenance of traceability information between these artifacts incur high costs due to the required human expertise. Often this results in a deficiency in available traceability information that hampers the efficiency of the software projects. The FTLR approach presented in this dissertation aims to enhance automatic traceability link recovery between requirements and source code by leveraging a fine-grained semantic similarity comparison using pre trained word embeddings and Word Movers Distance. FTLR achieves significant improvements in traceabil ity connection identification by employing the fine grained mapping with subsequent majority vote-based aggregation. Additionally, it employs a novel approach for filtering irrelevant parts of requirements using a large language model-based classifier called NoRBERT, which achieves promising results on unseen projects. Furthermore, this dissertation explores the integration of bimodal large language models into FTLR but finds no significant performance increase over word embeddings. A comparative analysis showed that FTLR outperforms existing approaches in mean average precision and F1-scores, especially on projects with object-oriented source code. However, challenges, remain to fully automate traceability link recovery, particularly in large-scale projects.
- TextdokumentBlueprint for a Production-Ready Information Retrieval System based on Multi-Modal Embeddings(INFORMATIK 2021, 2021) Ebert, André; Apel, Anika; Chodyko, Piotr; Hiroyasu, Kyle; Ismali, Festina; Koo, Hyein; Kronburger, Julia; Pesch, RobertDeep Learning models for mapping documents from different domains, e.g., text, images, and audio, into a common vector space, enable a seamless information retrieval between the different domains and, thus, significantly improve the user experience of many expert tools. Despite various models for multi-modal mappings presented in scientific literature, the implementation and integration remain a challenge within the industry, especially for small or medium-sized companies. Reasons are, that developing such retrieval systems for production use-cases is a non-trivial task, requiring scalable, reliable, and cost-efficient infrastructure, services as well as adequate Deep Learning models. We present a generic and flexible blueprint architecture, targeting the development of a production-ready image-text retrieval search system using Kubernetes, MLflow, Elasticsearch, and integrating state-of-the-art Deep Learning models.
- ZeitschriftenartikelDas Sombi-Framework zum Ermitteln geeigneter Suchfunktionen für biologische Modelldatenbasen(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Waltemath, Dagmar; Henkel, Ron; Meyer, Holger; Heuer, AndreasDie Wiederverwendung von Simulationsmodellen biologischer Systeme ist mit der ansteigenden Zahl der in Modelldatenbanken gespeicherten Modelle zu einem wichtigen Forschungsproblem geworden. Ein Teilproblem ist die effiziente Suche nach relevanten Modellen in einer Datenbasis. Als Lösungsansatz wurde kürzlich die Nutzung von Information-Retrieval-Techniken für das bewertete Finden von Modellen vorgestellt.Die im Folgenden beschriebene Software stellt Anwendungsentwicklern ein Framework zur Evaluation verschiedener Retrieval- und Rankingfunktionen unter Nutzung unterschiedlicher Datenbasen zur Verfügung. Der modulare Aufbau des Frameworks ermöglicht die Unterstützung weiterer XML-basierter Beschreibungsformate sowie das Einbinden zusätzlicher Funktionen. Voraussetzungen für die Verwendung des Frameworks sind die Kodierung der Simulationsmodelle in einem XML-basierten Standard-Repräsentationsformat sowie die Verfügbarkeit von semantischen Modellinformationen, z.B. in Form von in Ontologien kodierten Meta-Informationen. Sombi wurde als Evaluationswerkzeug für Datenbankentwickler im Bereich der Modellspeicherung in der Systembiologie entwickelt. Eine Verwendung des Frameworks auf anderen Anwendungsgebieten ist jedoch vorstellbar.
- WorkshopbeitragData Ocean(Mensch & Computer 2014 - Tagungsband, 2014) Meiller, DieterHier wird das Konzept für eine neuartige Benutzungs-Oberfläche vorgestellt, welche die Verwaltung von Daten-Beständen und die Suche von Informationen stark vereinfacht: Anstatt eines reaktiven Systems wird ein proaktives System vorgeschlagen. Als Ersatz für die Desktop-Metapher wird angeregt, die Daten als aktive Lebewesen aufzufassen, die sich auf dem Ökosystem Computer bewegen: ein Data Ocean.
- ZeitschriftenartikelDatenschutz und Suche in digitalen sozialen Netzwerken(Datenbank-Spektrum: Vol. 10, No. 1, 2010) Jürgensmann, Susanne; Pekrul, Sören; Düffer, Martin; Meyer, Holger; Heuer, AndreasDie Menge der in digitalen Netzwerken gespeicherten Informationen nimmt ständig zu. Aus diesem Grund wächst auch das öffentliche Interesse an Datenschutzaspekten in digitalen sozialen Netzen. Speziell in Geschäftsnetzwerken, in denen es häufig um sensible Daten geht, ist dieses Thema von zentraler Bedeutung.Die Konzepte des Web 2.0, auf denen die genannten Netzwerke basieren, stehen jedoch für Offenheit: Jedem Nutzer sollen alle Informationen in möglichst einfacher Art und Weise zur Verfügung gestellt werden.Im Rahmen des Projektes Transfer-Net wurden wir mit diesem Widerspruch konfrontiert und haben uns auf die Suche nach Lösungsmöglichkeiten gemacht. Als Basis diente ein umfangreicher Vergleich von sechs Business-Community-Plattformen. Betrachtet wurden dabei nicht nur die Möglichkeiten, die die Plattformen bieten, um Nutzerdaten zu schützen, sondern auch, ob interne und externe Möglichkeiten der Suche diese berücksichtigen.In diesem Artikel soll verdeutlicht werden, wie digitale soziale Netzwerke konzipiert werden müssen, um einerseits sensible Geschäftsdaten vor unberechtigten Zugriffen zu schützen, andererseits aber eine leichte Bedienbarkeit der Netzwerke zu gewährleisten.
- KonferenzbeitragEin empirischer Zugang zur Ermittlung von Kompetenzprofilen in der Digitalen Wirtschaft(Workshop Gemeinschaften in Neuen Medien (GeNeMe) 2008, 2008) Ziebarth, Sabrina; Malzahn, Nils; Zeini, Sam; Hoppe, Ulrich
- KonferenzbeitragEntwurf einer Service-orientierten Architektur als Erweiterung einer Plattform zum Programm-Austausch(Workshop Audiovisuelle Medien WAM 2009, 2009) Kürsten, JensDer vorliegende Beitrag beschreibt ein Konzept für eine Webservice Architektur zur Recherche in audiovisuellen Inhalten. Dazu wird auf die Rahmenbedingungen einer bestehenden Plattform und den Workflow der Produktion in Lokalsendern eingegangen. Das Ziel ist die Entwicklung eines standardisierten Archivierungsprozesses und die Erweiterung der bestehenden Plattform zum Programmaustausch zur Wieder- und Weiterverwertung von produziertem Material.
- KonferenzbeitragFindoo – Interoperable E-Learning Semantic Search and Content Authoring Assistance(20. Fachtagung Bildungstechnologien (DELFI), 2022) Streicher, Alexander; Schwarz, SimonSearch engine assistance systems can be of great use in the creation and curation of e-learning content. However, conventional crawling methods are typically limited in Learning Management Systems (LMS) due to technical barriers such as authentication or proprietary data formats. This article presents the concept and implementation of an e-learning search engine called “Findoo” based on a Learning Tools Interoperability (LTI) deep web crawler, combined with an assistance tool for content curation, e.g., restructuring of learning objects. Our concept includes robust crawling as well as assistance functions such as a semantic search and content recommendations. The system is designed with a modular architecture which makes fine-tuning to future use cases possible. Experimental technical verification results indicate that the system is well suited for domain-specific information retrieval.
- TextdokumentGerman Question Answering in CRM Systems(INFORMATIK 2021, 2021) Schäfter, Sophie; Zylowski, ThorstenWe present a Question Answering (QA) approach within the context of Customer Relationship Management (CRM) systems in German which we applied to several use cases. However, we aim to generalize the suggested approach, so it can be applied to other domains. In this course, the subjects of tabular QA, extractive QA and Frequently Asked Questions (FAQ) are examined. Moreover, we reveal our findings regarding fine-tuning transformer models for QA and propose an automatic labelling mechanism that can be integrated into QA systems in order to simplify the creation of training data. We evaluated on various CRM-related data sources. The evaluation of the fine-tuned extractive QA pipeline resulted in an F1-score of 76.93 %. A qualitative analysis by domain experts showed that the tabular QA pipeline with translation and column name mapping leads to an accuracy of 40 %.
- «
- 1 (current)
- 2
- 3
- »