Auflistung nach Schlagwort "Information Retrieval"
1 - 10 von 20
Treffer pro Seite
Sortieroptionen
- ZeitschriftenartikelAnswering Comparative Questions with Arguments(Datenbank-Spektrum: Vol. 20, No. 2, 2020) Bondarenko, Alexander; Panchenko, Alexander; Beloucif, Meriem; Biemann, Chris; Hagen, MatthiasQuestion answering platforms such as Yahoo! Answers or Quora always contained questions that ask other humans for help when comparing two or more options. Since nowadays more and more people also “talk” to their devices, such comparative questions are also part of the query stream that major search engines receive. Interestingly, major search engines answer some comparative questions pretty well while for others, they just show the “standard” ten blue links. But a good response to a comparative question might be very different from these ten blue links—for example, a direct answer could show an aggregation of the pros and cons of the different options. This observation motivated our DFG-funded project “ACQuA: Answering Comparative Questions with Arguments” for which we describe the achieved results so far, and ongoing activities like the first shared task on argument retrieval.
- TextdokumentBlueprint for a Production-Ready Information Retrieval System based on Multi-Modal Embeddings(INFORMATIK 2021, 2021) Ebert, André; Apel, Anika; Chodyko, Piotr; Hiroyasu, Kyle; Ismali, Festina; Koo, Hyein; Kronburger, Julia; Pesch, RobertDeep Learning models for mapping documents from different domains, e.g., text, images, and audio, into a common vector space, enable a seamless information retrieval between the different domains and, thus, significantly improve the user experience of many expert tools. Despite various models for multi-modal mappings presented in scientific literature, the implementation and integration remain a challenge within the industry, especially for small or medium-sized companies. Reasons are, that developing such retrieval systems for production use-cases is a non-trivial task, requiring scalable, reliable, and cost-efficient infrastructure, services as well as adequate Deep Learning models. We present a generic and flexible blueprint architecture, targeting the development of a production-ready image-text retrieval search system using Kubernetes, MLflow, Elasticsearch, and integrating state-of-the-art Deep Learning models.
- ZeitschriftenartikelDas Sombi-Framework zum Ermitteln geeigneter Suchfunktionen für biologische Modelldatenbasen(Datenbank-Spektrum: Vol. 11, No. 1, 2011) Waltemath, Dagmar; Henkel, Ron; Meyer, Holger; Heuer, AndreasDie Wiederverwendung von Simulationsmodellen biologischer Systeme ist mit der ansteigenden Zahl der in Modelldatenbanken gespeicherten Modelle zu einem wichtigen Forschungsproblem geworden. Ein Teilproblem ist die effiziente Suche nach relevanten Modellen in einer Datenbasis. Als Lösungsansatz wurde kürzlich die Nutzung von Information-Retrieval-Techniken für das bewertete Finden von Modellen vorgestellt.Die im Folgenden beschriebene Software stellt Anwendungsentwicklern ein Framework zur Evaluation verschiedener Retrieval- und Rankingfunktionen unter Nutzung unterschiedlicher Datenbasen zur Verfügung. Der modulare Aufbau des Frameworks ermöglicht die Unterstützung weiterer XML-basierter Beschreibungsformate sowie das Einbinden zusätzlicher Funktionen. Voraussetzungen für die Verwendung des Frameworks sind die Kodierung der Simulationsmodelle in einem XML-basierten Standard-Repräsentationsformat sowie die Verfügbarkeit von semantischen Modellinformationen, z.B. in Form von in Ontologien kodierten Meta-Informationen. Sombi wurde als Evaluationswerkzeug für Datenbankentwickler im Bereich der Modellspeicherung in der Systembiologie entwickelt. Eine Verwendung des Frameworks auf anderen Anwendungsgebieten ist jedoch vorstellbar.
- WorkshopbeitragData Ocean(Mensch & Computer 2014 - Tagungsband, 2014) Meiller, DieterHier wird das Konzept für eine neuartige Benutzungs-Oberfläche vorgestellt, welche die Verwaltung von Daten-Beständen und die Suche von Informationen stark vereinfacht: Anstatt eines reaktiven Systems wird ein proaktives System vorgeschlagen. Als Ersatz für die Desktop-Metapher wird angeregt, die Daten als aktive Lebewesen aufzufassen, die sich auf dem Ökosystem Computer bewegen: ein Data Ocean.
- ZeitschriftenartikelDatenschutz und Suche in digitalen sozialen Netzwerken(Datenbank-Spektrum: Vol. 10, No. 1, 2010) Jürgensmann, Susanne; Pekrul, Sören; Düffer, Martin; Meyer, Holger; Heuer, AndreasDie Menge der in digitalen Netzwerken gespeicherten Informationen nimmt ständig zu. Aus diesem Grund wächst auch das öffentliche Interesse an Datenschutzaspekten in digitalen sozialen Netzen. Speziell in Geschäftsnetzwerken, in denen es häufig um sensible Daten geht, ist dieses Thema von zentraler Bedeutung.Die Konzepte des Web 2.0, auf denen die genannten Netzwerke basieren, stehen jedoch für Offenheit: Jedem Nutzer sollen alle Informationen in möglichst einfacher Art und Weise zur Verfügung gestellt werden.Im Rahmen des Projektes Transfer-Net wurden wir mit diesem Widerspruch konfrontiert und haben uns auf die Suche nach Lösungsmöglichkeiten gemacht. Als Basis diente ein umfangreicher Vergleich von sechs Business-Community-Plattformen. Betrachtet wurden dabei nicht nur die Möglichkeiten, die die Plattformen bieten, um Nutzerdaten zu schützen, sondern auch, ob interne und externe Möglichkeiten der Suche diese berücksichtigen.In diesem Artikel soll verdeutlicht werden, wie digitale soziale Netzwerke konzipiert werden müssen, um einerseits sensible Geschäftsdaten vor unberechtigten Zugriffen zu schützen, andererseits aber eine leichte Bedienbarkeit der Netzwerke zu gewährleisten.
- KonferenzbeitragEin empirischer Zugang zur Ermittlung von Kompetenzprofilen in der Digitalen Wirtschaft(Workshop Gemeinschaften in Neuen Medien (GeNeMe) 2008, 2008) Ziebarth, Sabrina; Malzahn, Nils; Zeini, Sam; Hoppe, Ulrich
- KonferenzbeitragEntwurf einer Service-orientierten Architektur als Erweiterung einer Plattform zum Programm-Austausch(Workshop Audiovisuelle Medien WAM 2009, 2009) Kürsten, JensDer vorliegende Beitrag beschreibt ein Konzept für eine Webservice Architektur zur Recherche in audiovisuellen Inhalten. Dazu wird auf die Rahmenbedingungen einer bestehenden Plattform und den Workflow der Produktion in Lokalsendern eingegangen. Das Ziel ist die Entwicklung eines standardisierten Archivierungsprozesses und die Erweiterung der bestehenden Plattform zum Programmaustausch zur Wieder- und Weiterverwertung von produziertem Material.
- KonferenzbeitragFindoo – Interoperable E-Learning Semantic Search and Content Authoring Assistance(20. Fachtagung Bildungstechnologien (DELFI), 2022) Streicher, Alexander; Schwarz, SimonSearch engine assistance systems can be of great use in the creation and curation of e-learning content. However, conventional crawling methods are typically limited in Learning Management Systems (LMS) due to technical barriers such as authentication or proprietary data formats. This article presents the concept and implementation of an e-learning search engine called “Findoo” based on a Learning Tools Interoperability (LTI) deep web crawler, combined with an assistance tool for content curation, e.g., restructuring of learning objects. Our concept includes robust crawling as well as assistance functions such as a semantic search and content recommendations. The system is designed with a modular architecture which makes fine-tuning to future use cases possible. Experimental technical verification results indicate that the system is well suited for domain-specific information retrieval.
- TextdokumentGerman Question Answering in CRM Systems(INFORMATIK 2021, 2021) Schäfter, Sophie; Zylowski, ThorstenWe present a Question Answering (QA) approach within the context of Customer Relationship Management (CRM) systems in German which we applied to several use cases. However, we aim to generalize the suggested approach, so it can be applied to other domains. In this course, the subjects of tabular QA, extractive QA and Frequently Asked Questions (FAQ) are examined. Moreover, we reveal our findings regarding fine-tuning transformer models for QA and propose an automatic labelling mechanism that can be integrated into QA systems in order to simplify the creation of training data. We evaluated on various CRM-related data sources. The evaluation of the fine-tuned extractive QA pipeline resulted in an F1-score of 76.93 %. A qualitative analysis by domain experts showed that the tabular QA pipeline with translation and column name mapping leads to an accuracy of 40 %.
- ZeitschriftenartikelLIVIVO – the Vertical Search Engine for Life Sciences(Datenbank-Spektrum: Vol. 17, No. 1, 2017) Müller, Bernd; Poley, Christoph; Pössel, Jana; Hagelstein, Alexandra; Gübitz, ThomasThe explosive growth of literature and data in the life sciences challenges researchers to keep track of current advancements in their disciplines. Novel approaches in the life science like the One Health paradigm require integrated methodologies in order to link and connect heterogeneous information from databases and literature resources. Current publications in the life sciences are increasingly characterized by the employment of trans-disciplinary methodologies comprising molecular and cell biology, genetics, genomic, epigenomic, transcriptional and proteomic high throughput technologies with data from humans, plants, and animals. The literature search engine LIVIVO empowers retrieval functionality by incorporating various literature resources from medicine, health, environment, agriculture and nutrition. LIVIVO is developed in-house by ZB MED – Information Centre for Life Sciences. It provides a user-friendly and usability-tested search interface with a corpus of 55 Million citations derived from 50 databases. Standardized application programming interfaces are available for data export and high throughput retrieval. The search functions allow for semantic retrieval with filtering options based on life science entities. The service oriented architecture of LIVIVO uses four different implementation layers to deliver search services. A Knowledge Environment is developed by ZB MED to deal with the heterogeneity of data as an integrative approach to model, store, and link semantic concepts within literature resources and databases. Future work will focus on the exploitation of life science ontologies and on the employment of NLP technologies in order to improve query expansion, filters in faceted search, and concept based relevancy rankings in LIVIVO.