Auflistung nach Schlagwort "Object detection"
1 - 3 von 3
Treffer pro Seite
Sortieroptionen
- ZeitschriftenartikelActive and Incremental Learning with Weak Supervision(KI - Künstliche Intelligenz: Vol. 34, No. 2, 2020) Brust, Clemens-Alexander; Käding, Christoph; Denzler, JoachimLarge amounts of labeled training data are one of the main contributors to the great success that deep models have achieved in the past. Label acquisition for tasks other than benchmarks can pose a challenge due to requirements of both funding and expertise. By selecting unlabeled examples that are promising in terms of model improvement and only asking for respective labels, active learning can increase the efficiency of the labeling process in terms of time and cost. In this work, we describe combinations of an incremental learning scheme and methods of active learning. These allow for continuous exploration of newly observed unlabeled data. We describe selection criteria based on model uncertainty as well as expected model output change (EMOC). An object detection task is evaluated in a continuous exploration context on the PASCAL VOC dataset. We also validate a weakly supervised system based on active and incremental learning in a real-world biodiversity application where images from camera traps are analyzed. Labeling only 32 images by accepting or rejecting proposals generated by our method yields an increase in accuracy from 25.4 to 42.6%.
- ZeitschriftenartikelAttention-Based Detection of Unknown Objects in a Situated Vision Framework(KI - Künstliche Intelligenz: Vol. 27, No. 3, 2013) Martín García, Germán; Frintrop, Simone; Cremers, Armin B.We present an attention-based approach for the detection of unknown objects in a 3D environment. The ability to address individual objects in the environment without having previous knowledge about their properties or their identity is one important requirement of the Situated Vision theory. Based on saliency maps, our attention system determines the regions where objects are likely to be found; these are the proto-objects whose extent is refined by a 2D segmentation step. At the same time a 3D scene model is built from measurements of a depth camera. The detected objects are projected into the 3D scene, resulting in 3D object models which are incrementally updated. We show the validity of our approach in an RGB-D sequence recorded in an office environment.
- ZeitschriftenartikelMit Computer Vision zur automatisierten Qualitätssicherung in der industriellen Fertigung: Eine Fallstudie zur Klassifizierung von Fehlern in Solarzellen mittels Elektrolumineszenz-Bildern(HMD Praxis der Wirtschaftsinformatik: Vol. 58, No. 2, 2021) Zschech, Patrick; Sager, Christoph; Siebers, Philipp; Pertermann, MaikDie Qualitätssicherung bei der Produktion von Solarzellen ist ein entscheidender Faktor, um langfristige Leistungsgarantien auf Solarpanels gewähren zu können. Die vorliegende Arbeit leistet hierzu einen Beitrag zur automatisierten Fehlererkennung auf Wafern, indem Elektrolumineszenz-Bilder eines realen Herstellungsszenarios mithilfe von verschiedenen Computer-Vision-Modellen klassifiziert werden. Die Herausforderung besteht hierbei nicht nur darin, defekte Wafer von funktionsfähigen zu separieren, sondern gleichzeitig auch zwischen spezifischen Fehlerarten zu unterscheiden, während geringe Inferenzzeiten sicherzustellen sind. Zu diesem Zweck werden neben einfachen statistischen Modellen verschiedene Deep-Learning-Architekturen auf Basis von Convolutional Neural Networks (CNNs) verprobt und miteinander vergleichen. Ziel der Arbeit ist es, verschiedene Klassifizierungsansätze unterschiedlicher Komplexität zu testen und auf ihre praktische Einsatzfähigkeit unter realen Bedingungen zu untersuchen. Die Fallstudie zeigt, dass je nach Situation unterschiedliche Modelle ihre Existenzberechtigung haben und in Kombination sehr gute Ergebnisse erzielen. So lassen sich bereits mit statistischen Modellen und einfachen CNN-Varianten zuverlässige Aussagen mit Genauigkeiten von über 99 % bei Fehlertypen einfacher bis mittlerer Erkennbarkeit realisieren. Werden die Fehlerbilder demgegenüber diffuser und soll die Nachvollziehbarkeit der Ergebnisse durch positionsgenaue Lokalisierung von Fehlerobjekten gewährleistet werden, sind fortgeschrittenere Ansätze auf Basis sogenannter Region-Proposal-Netzwerke erforderlich, die allerdings auch mit einem erhöhten Labeling-Aufwand beim Annotieren der Fehlerobjekte einhergehen. Da die Umsetzung sämtlicher Modelle ausschließlich auf Open Source Tools wie zum Beispiel TensorFlow, Keras und OpenCV basiert, demonstriert die Fallstudie zudem, welche Möglichkeiten durch frei verfügbare Lösungen im Bereich von Computer Vision geboten werden. Quality assurance in the production of solar cells is a decisive factor for long-term performance guarantees on solar panels. This work contributes to this area in developing computer vision models to automatically detect defects on wafers by classifying electroluminescence images from a real manufacturing scenario. The challenge is not only to separate defective wafers from flawless ones but also to distinguish between specific types of defects while ensuring low inference times. For this purpose, simple statistical models, as well as different kinds of deep learning architectures based on convolutional neural networks (CNNs), are tested and compared with each other. Therefore, this work aims to evaluate multiple classification approaches of varying complexity levels while examining their practical applicability under real industrial conditions. The case study shows that all models have their right to exist and achieve excellent results in combination. While statistical models and simple CNNs provide reliable statements with accuracies up to 99% for defect types of simple to medium detectability, more advanced approaches based on region proposal networks are required once the defect images become more diffuse. The more advanced approaches allow a precise object localization of defects; however, they are also associated with increased labeling effort when annotating wafer images. Since the implementation of all models is based exclusively on open source tools such as TensorFlow, Keras, and OpenCV, the case study also demonstrates the possibilities offered by freely accessible solutions in the field of computer vision.