XITASO GmbH

Masterand (all genders) – Semantic 4D Occupancy Forecasting

Stelle frei: Ab sofort
Abschlussarbeit (nur extern)
Befristete Anstellung
Baden-Württemberg
Eintrag vom 11.06.2026
Angebotsnr. 120440

Stellenbeschreibung

Die semantische 4D-Belegungsvorhersage (Semantic 4D Occupancy Forecasting) ist von entscheidender Bedeutung für sicheres autonomes Fahren, da sie es Fahrzeugen ermöglicht, zukünftige Szenendynamiken und -geometrien zu antizipieren. Das Training moderner State-of-the-Art-Modelle stützt sich jedoch stark auf vollständig überwachte Methoden (fully supervised methods), die massive und extrem teure, dichte 3D-Voxel-Annotationen erfordern.

Um diesen Datenengpass zu überwinden, verlagert sich die Spitzenforschung zunehmend hin zu selbstüberwachten (self-supervised) und schwach überwachten (weakly-supervised) Paradigmen, die vortrainierte 2D-Foundation-Modelle (z. B. DINOv2, CLIP oder SAM) nutzen. Durch die Ausrichtung (Alignment) dieser reichhaltigen Open-Vocabulary 2D-Semantikmerkmale an räumlichen 3D-/4D-Repräsentationen mithilfe fortschrittlicher Transformer-Architekturen ist es möglich, ein robustes räumlich-zeitliches Verständnis ohne dichte 3D-Ground-Truth-Daten zu erreichen.

Aufbauend auf diesen Durchbrüchen konzentriert sich diese Masterarbeit auf die Entwicklung eines Foundation-Model-basierten Frameworks für die visionsbasierte 4D-Belegungsvorhersage. Deine Aufgabe wird es sein, eine Architektur zu entwerfen, die reichhaltige Multi-View-Semantiken in eine 4D-Vorhersage-Pipeline destilliert und so die Lücke zwischen skalierbaren, rein kamerabasierten Eingaben und hochpräzisen (high-fidelity) Umgebungsvorhersagen schließt.

Aufgaben:
Entwicklung eines Transformer-basierten Netzwerks zur Vorhersage der zukünftigen semantischen 4D-Belegung aus sequenziellen Multi-View-Kameradaten mittels schwacher oder Selbstüberwachung.
Aufbau und Training der PyTorch-Pipeline sowie Entwurf von Alignment-Mechanismen, um semantische Merkmale aus 2D-Foundation-Modellen in die räumlich-zeitliche 4D-Repräsentation zu destillieren.
Benchmarking gegen vollständig überwachte Baselines auf großen Datensätzen (z. B. nuScenes, OpenOccupancy) mit besonderem Fokus auf Vorhersagegenauigkeit (IoU), semantischer Präzision und Label-Effizienz.

Anforderungen:
- Masterstudent*in der Informatik, Künstlichen Intelligenz, Robotik o.ä.
- Sehr gute Programmierkenntnisse in Python, fundierte Erfahrung mit Deep-Learning-Frameworks (insb. PyTorch)
- Starkes Hintergrundwissen im Bereich 3D Computer Vision
- Kenntnisse zu Vision Transformers (ViT), Foundation Models (DINO, CLIP), Paradigmen des selbst- bzw. schwach überwachten Lernens
- Sehr gute Englisch- und Deutschkenntnisse (C1-Level)

Das solltest du mitbringen

Gewünschtes Studium
  • Ingenieurwissenschaften
  • Informatik
    Mechatronik & Informationstechnik
    Computer Science
    Mechatronics and Information Technology
Gesuchter Karrierestatus
  • Studierende:r
Deutschsprachniveau
GER B2

So sieht der Arbeitsplatz aus

Unternehmensbereich
  • Forschung
Arbeitszeitmodell
Vollzeit
Homeoffice
Teilweise Home Office
Sprache am Arbeitsplatz
Deutsch und Englisch

Unternehmensinformationen

Art des Unternehmens
KMU
Unternehmensbranche
  • IT & Internet

So bewirbst du dich

Bewerbungsprozess
https://xitaso.com/karriere/bewerbungsprozess/

Kontakt

Deine Ansprechpartnerin:
Daniela
+49 821 885882-0
work@xitaso.com
XITASO GmbH
Unternehmensanschrift

XITASO GmbH
Austraße 35
86153 Augsburg
Deutschland
Telefon: +49 821 885882-0
Zurück zur Anzeigenübersicht