Computer Graphics
TU Braunschweig

Computer Vision and Machine Learning SS'23
Vorlesung mit Übung

Prof. Dr.-Ing. Martin Eisemann

Hörerkreis: Master
Kontakt: cvml@cg.cs.tu-bs.de

Modul: INF-CG-036, INF-CG-037
Vst.Nr.: 4216036, 4216037

Aktuelles

Die erste Veranstaltung findet am 18.04.2023 statt.

Sprache

Da der Kurs auch im Master Data Science angeboten wird ist die Unterrichtssprache Englisch.

Beschreibung

Nach erfolgreichem Abschluss dieses Moduls besitzen die Studierenden ein grundlegendes Verständnis zur Entwicklung komplexer Computer Vision Anwendungen. Sie sind in der Lage Probleme aus der Computer Vision zu durchdringen und geeignete (KI-basierte) Lösungen zu entwerfen und praktisch zu implementieren.

Anmeldung

Für die Teilnahme an der Vorlesung und Übung können Sie sich auf unsere Webseite unter "Teaching -> Course Enrollment" registrieren (direkter Link https://graphics.tu-bs.de/teaching/students ).

Studip wird nicht verwendet für diesen Kurs.

Die Anmeldung für die Prüfung erfolgt über das Prüfungsamt

Bachelor/Master Hinweis

Auf Antrag (Formular beim Prüfungsamt verfügbar) kann dieser Kurs in der Regel auch im Bachelor belegt werden. Ob dieser Kurs auch regulär in Ihrem Bachelor angeboten wird entnehmen Sie bitte dem Modulhandbuch und Ihrer Prüfungsordnung.

Inhalt

Die Inhalte können sich noch bis zum Start der Vorlesung verändern

- Feature Detektoren und Deskriptoren
- Objekterkennung
- Matting
- Dense Correspondences
- Motion Capture
- Kamerakalibrierung
- Epipolar Geometrie
- Stereo und Multi-View Rekonstruktion
- Machine Learning für Computer Vision Probleme
- Computer Vision for Special Effects

Ort und Zeit

LIVE, Dienstags, 13:15–14:45 Uhr / Raum IZ 160, Lernvideos bitte VOR der Veranstaltung anschauen, diese werden weiter unten wöchentlich bereitgestellt)
Wöchentlich, beginnend am 18.04.2023

LIVE, Donnerstags, 09:45–11:15 Uhr / Raum IZ 160, Übungsblätter VOR der Veranstaltung bearbeiten, diese werden weiter unten in der Regel donnerstags bereitgestellt)
Wöchentlich, beginnend am 20.04.2023

tba

Vorlesungen

Die Vorlesung wird als Inverted Classroom durchgeführt, d.h. Sie müssen sich vorab das bereitgestellte Video/Material anschauen und die Vorlesungszeit kann für Fragen und vertiefende Thematiken genutzt werden.

Das Material für die jeweils nächste Veranstaltung, sowie die Vorlesungsfolien, werden in der Regel eine Woche vorher hier zur Verfügung gestellt.

Das Passwort wird in der VL bekannt gegeben und kann notfalls unter cvml@cg.cs.tu-bs.de erfragt werden.

Die LIVE Sessions finden jeden Dienstag regulär statt, ausser in der Exkursionswoche.

Übungen

In den Übungen wird in Python mit OpenCV und TensorFlow/PyTorch programmiert.

Die Übungsaufgaben werden jeweils Donnerstags online gestellt und am darauffolgenden Donnerstag in der Übungsstunde besprochen.

Die theoretischen Aufgaben eines jeden Übungsblattes sind in Gruppen von zwei bis drei Personen anzufertigen und bis spätestens Mittwochs 9:30 Uhr im Git Repository der jeweiligen Übung hochzuladen. Namen und Matrikelnummer auf den Blättern nicht vergessen.

Die praktischen Aufgaben müssen in der Übungsstunde vorgeführt werden. Arbeitsgruppen von bis zu drei Leuten sind erlaubt, doch muss jeder in der Gruppe selbstständig eventuelle Fragen zu den Aufgaben und dem Code beantworten können.

Die Frameworks und Lösungen wurden auf den Rechnern im CIP Pool getestet. Leider können wir keine direkte Unterstützung für andere Systeme garantieren. Für die Anfertigung der praktischen Aufgaben ist ein Computer mit Linux oder Windows erforderlich. Die Funktion des Frameworks unter Mac OS/X kann nicht garantiert werden. Bei Problemen meldet euch per Email an cvml@cg.cs.tu-bs.de.

Kickoff-Folien [pdf] aus der ersten Übung.

Blatt 1

IDE Setup, Hello World, Debugging
Bearbeitungszeit: 20.04.–03.05.
Präsentation: 04.05.

Blatt 2

Introduction to Python, Image Handling, Color Spaces
Bearbeitungszeit: 04.05.–17.05.
Präsentation: 18.05.

Blatt 3

Noise, Filtering, Image Stacking, Edge Detection, Thresholding
Bearbeitungszeit: 18.05.–31.05.
Präsentation: 01.06.

Blatt 4

Feature Detection, Object Recognition and Detection
Bearbeitungszeit: 01.06.–14.06.
Präsentation: 15.06.

Blatt 5

Optical Flow
Bearbeitungszeit: 15.06.–28.06.
Präsentation: 29.06.

Blatt 6

Epipolar Geometry, Depth Estimation
Bearbeitungszeit: 29.06.–12.07.
Präsentation: 13.07.

Prüfung

Prüfungszeitraum siehe unter Ort und Zeit.
Eventuelle Änderungen werden in der Vorlesung und auf dieser Webseite rechtzeitig bekanntgegeben.

  • Prüfungsform: schriftliche Klausur
  • Scheinerwerb durch Bestehen der Prüfung (mind. 50% der Punkte)
  • Voraussetzung zum Modulabschluss: mindestens 50% der Punkte aus den Übungen erreicht.
  • Prüfungsteilnahme auch bei Vertiefung empfehlenswert!
  • Studierende müssen sich beim Prüfungsamt anmelden!

Nachholprüfung

Falls Sie in der regulären Prüfung durchgefallen sind oder einen Freiversuch geltend machen wollen, haben Sie die Möglichkeit zur Nachholprüfung anzutreten. Diese finden in der Regel in der ersten vorlesungsfreien Woche statt. Zur Anmeldung registrieren Sie sich bitte für die Prüfung regulär beim Prüfungsamtund senden Sie bitte eine entsprechende Email mit der Bitte um mündliche Nachholprüfung an sekretariat@cg.cs.tu-bs.de unter Angabe ihres vollen Namens, Matrikelnummer, TU Emailadresse und Studiengang.

Die mündlichen Nachholprüfungen finden in der Regel gesammelt jeweils 1x im Semester statt. Ein Termin wird ihnen nach Anmeldung rechtzeitig vorher mitgeteilt.

Ergänzungsprüfung

Falls Sie eine mündliche Ergänzungsprüfung benötigen, weil Sie im letzten regulären Versuch die Prüfung nicht bestanden haben, so senden Sie bitte umgehend nach Erhalt der Note (also wenn diese offiziell beim Prüfungsamt eingetragen wurde) eine Email mit der Bitte um mündliche Ergänzungsprüfung an sekretariat@cg.cs.tu-bs.de unter Angabe ihres vollen Namens, Matrikelnummer, TU Emailadresse und Studiengang.

Die mündlichen Ergänzungsprüfungen finden in der Regel gesammelt jeweils 1x im Semester statt. Ein Termin wird ihnen rechtzeitig vorher mitgeteilt.

Anforderungen

  • Programmierkenntnisse, vorzugsweise in Python

Literatur

  • Richard J. Radke: Computer Vision for Visual Effects,
  • Richard Szeliski: Computer Vision: Algorithms and Applications, Springer Verlag
  • D. Forsyth and J. Ponce: Computer Vision: A Modern Approach. Prentice Hall