Florian Gallwitz

Sprechstunde:
Mittwochs von 10:15 - 11:15 Uhr (im Wintersemester 2018/19), nach vorheriger Anmeldung per E-Mail

Florian Gallwitz

Prof. Dr.-Ing.

Ämter, Funktionen
Lehrgebiete

Medieninformatik, Mustererkennung

M. Weisser, Programmierung eines Steuerungsmoduls für den humanoiden Roboter Nao zur Durchführung gezielter MinigolfschlägeS. Wiegner, Imitation menschlicher Bewegungsabläufe durch einen humanoiden Roboter unter Einsatz einer TiefensensorkameraS. Dotenco, Ein Personenverfolgungsmodul für humanoide RoboterD. Haller, Autonomously detecting an picking up scattered objects: design and implementation of a module for humanoid robotsD. Haller, Autonomously detecting an picking up scattered objects: design and implementation of a module for humanoid robotsC. Ullrich, Evaluierung und Implementierung eines Konzeptes für die autonome Orientierung eines humanoiden Roboters anhand potentieller Warnzeichen oder GefahrensituationenA. Lindsteding, Indoor-Selbstlokalisierung eines autonomen Quadrocopters mit Methoden der BildverarbeitungA. Lindsteding, Indoor-Selbstlokalisierung eines autonomen Quadrocopters mit Methoden der BildverarbeitungD. Matthei, Algorithmus zur Lokalisierung von Mustern in diskreten AudiosignalenSebastian Geissler, Automatische Erkennung von Musik-Genres

Forschungsgebiete
  • Automatische Verarbeitung von Sprache, Bildern, Videos und Musik
  • Steuerung autonomer Roboter mit Methoden der Bildverarbeitung (unsere Roboter im Multimedialabor: Pepper (SoftBank), Aldebaran Nao H25, Parrot AR Drone 2.0, Parrot Bebop Drone)
Lehrveranstaltungen

Lehrveranstaltungen im Wintersemester 2018/19

Weitere regelmäßig gehaltene Lehrveranstaltungen

  • Medienverarbeitung (Link funktioniert nur im Ohm- bzw. IN-VPN)
  • Grundlagen der Informatik (Link funktioniert nur im Ohm- bzw. IN-VPN)
Abschlussarbeiten

Wenn Sie auf der Suche nach einem interessanten Thema für eine Abschlussarbeit im Umfeld Medienverarbeitung/Mustererkennung sind oder wenn Sie einen Betreuer für eine Arbeit in diesem Themenfeld benötigen, dann können Sie sich gerne per E-Mail an mich wenden.

Hier eine Liste der Abschlussarbeiten (Bachelor, Master- und Diplomarbeiten), die ich seit dem Jahr 2010 als Erstgutachter betreut habe bzw. aktuell noch betreue:

  • Zuverlässige Anonymisierung von Gesichtern in Video-Dateien
  • Modellierung von Texten mit Rekurrenten Neuronalen Netzwerken
  • Implementierung einer Smartphone-Applikation zur Erkennung von Fußgängerampeln als Unterstützung für Menschen mit Sehbehinderung
  • Automatische Erkennung von Quadrocopter-Landeplätzen mittels künstlicher neuronaler Netze
  • Erkennung von Personen(Full Body Detection) in Videoaufnahmen eines Quadrocopters
  • Untersuchung von Apple HTTP Live Streaming für AAC-basierte Musik-Streaming Dienste
  • Automatic classification of defects in photovoltaic modules using electroluminescence imaging
  • Erkennung von Bäumen in Farbbildern mit neuronalen Netzen
  • Anonymisierung von Autokennzeichen in Videostreams
  • Entwicklung eines gestenunterstützten natürlichsprachlichen Dialogs mit einem humanoiden Roboter
  • Rekonstruktion der Gesamtansicht eines großflächigen Photovoltaik-Freiflächenanlage aus Multicopter-Videoaufnahmen
  • Ein Geschwindigkeitsassistenzsystem mit automatischer Verkehrszeichenerkennung für das iPhone
  • Optical Music Recognition for Mobile Devices
  • Kalibrierung von Panorama-Endoskopen
  • Implementierung eines Cross-Bilateralen-Filters für lichtfeldbasierte Tiefenkartendaten
  • Handgestenerkennung zur Interaktion mit Webanwendungen unter Einsatz moderner Webtechnologien
  • Musikerkennungssoftware: Stand der Technik und vergleichende Evaluierung
  • Berechnung der Tabulatur aus dem Audiosignal einer Gitarrenaufnahme
  • Scene extraction by means of a Pan-Tilt-Zoom-camera
  • Vision-based Object Tracking Using an Unmanned Aerial Vehicle
  • Interaktive Verbesserung von Tiefenkarten zur Qualitätsverbesserung im Rendering
  • Evaluation der Einsatzmöglichkeiten einer an ein Prüfgerät angebundenen Datenbrille und prototypische Implementierung einer Applikation für ein Einsatzszenario
  • Automatisiertes Testen und Bewerten von GUI Oberflächen
  • Konzeption und Realisierung einer auf Cross-Synthese basierenden iPhone-Applikation zum Sound-Design
  • Umsetzung einer grafischen Nutzerschnittstelle zur interaktiven Steuerung des örtlichen Höreindrucks in einer Audiokonferenz
  • Entwicklung einer Beschreibungssprache für skalierbare Medien
  • Umsetzung von "point&click" Aufgaben zur 3D-Volumenmanipulation mit Leap Motion im klinischen Umfeld der Angiographie
  • Implementierung eines echtzeitfähigen Feature-Extraction-Algorithmus aus Livebilddaten auf der ARM-i.MX6-Architektur für ein Medizingerät
  • Entwicklung einer 3D-Objekterkennung zur Bestimmung der Bauteillage in einem Greifsystem auf der Basis von Partikelverdichtung als Eingangsdaten für die Movelt! Bewegungsplanung
  • Erweiterung des Treibers eines virtuellen Dateisystems für skalierbare Medien um die Funktionalität eines parametierbaren Dateiaufrufes am Beispiel von JPEG 2000
  • Kameragestützte Erkennung eines Quadocopterlandeplatzes in verschiedenen Freiheitsgraden
  • Modern User Interface Devices - Möglichkeiten eines effizienten und sinnvollen Einsatzes der Kinect in Business-Anwendungen
  • Erkennung und Vermeidung von Hindernissen in der Flugbahn eines autonomen Quadrocopters mittels optischem Fluss
  • Aufbau einer flexiblen Virtual-Reality-Lösung für die Visualisierung von Punktwolken und CAD-Modellen
  • Konzeption und Umsetzung einer Kartographieanwendung durch einen Quadrocopter
  • Echtzeitkorrektur des Rolling-Shutter-Effekts in Videostreams einer Quadrocopter-Bordkamera
  • Punktmerkmalsverfahren zur Kollisionsvermeidung beim Quadrocopter
  • Entwicklung einer Verfahrensweise für die Erstellung von 3D-Unternehmenspräsentationen für 3D-Bildschirme ohne Brille
  • Pseudonymisierung der medizinischen Bilddaten zur regulatorisch konformen Übertragung über öffentliches Internet in ein Data Center
  • Evaluierung und Implementierung eines Konzeptes für die autonome Orientierung eines humanoiden Roboters anhand potentieller Warnzeichen oder Gefahrensituationen
  • Test einer komplexen Korrekturkette zur Verbesserung von CT Rekonstruktionen
  • Verfahren zur Korrektur von Kreisringartefakten in der Röntgen-Computertomographie
  • Konzeption, Entwurf und Implementierung eines Visualisierungstools zu Veranschaulichung von Protokolldateien
  • Erkennung und Digitalisierung von Noten mit iOS und der iPad-Kamera
  • Entwicklung eines Verfahrens zur Verzögerungs- und Genauigkeitsmessung von Head- und Facetracking Systemen
  • Entwicklung einer Android App zur Visualisierung von Sensordaten
  • Entwurf eines Augmented Reality Toolkits für Windows Phone und die Verwendung in einer Demonstrations-Applikation
  • Entwicklung und Implementierung eines Vorgehens zur Auswertung thermographischer Aufnahmen von Mikrochips
  • Algorithmus zur Lokalisierung von Mustern in diskreten Audiosignalen
  • Indoor-Selbstlokalisierung eines autonomen Quadrocopters mit Methoden der Bildverarbeitung
  • Automatisches Lokalisieren und Annäherung an im freien Raum platzierte Objekte mit einem humanoiden Roboter
  • Konzeption und Implementierung eines interaktiven Szenarios mit einem humanoiden Roboter
  • Entwicklung einer modularen Medienverwaltung für DCPs
  • Programmierung eines Steuerungsmoduls für den humanoiden Roboter Nao zur Durchführung gezielter Minigolfschläge
  • Autonomously detecting an picking up scattered objects: design and implementation of a module for humanoid robots
  • Konzeption zur Portierung einer bestehenden Webseite auf mobile Endgeräte
  • Imitation menschlicher Bewegungsabläufe durch einen humanoiden Roboter unter Einsatz einer Tiefensensorkamera
  • Realisierung einer Audio-Konferenzbrücke mit reduzierter Rechenlast durch Detektion der aktiven Speicher
  • Entwicklung und Implementierung sinogrammbasierter Korrekturen in der industriellen Computertomographie
  • Ein Personenverfolgungsmodul für humanoide Roboter
  • Statistische Verfahren und Kenngrößen zur Evaluierung der Performance funkbasierter Lokalisierungssysteme
  • Automatische Vermessung von Golfschwüngen durch Videoanalyse und Synchronisation mit weiteren Messverfahren
  • Telefonie-Anbindung mit Freisprecheinrichtung auf einer MeeGo Linux Plattform
  • Imitation der Körperhaltung durch einen humanoiden Roboter
  • Eine interaktive Oberfläche zur Darstellung der verschiedenen XML-Standards für Immobilien
  • Entwicklung einer Smartphone-Anwendung zur Nutzung von Webservices aus dem Hosting-Bereich
  • Konzept-Entwicklung zur automatischen Verifikation von 3D-Modellen
  • Verwendung von GPGPU zur Audiobearbeitung in Echtzeit
  • Usability-Konzept für mobile Geschäftsanwendungen am Beispiel eines webbasierten Bestellsystems
  • Softwareergonomische Analyse und Redesign von existierenden Benutzerschnittstellen
  • Automatische Erkennung von Musik-Genres - Schwerpunkt Klassifikation
  • Automatische Erkennung von Musik-Genres - Schwerpunkt Merkmalsberechnung
  • Planung und Umsetzung einer Funktion zur Graphikausgabe von Messdaten in eine vorhandene Prüfstandsumgebung in der Programmiersprache Python
  • RFID-Landmarken basierte Selbstlokalisierung und gleichzeitige Warenortung
  • Deep Residual Networks
  • Objekterkennung mit Convolutional Neural Networks auf Basis von TensorFlow und iOS.
  • Anonymisierung von Gesichtern in Videos
  • Detektion von Autos in Bildern mit Convolutional Neural Networks
  • Gesichtsdetektion in Bildern mit Convolutional Neural Networks
  • Objekterkennung mit Convolutional Neural Networks auf Basis von Tensorflow
  • Automatische Flugrouten-Planung und Steuerung eines Multicopters über einer Photovoltaik-Freiflächenanlage anhand von Video-Bildern
  • Erzeugung eines animierten Gesichtes auf Basis einer einzelnen Aufnahme
  • Zeitlicher Abgleich zwischen dem Audiosignal und den Noten eines instrumentalen Musikstücks
Veröffentlichungen
C. Buerhop-Lutz, S. Deitsch, A. Maier, F. Gallwitz, and C. J. Brabec:
A Benchmark for Visual Identification of Defective Solar Cells in Electroluminiscence Imagery
35th European PV Solar Energy Conference and Exhibition, Brussels, Belgium, September 2018

T. Ranzenberger, C. Hacker, F. Gallwitz:
Integration of a Kaldi Speech Recognizer into a Speech Dialog System for Automotive Infotainment Applications
29th Conference on Electronic Speech Signal Processing (ESSV 2018), Ulm, March 2018


Dalsass, M., S. Deitsch, D. Moerman, F. Gallwitz, and C. J. Brabec.
Algorithmus zur IR-Panoramabilderstellung aus IR-Luftaufnahmen von PV-Freiflächenanlagen,
In: 32. Symposium Photovoltaische Solarenergie. (Kloster Banz, Mar. 8–10, 2017). Bad Staffelstein, Germany, March 2017


C. Hacker, T. Sowa, K. Weilhammer, V. Springer, D. Massonie, T. Ranzenberger, F. Gallwitz:
Interacting with Robots - Tooling and Framework for Advanced Speech User Interfaces,
28th Conference on Electronic Speech Signal Processing (ESSV 2017), Saarbrücken, March 2017


F. Gallwitz, S. Deitsch, M. Dalsass:
Towards Fully Autonomous Aerial Inspection of Photovoltaic Power Plants,
Integration of Sustainable Energy Conference (iSEneC 2016), Nuremberg, July 2016

Manuel Dalsass, Sergiu Deitsch, Philipp Luchscheider, Florian Gallwitz, Christoph Brabec:
Performance of a Module and Defect Detection Algorithm for Aerial Infrared Images as a Function of the Flying Altitude,
Proc32nd European Photovoltaic Solar Energy Conference and Exhibition, pp. 2036-2040, 2016

S. Dotenco, M. Dalsass, L. Winkler, T. Würzner, C. Brabec, A. Maier, and F. Gallwitz: 
Automatic Detection and Analysis of Photovoltaic Modules in Aerial Infrared Imagery, 
Proc. WACV 2016: IEEE Winter Conference on Applications of Computer Vision, Lake Placid, NY, USA, March 2016

K. Haag, S. Dotenco, and F. Gallwitz: 
Correlation Filter Based Visual Trackers for Person Pursuit Using a Low-Cost Quadrotor,
Proc. 15th International Conference on Innovations for Community Services (I4CS), Nuremberg, July 2015


C. Ullrich, S. Dotenco, and F. Gallwitz:
A Hybrid Approach for Simultaneous Obstacle Avoidance and Stabilization of Dynamic Bipedal Walking using the Aldebaran Nao Robot,
Proc. 15th International Conference on Innovations for Community Services (I4CS), Nuremberg, July 2015


S. Dotenco, F. Gallwitz, and E. Angelopoulou:
Autonomous Approach and Landing for a Low-Cost Quadrotor Using Monocular Cameras,
Proc. ECCV 2014, 5th Workshop on Computer Vision in Vehicle Technology, Zurich, September 2014


S. Dotenco, T. Götzelmann, F. Gallwitz:
Smartphone Input Using its Integrated Projector and Built-in Camera,
Proc. of HCI International 2014, Heraklion, Greece, June 2014.


A. Horndasch, F. Gallwitz, J. Haas, E. Nöth:
Der mixed–initiative Ansatz als Basis für benutzerfreundliche Sprachdialogsysteme,
Künstliche Intelligenz, Bd. 19, Nr. 3, 2005, S. 38–41.


J. Haas, F. Gallwitz, A. Horndasch, V. Warnke:
Telephone-Based Speech Dialog Systems,
in W. Kropatsch, R. Sablatnig, A. Hanbury (Hrsg.): Pattern Recognition, 27th DAGM Symposium, Berlin, 2005, S. 125–132.


E. Nöth, A. Horndasch, F. Gallwitz, J. Haas:
Experiences with Commercial Telephone-based Dialogue Systems,
it - Information Technology, Bd. 46, Nr. 6, 2004, S. 315–321.


R. Huber, F. Gallwitz, V. Warnke:
Verbesserung eines Voiceportals mit Hilfe akustischer Klassifikation von Emotion,
in P. Dadam, M. Reichert (Hrsg.): GI Jahrestagung (2), Bd. 50 von Lecture Notes in Informatics (LNI), GI, 2004, S. 577–581.


J. Haas, F. Gallwitz, M. Schröder:
Aus der Praxis: Die automatische Zentrale bei der Sixt AG,
in P. Dadam, M. Reichert (Hrsg.): GI Jahrestagung (1), Bd. 50 von Lecture Notes in Informatics (LNI), GI, 2004, S. 205–209.


F. Gallwitz, H. Niemann, E. Nöth, V. Warnke:
Integrated Recognition of Words and Phrase Boundaries,
Speech Communication, Bd. 36, Nr. 1-2, 2002, S. 81–95.


E. Nöth, A. Batliner, V. Warnke, J.-P. Haas, M. Boros, J. Buckow, R. Huber, F. Gallwitz, M. Nutt, H. Niemann:
On the Use of Prosody in Automatic Dialogue Understanding,
Speech Communication, Bd. 36, Nr. 1-2, 2002, S. 45–62.


F. Gallwitz:
Integrated Stochastic Models for Spontaneous Speech Recognition,
Studien zur Mustererkennung, Logos Verlag, Berlin, 2002.


E. Nöth, M. Boros, J. Fischer, F. Gallwitz, J.-P. Haas, R. Huber, H. Niemann, G. Stemmer, V. Warnke:
Research Issues for the Next Generation Spoken Dialogue Systems Revisited,
in V. Matousek, P. Mautner, K. Tauser (Hrsg.): Proc. 4th International Conference on Text, Speech and Dialogue (TSD 2001), Bd. 2166 von Lecture Notes in Artificial Intelligence, Springer Verlag, 2001, S. 341–348.


E. Nöth, A. Batliner, H. Niemann, G. Stemmer, F. Gallwitz, J. Spilker:
Language Models beyond Word Strings,
in ASRU (Hrsg.): Proceedings of the Automatic Speech Recognition and Understanding Workshop (ASRU’01), 2001.


F. Gallwitz, H. Niemann, E. Nöth:
Spracherkennung — Stand der Technik, Einsatzmöglichkeiten und Perspektiven,
WI — Zeitschrift für Wirtschaftsinformatik, Bd. 41, Nr. 6, 1999, S. 538–547.


V. Warnke, F. Gallwitz, A. Batliner, J. Buckow, R. Huber, E. Nöth, A. Höthker:
Integrating Multiple Knowledge Sources for Word Hypotheses Graph Interpretation,
in Proc. Europ. Conf. on Speech Communication and Technology (EUROSPEECH), Bd. 1, Budapest, Ungarn, Sep. 1999, S. 235–238.


E. Nöth, F. Gallwitz, M. Aretoulaki, M. Boros, J. Haas, S. Harbeck, R. Huber, H. Niemann:
Research Issues for the Next Generation Spoken Dialogue Systems,
in Proc. Workshop on Text, Speech, and Dialog (TSD), Pilsen, Tschechische Republik, Sep. 1999, S. 1–9.


E. Nöth, M. Boros, J. Haas, V. Warnke, F. Gallwitz:
A Hybrid Approach to Spoken Dialogue Understanding: Prosody, Statistics and Partial Parsing,
in Proc. Europ. Conf. on Speech Communication and Technology (EUROSPEECH), Bd. 5, Budapest, Ungarn, Sep. 1999, S. 2019–2022.


E. Nöth, A. Batliner, V. Warnke, J. Haas, M. Boros, J. Buckow, R. Huber, F. Gallwitz, M. Nutt, H. Niemann:
On the Use of Prosody in Automatic Dialogue Understanding,
Proc. ESCA Workshop on Dialogue and Prosody, Eindhoven, Niederlande, September 1999, S. 25–34.


F. Gallwitz, H. Niemann, E. Nöth, V. Warnke:
Prosodic Information for Integrated Word–and–Boundary Recognition,
in Proc. ESCA Workshop on Dialogue and Prosody, Eindhoven, Niederlande, September 1999, S. 163– 168.


F. Gallwitz, M. Aretoulaki, M. Boros, J. Haas, S. Harbeck, R. Huber, H. Niemann, E. Nöth:
The Erlangen Spoken Dialogue System EVAR: A State–of–the–Art Information Retrieval System,
Proc. Int. Symposium on Spoken Dialogue (ISSD), H. Fujisaki (Hrsg.), Sydney, Australien, 1998, S. 19–26.


H. Niemann, E. Nöth, A. Batliner, J. Buckow, F. Gallwitz, R. Huber, V. Warnke:
Using Prosodic Cues in Spoken Dialog Systems,
Proc. Int. Workshop on Speech and Computer (SPECOM), St. Petersburg, Russland, 1998, S. 17–28.


F. Gallwitz, S. Harbeck, A. Batliner, J. Buckow, E. Nöth, H. Niemann:
Word Recognition with Integrated Detection of Phrase Boundaries,
in Proc. AIII Workshop on Artificial Intelligence in Industry, Stara Lesna, Slovakei, 1998, S. 407–414.


F. Gallwitz, A. Batliner, J. Buckow, R. Huber, H. Niemann, E. Nöth:
Pushing forward the Interface between Recognition and Understanding — How to Integrate Syntactic Structure into the Output of a Word Recognizer,
in Proc. Workshop on Text, Speech, and Dialogue (TSD), Masaryk University Press, Brno, Tschechische Republik, 1998, S. 201–206.


F. Gallwitz, A. Batliner, J. Buckow, R. Huber, H. Niemann, E. Nöth:
Integrated Recognition of Words and Phrase Boundaries,
Proc. Int. Conf. on Spoken Language Processing (ICSLP), Bd. 7, Sydney, Australien, 1998, S. 2883-2886.


M. Aretoulaki, S. Harbeck, F. Gallwitz, E. Nöth, H. Niemann, J. Ivanecky, I. Ipšić, N. Pavešić, V. Matoušek:
SQEL: A Multilingual and Multifunctional Dialogue System,
Proc. Int. Conf. on Spoken Language Pro- cessing (ICSLP), Bd. 3, Sydney, Australien, 1998, S. 855–858.


E. Nöth, A. Batliner, A. Kießling, R. Kompe, F. Gallwitz, V. Warnke, H. Niemann:
Spracherkennung und Prosodie,
KI — Zeitschrift für künstliche Intelligenz, Bd. 4, 1997, S. 14–19.


F. Gallwitz, E. Nöth, H. Niemann:
Recognition of Out-of-Vocabulary Words and their Semantic Category,
Proc. 2nd SQEL Workshop on Multi-Lingual Information Retrieval Dialogs, Westböhmische Universität, Pilsen, Tschechische Republik, 1997, S. 114–121.


M. Boros, M. Aretoulaki, F. Gallwitz, H. Niemann, E. Nöth:
Semantic Processing of Out-of-Vocabulary Words in a Spoken Dialogue System,
Proc. Europ. Conf. on Speech Communication and Technology (EUROSPEECH), Bd. 4, Rhodos, Griechenland, 1997, S. 1887–1890.


M. Schüßler, F. Gallwitz, S. Harbeck:
A Fast Algorithm for Unsupervised Incremental Speaker Adaptation,
Proc. Int. Conf. on Acoustics, Speech and Signal Processing (ICASSP), Bd. 2, München, 1997, S. 1019–1023.


E. Schukat-Talamazzini, F. Gallwitz, S. Harbeck, V. Warnke:
Rational Interpolation of Maximum Likelihood Predictors in Stochastic Language Modeling,
in Proc. Europ. Conf. on Speech Communication and Technology (EUROSPEECH), Rhodos, Griechenland, 1997, S. 2731-2734.


M. Boros, W. Eckert, F. Gallwitz, G. Görz, G. Hanrieder, H. Niemann:
Towards understanding spontaneous speech: Word accuracy vs. Concept accuracy,
Proc. Int. Conf. on Spoken Language Processing (ICSLP), Bd. 2, Philadelphia, USA, 1996, S. 1005–1008.


W. Eckert, F. Gallwitz, H. Niemann:
Combining Stochastic and Linguistic Language Models for Recognition of Spontaneous Speech,
Proc. Int. Conf. on Acoustics, Speech and Signal Processing (ICASSP), Bd. 1, Atlanta, USA, 1996, S. 423–426.


F. Gallwitz, E. Nöth, H. Niemann:
A Category Based Approach for Recognition of Out-of-Vocabulary Words,
in Proc. Int. Conf. on Spoken Language Processing (ICSLP), Bd. 1, Philadelphia, USA, 1996, S. 228–231.


F. Gallwitz, E. Schukat-Talamazzini, H. Niemann:
Integrating Large Context Language Models into a Real Time Word Recognizer,
Proc. Workshop on Speech and Image Understanding, IEEE Slovenia Section, Ljubljana, Slovenien, 1996, S. 105–114.


D. Paulus, A. Winzen, F. Gallwitz, and H. Niemann:
Object-oriented knowledge representation for image analysis.
In: N. Pavesic H.  Niemann, D. Paulus, and S. Kovacic, S. (Hrsg.) : 3-D Scene Acquisition, Modeling and Understanding, Proceedings of the Second German-Slovenian Workshop, IEEE Slovenia Section, 1994, S. 37-54.