Dienstag, 27. Mai 2025, 17:30 Uhr – 19:00 Uhr

Sprach- und Audiocodierung mit generativer KI

Beschreibung:

Milliarden von Nutzern gebrauchen alltäglich Sprach- und Audiotechnologien (für z.B. Telefonie, Streaming oder Musikwiedergabe). All diese Anwendungen verlangen in der Regel nach technischen Lösungen zur effizienten Speicherung und Übertragung dieser Signale, was Sprach- und Audiocodierung zu einer Kerntechnologie moderner Multimediaanwendungen macht. Die stetig wachsende Zahl von Nutzern, die begrenzte gemeinsame Ressourcen teilen, und die steigenden Datenmengen erfordern Codierverfahren, die eine sehr gute Signalqualität bei sehr niedrigen Datenraten ermöglichen. Codierverfahren, die auf generativer KI basieren, zeigen viel Potential unter diesen Anforderungen und die hier erzielten Durchbrüche rufen großes Forschungsinteresse in Wissenschaft und Industrie hervor.

In diesem Vortrag werden die grundlegenden Konzepte hinter KI-basierten Codierverfahren erklärt, wobei ein spezielles Augenmerk auf Ende-zu-Ende trainierten Verfahren liegen soll. Weiterhin wird die Nutzung generativer KI für neuronale Codierverfahren bei niedrigen Datenraten motiviert und ein Ausblick auf vielversprechende Trends dieses Forschungsgebietes gegeben.

Referierende:

Dr.-Ing. Andreas Brendel, Fraunhofer-Institut für Integrierte Schaltungen IIS, Erlangen

Zurück