Darstellung eines Audiosignals, wie es von EnCodec dekodiert wird
Darstellung eines Audiosignals, wie es von EnCodec dekodiert wird
Bildquelle: greyj, Lizenz

EnCodec: Meta will MP3 in den Ruhestand schicken

Meta hat den neuen Audiocodec EnCodec vorgestellt, der dank künstlicher Intelligenz die 10-fache Komprimierungsrate von MP3 erreichen soll.

Meta möchte den Markt der Audiocodecs aufmischen und schickt dafür EnCodec ins Rennen. Gegenüber dem rund 30 Jahre alten MP3-Format verspricht der Konzern eine 10-fach höhere Komprimierungsrate. Um das zu erreichen, spielt künstliche Intelligenz eine entscheidende Rolle.

EnCodec: Die Ablösung von MP3 ist längst überfällig

Komprimierungstechniken gewinnen in der heutigen Zeit zunehmend an Bedeutung. Egal ob es um die Darstellung von Bildern und Videos geht oder um die Wiedergabe von Audiodateien. Das gesamte Internet besteht zu einem bedeutenden Anteil aus multimedialen Inhalten. Deren Komprimierung führt letztendlich zu einer enormen Ersparnis der zu übertragenden Datenmenge. Und während für Videos alle paar Jahre ein neuer und vermeintlich effizienterer Codec durchs Netz gejagt wird, ist für Tonaufnahmen noch immer ein uralter Bekannter weit verbreitet: MP3.

Doch daran möchte der Konzern Meta etwas ändern. Das Unternehmen hat einen neuen, auf künstlicher Intelligenz (KI) basierenden Audio-Codec mit dem Namen EnCodec vorgestellt. Dieser soll weitaus effizienter sein als das MP3-Verfahren. Kein Wunder, ist dieses doch inzwischen rund 30 Jahre alt und hat daher mittlerweile einen ziemlich langen Bart.

10-fache Komprimierung dank neuronalem Netz

Wir erreichen eine etwa 10-fache Komprimierungsrate im Vergleich zu MP3 bei 64 kbps, ohne Qualitätsverlust„, zeigt sich Meta zuversichtlich. Das Unternehmen brüstet sich ferner damit, das Erste zu sein, das für EnCodec eine auf einem neuronalen Netz basierende Technik einsetzt, um damit ein mit 48 kHz abgetastetes Stereo-Audio (CD-Qualität) zu decodieren.

Mit seinen Zukunftsvisionen hinsichtlich der virtuellen Realität (VR) und des Metaverse hat der Konzern natürlich ein besonders großes Interesse an effizienten Komprimierungstechniken. Denn dadurch werden virtuelle Welten immer weniger von schnellen Internetverbindungen abhängig, sodass im Endeffekt mehr Menschen daran teilhaben können.

„Unsere Techniken decken zwar noch nicht den Videobereich ab, aber dies ist der Beginn einer fortlaufenden Initiative mit dem Ziel von Fortschritten, die Erfahrungen wie Videokonferenzen, das Streaming von Filmen und das Spielen mit Freunden in VR verbessern könnten.“

Meta

EnCodec sprengt die Grenzen bisheriger Audiocodecs

Wie Meta in seiner Ankündigung mitteilt, sind die klassischen Codecs, zu denen auch MP3 gehört, „wahrscheinlich an der Grenze dessen angelangt, was wir mit handwerklichen Mitteln erreichen können, weshalb es wichtig ist, neue Techniken zu erforschen.“ Und an dieser Stelle komme die KI ins Spiel, die der Konzern für EnCodec verwendet. Durch diese lassen sich demnach Änderungen im Audiosignal erkennen, „die vom Menschen nicht wahrgenommen werden können„.

Und das Ergebnis ist durchaus erstaunlich. In einer kurzen Videosequenz demonstriert Meta den Vergleich seines neuen EnCodec mit den beiden ebenfalls als sehr effizient geltenden Audiocodecs EVS und OPUS. Letzterer ist beispielsweise auch bei der Videokonferenzsoftware Jitsi im Einsatz. Bei einer Bitrate von gerade Mal 6 kbit/s sind die Unterschiede deutlich hörbar.

Über

Marc Stöckel hat nach seiner Ausbildung zum IT-Systemelektroniker und einem Studium im Bereich der technischen Informatik rund 5 Jahre als Softwareentwickler gearbeitet. Um seine technische Expertise sowie seine Sprachfertigkeiten weiter auszubauen, schreibt er seit dem Sommer 2022 regelmäßig Artikel zu den Themenbereichen Software, IT-Sicherheit, Datenschutz, Cyberkriminalität und Kryptowährungen.