LS007 Auphonic

Veröffentlicht am 22. März 2012 von Tim Pritlove

Ein webbasiertes System zum automatischen Bearbeiten von Podcasts

Auphonic ist ein neuer Dienst, der nicht weniger als anspruchsvolle Podcast Post-Production verspricht und jetzt in seine öffentliche Betaphase tritt. Auphonic führt auf Rohaufnahmen eine umfangreiche automatische Audiobearbeitung durch, überführt die Aufnahme in ein oder mehrere Medienformate und sorgt auch für eine universelle und umfangreiche Beglückung mit Metadaten in diesen Dateien. Das Endergebnis wird dann automatisch auf den eigenen Server hochgeladen. Anlässlich des Podlove Developer Meetings, das am letzten Wochenende in Berlin stattfand, war Georg Holzmann - Initiator und einer der Entwickler von Auphonic - zu Gast in der Metaebene und stellt sein Projekt im Detail vor.

Tim Pritlove

Georg Holzmann

Auphonic

[shownotes id="lg"]

Themen: Podlove Developer Meeting; Auphonic Überblick; Toningenieur Studium in Graz; Music Information Retrieval, Machine Learning; Schritte in der Audio Post Produktion; Levelator; Audio Plugins; Intelligente Lautheitsanpassung mit Audioanalyse; Tims Erfahrungen mit Auphonic; Lautheitswahrnehmung; Quasi Peak Programme Meter (QPPM); ITU-R BS.1770 Algorithmus zur Lautheitsmessung; EBU R 128; Calm Act; Einheit zur Lautheitsmessung: Loudness Units (LU, LUFS); Inter Sample Peaks; Loudness War; Audio Restauration: Noise Reduction, Brummfilter, Clipping Entfernung; Audio Encoding (MP3, Ogg Vorbis, AAC/MP4, Flac); Metadaten und Kapitelmarken; Bitratenbereiche für verschiedene Audio Formate; HE AAC, HE AACv2; Übersicht zu AAC/MP4 Enkoder; LAME MP3 Enkoder; Variable Bitrate, Konstante Bitrate; Bitraten Empfehlungen und Erfahrungen; Liste mit Hörversuche zu Formate und Bitraten; Xiph.org OggEnc Enkoder, aoTuV Enkoder; Verlustfreie Datenkompression: FLAC, ALAC; ID3 Tags; ID3 Tags Vergleich bei Podcasts; Vorbis Comments; iTunes-Style Metadata; mp4v2; AtomicParsley; ID3v2 Chapter Extension; Vorbis Comment Chapter Extension; VLC media player; Opus Codec; CELT Codec von Xiph.org; SILK Codec von Skype; Sprachkodierung; Speex Codec; Mumble Audiochat; Integration mit anderen Webservices; Auphonic API; Auphonic Registrierlink; Freemium Modell; Open Source Strategie von Auphonic; Neues Austauschformat für Podcasts; Auphonic Blog; Podlove Projekt.

47 Gedanken zu „LS007 Auphonic“

Andrew Domarkas sagte am 22. März 2012 um 01:29 Uhr :

Hallo Tim, habe gehört Du suchst eine Podcast-Hardware-Lösung mit bestimmten Anforderungen. Kannst Du eine Feature-Liste erstellen und mir zusenden? Ich möchte mir das ankucken, ob wir sowas bauen können.

Mit freundlichen Grüssen

Andrew Domarkas

Antworten ↓
- Dirk Deimeke sagte am 22. März 2012 um 10:06 Uhr :
  
  Veröffentlicht Ihr Eure Arbeit irgendwo? Gibt es eine Webseite? Ich wäre auch daran interessiert.
  
  Antworten ↓
  - Andrew Domarkas sagte am 22. März 2012 um 13:31 Uhr :
    
    Hi Dirk, im Moment existiert noch nix. Ich muss erstmal sehen, ob wir die Anforderungen in angemessener Zeit hinkriegen. Dazu brauche ich eine Liste über das, was von Euch gewünscht wird.
    
    Greetings
    
    Andrew
    
    Antworten ↓
    - Andrew Domarkas sagte am 23. März 2012 um 19:31 Uhr :
      
      Hat jemand Ideen bezüglich der Ausführung der Aufnahme Hardware? Wie zum Beispiel bei einer mobilen Ausführung: Wieviel Eingänge braucht man? Wieviel Kopfhörer-Ausgänge?
      Per Funk oder drahtgebunden?
      Usw. Gebt mir eure Vorstellungen und Anforderungen.
      In freudiger Erwartung
      Andrew Domarkas
      
      andrew.domarkas@traxmicrosystems.de
      
      Antworten ↓
Auch Robert ^^ sagte am 22. März 2012 um 06:48 Uhr :

torrent:
http://thepiratebay.se/torrent/7121862/Der_Lautsprecher_7_-_Auphonic

Antworten ↓
Pingback: lautsprecher: mach’s doch besser! | die Hörsuppe
Jonathan Uhmann sagte am 22. März 2012 um 09:47 Uhr :

Auphonic ist magisch. Sowas von geil. Vielen Dank für die umfangreiche Hinterfragung des Projekts usw!
Eine Frage ist mir beim ausprobieren von Auphonic gekommen: wie ist den dein (Tim) Workflow zum erstellen von Chapters?

Antworten ↓
jEN sagte am 22. März 2012 um 11:46 Uhr :

Interessant! Werde das definitiv ausprobieren.
Es wurde gar nicht erwähnt, in welchem Format die Rohdaten überhaupt angeliefert werden sollen. Da Georg erwähnte, dass kein Mixing durchgeführt wird, nehme ich an, dass vorher ein Downmix auf Mono/Stereo stattfinden muss? Oder geht es auch, das von Tim genannte 15GB RAW Multitrack-File reinzuschmeißen?

Antworten ↓
- Georg Holzmann sagte am 22. März 2012 um 12:48 Uhr :
  
  Hallo jEN!
  
  Wir unterstützen alle möglichen Formate als Eingangsdatei (wav, aiff, flac, mp3, aac, vorbis, etc.).
  Multitrack wird im Moment noch nicht unterstützt, d.h. du solltest einen Stereo Mix (oder mono) haben und diese dann weiterreichen. Multitrack ist aber natürlich geplant, wird aber noch ein bisschen dauern … 😉
  
  LG
  Georg
  
  Antworten ↓
Max sagte am 22. März 2012 um 15:32 Uhr :

Ich dachte die Amplitude in der Wellenform ist die Spannung hinterm Mikrofon und nicht die Stromstärke, wie Tim meinte?!

Antworten ↓
- Georg Holzmann sagte am 22. März 2012 um 15:58 Uhr :
  
  Ja da hast du recht, in den meisten Fällen wird eine Spannung gemessen!
  
  Antworten ↓
  - Andrew Domarkas sagte am 23. März 2012 um 19:33 Uhr :
    
    Beim Messen kommt es auch auf die Leistungsanpassung an.
    
    Antworten ↓
Dr. Azrael Tod sagte am 23. März 2012 um 14:37 Uhr :

und genau wegen diesem ganzen Lizenzspaß („darf ich das jetzt hier verteilen“, „gibt es opensource-encoder?“) will man wann immer möglich auch alles in freien Formaten wie Vorbis anbieten. Nicht unbedingt weil das die meisten verwenden würden, sondern einfach um das Format weiter zu verbreiten. (dank Android, Chrome, VLC und co. sollte inzwischen die Verbreitung der Abspielsoftware auch einigermaßen gegeben sein… solange man nichts mit Apfel drauf hat, sollte es eigentlich überall tun)

Antworten ↓
- Georg Holzmann sagte am 23. März 2012 um 18:55 Uhr :
  
  Bin ganz bei dir und hoffe mal stark auf den neuen Opus Codec 😉
  
  Antworten ↓
Der Abro sagte am 23. März 2012 um 18:37 Uhr :

Folgendes ist sicher schon bekannt, aber nur mal meiner Bürgerpflicht wegen…

FireFox: Der Player mag mal wieder nicht und wirft ’nen 404 Fehler @ ls007-auphonic.oga ( Wäre ja auch Quatsch von den BrowserEntwicklern im Fehlerfall einfach die zwei anderen eingebundenen DateiFormate laden zu lassen, gell… )

Chrome: Scheint mit dem Codec vorne und hinten nicht klar zu kommen. Die m4a wird gefühlte 300% langsamer abgespielt. Und da meint man ein aktuelles System zu haben ^^

IE 6 bis 9: Funktioniert problemlos XD

Antworten ↓
- Tim Pritlove sagte am 23. März 2012 um 18:54 Uhr :
  
  Ups sorry, Datei falsch benannt. Jetzt sollte es im Firefox gehen.
  
  Antworten ↓
tbals sagte am 23. März 2012 um 21:39 Uhr :

Also wenn ich das jetzt richtig verstehe lade ich bei auphonic einfach mein wav-file hoch, was ich sonst in Levelator werfen würde?
Das sind aber auch gerne mal 600MB und mehr.

Antworten ↓
- Tim Pritlove sagte am 23. März 2012 um 21:58 Uhr :
  
  Wenn du auf einer nicht-qualitätsreduzierten Version arbeiten lassen willst, kannst Du die Datei vor dem Upload mit FLAC auf bis zu 40% der Größe bringen.
  
  Alternativ kannst Du auch die Datei z.B. in 256kbit/s MP3 oder MP4 (oder was auch immer) umrechnen. Da bleibt bei Sprache genug Qualität über.
  
  Antworten ↓
- Georg Holzmann sagte am 23. März 2012 um 22:01 Uhr :
  
  Im podcasting workflow musst du sowieso irgendwo uploaden – deshalb ist die Idee, dass du das gleich am Anfang machst und wir laden dann die Ergebnisse gleich auf deinen Server wo du die Files hostest.
  D.h. wenn du mehrere Zielformate unterstützen willst, sparst du dir im Idealfall sogar Zeit beim Hochladen …
  
  Antworten ↓
  - Venty sagte am 29. März 2012 um 09:48 Uhr :
    
    Man kann doch hoffentlich aber auch die Ergebnisse irgendwo bei euch herunterladen. Nehmts mir nicht uebel, aber ich kenn euch nicht und will euch nicht einfach einen FTP-Zugang zu meinem Webhosting geben.
    
    Antworten ↓
    - Georg Holzmann sagte am 29. März 2012 um 10:02 Uhr :
      
      Klar, kannst natürlich die Files auch „normal“ runterladen …
      
      Es ist auch möglich, dass du auf deinem Server einen account für auphonic einrichtest (SFTP, bzw. FTP server).
      D.h. dann haben wir nur auf diesen Bereich Zugriff und nicht aufs ganze System!
      
      Das kann man dann auch nur auf Lese-/Schreiboperationen beschränken, siehe dazu den Artikel von Dirk:
      http://www.deimeke.net/dirk/blog/index.php?/archives/2959-scponly-….html
      
      Antworten ↓
Gast sagte am 25. März 2012 um 16:02 Uhr :

Hallo Tim,
hattest du nicht mal vor deine Erfahrungen mit Podcasts auch aufzuschreiben? In den Lautsprecher Folgen wird ja (teilweise auch mit mehr oder weniger großen Überschneidungen) alles erklärt, aber nur durch’s Hören einen guten Überblick zu bekommen ist etwas schwierig…
Wäre das auch was für dein podlove Projekt oder ist das nur als Plattform für Softwareentwicklung gedacht?

Antworten ↓
- Tim Pritlove sagte am 25. März 2012 um 16:04 Uhr :
  
  Tja, ich könnte mir da eine Menge vorstellen und die Plattform ist da letztendlich egal. Aber die Schreiberei frisst einfach zu viel Zeit. Derzeit haben neue Sendungen und die Betreuung der Softwareprojekte Vorrang. Letzteres vor allem, um künftig Zeit einzusparen bei allem.
  
  Antworten ↓
Gast sagte am 25. März 2012 um 16:24 Uhr :

Schade, aber ist absolut nachvollziehbar.

Willst du eigentlich noch mehr Formate außer Ogg anbieten? Eigentlich wäre das ja schon mehr als genug…

Antworten ↓
- Tim Pritlove sagte am 25. März 2012 um 17:37 Uhr :
  
  Sprichst Du mit mir? Ich will alles anbieten (außer FLAC).
  
  Antworten ↓
  - Gast sagte am 25. März 2012 um 20:46 Uhr :
    
    Sorry, war an dich gerichtet, hatte nur den Reply Button verfehlt 🙂
    
    Antworten ↓
Pingback: Noch mehr Audio-Podcasts, die du hören solltest | Webanhalter
Hyperkeks sagte am 26. März 2012 um 03:18 Uhr :

Tolles Projekt.

Auch wenn die „Audio-Magic“ die ihr da macht von euch wohl als das Kernfeature gesehen wird fänd ich ja eine Option gut diese Nachbearbeitung wegzulassen und nur das Dateimanagement und den Upload zu machen.

Ich mache eher so Hörspielartiges Zeug und da ist der Endmix genau das was ich haben will, da möchte ich hinterher keinerlei Bearbeitung des Signals mehr. Aber allein für das setzen der Metatags und das Ausgeben unterschiedlicher Dateiformate würde ich euern Service gern nutzen.

Antworten ↓
Georg Holzmann sagte am 26. März 2012 um 09:21 Uhr :

Ist ein guter Punkt!
So eine Option werden wir noch einbauen …

Antworten ↓
- Hyperkeks sagte am 26. März 2012 um 12:30 Uhr :
  
  Großartig!
  
  Antworten ↓
Pingback: Auphonic ... | Dirks Logbuch
Gast sagte am 30. März 2012 um 01:19 Uhr :

Wird man eigentlich auch einstellen können, was jetzt genau an der Audio Datei bearbeitet wird und welche Teile eures Algorithmus mit welchen Parametern benutzt werden?

Ich habe euren Dienst mal mit einer schlechten Aufnahme (älterer mp3 Player) ausprobiert, die ein hochfrequentes Pfeifen enthält, das wurde nicht rausgefiltert. Welche störenden Frequenzen oder Frequenzbereiche filtert ihr im Moment? Die Lautheit/stärkeanpassung scheint dagegen zu funktionieren, leise Teile wurden etwas angehoben, zu laute Stellen begrenzt. Allerdings vollbringt das natürlich keine Wunder…

Ist die „Spracherkennung“, von der die Rede war, im Moment schon aktiv?

Antworten ↓
- Georg Holzmann sagte am 30. März 2012 um 17:39 Uhr :
  
  Ja wir werden sicher ein „Experteninterface“ machen, wo man dann mehr einstellen kann zu den Algorithmen … jedoch ist der Ansatz doch eher, dass wir das versuchen zu automatisieren und so wenig wie möglich Einstellungen haben.
  
  Zu den Störfrequenzen:
  im Moment filtern wir nur tiefe Störfrequenzen (d.h. ein Low-Cut bei Sprache, bei Musik ist der ein bisschen höher, weil es da tiefere Frequenzen geben kann …)
  Wir sind gerade am Arbeiten an der Entfernung und Bestimmung von periodischen Störgeräuschen bzw. Noise Reduction, dann wird dein Beispiel funktionieren!
  
  Zur Lautheitsanpassung: dort erkennen wir (jetzt schon) wo Sprachsegmente bzw. Segmente mit reinen Nebengeräuschen sind – das braucht man um die Verstärkung richtig zu berechnen …
  
  Antworten ↓
Rainer Heynke sagte am 31. März 2012 um 23:50 Uhr :

Ich hätte noch mal eine andere Ansicht zum Thema wie man sich das mit der Lautstärke vorstellen kann.

Wie schon erwähnt, ist Lautstärke eine relative Ansicht. Unser Ohr interpretiert Lautstärke bei unterschiedlichen Frequenzen anders. Wenn man jetzt einfach bei einer Audio-Sequenz alle Werte auf ihren maximalen Wert zieht (z.B. von -1 bis +1.0, weil wir ja eine Schwingung haben), dann wird nicht alles automatisch Lauter. Und zwar kann man das an sich selber ausprobieren, indem man sich Testtöne mit der selben maximalen Schwindung anhört.

* 20 hz, ganz leises Brummen, wir empfinden das als leisen Bass, aber dieser ist immernoch sehr leise
* 440 hz, sehr deutlich zu hören, das ist der Kammerton, der wird auch oft als Testsignal verwendet
* 19000 hz, sehr leises Pfiepen

Und das ist der Grund, wieso man nicht einfach alles hochziehen kann und dann erwartet, dass es gleich laut ist. Man muss sich also bestimmte Abschnitte der Frequenzen anschauen und diese getrennt lauter machen. Da gibt es dann eine Umrechnung mit der schnellen Fourier-Transformation. Da sind dann die Signale nicht mehr in dieser gewohnten Wellenform, sondern man sieht für Frequenzabschnitte genau, welche „Lautstärke“ sie haben. Diese kann man dann anfassen und wieder zurück transformieren. Das ist viel Mathe und Voodoo (o:

@Tim: Ich habe gerade meine Masterarbeit (Thema war u.a. digitale Audio-Signal-Verarbeit) fertig geschrieben und würde bei bedarf mich in eurer Podcast-Enhancement miteinbringen.

Antworten ↓
- Georg Holzmann sagte am 1. April 2012 um 12:25 Uhr :
  
  Hey Rainer!
  
  Danke für die ausführliche Darstellung – genau das hab ich versucht rüber zu bringen im Interview … 😉
  Was du hier beschreibst, versuchen die „Kurven gleicher Lautstärkepegel“ (oder wie auch immer man dazu auf Deutsch sagt) abzubilden:
  http://de.wikipedia.org/wiki/Geh%C3%B6rrichtige_Lautst%C3%A4rke
  
  Falls dich das genauer interessiert, kannst du dir auch mal die Details zu EBU R 128 bzw. dem ITU-R BS.1770 Algorithmus (http://tech.ebu.ch/loudness) anschaun …
  
  Zu was hast du deine Master Arbeit genau geschrieben?
  
  Schönen Sonntag noch,
  LG
  Georg
  
  Antworten ↓
  - Rainer Heynke sagte am 1. April 2012 um 20:55 Uhr :
    
    Ich habe ein Audio-Editor mit JavaScript geschrieben der nativ in HTML5 mit neuen API (ohne Flash oder sonstiges) funktioniert. Ich muss noch ein wenig meinen Code aufräumen (Mein erstes Webprojekt, sonst bin ich eigentlich nur in C++ und so unterwegs) und dann werde ich das Ding auch publishen.
    
    Antworten ↓
Andi sagte am 1. April 2012 um 15:48 Uhr :

Wie weit ist den der Workflow für Vortragsaufzeichnungen bei euch? Ich hab da bisher halt momentan immer noch sehr viel manuelle Arbeit. Am liebsten wäre mir ein Formular in das man die URL zu dem Pentabarf XML Dokument und den Pfad zu nem Order in dem die Mitschnitte liegen angeben kann und der Rest läuft automatisch.
Ich wäre da auch durchaus bereit etwas mitzuhelfen, falls das möglich ist.

Antworten ↓
- Georg Holzmann sagte am 1. April 2012 um 18:14 Uhr :
  
  Hallo Andi!
  
  Danke für dein Angebot – auf das komm ich sicher nochmal gerne zurück 😉
  Im Moment gibt es noch nichts eigenes für Vorträge usw. Die nächsten Ziele sind bei uns mal Bugs fixen, API und die Noise Reduction Algorithmen – danach können wir uns da gerne mal genauer dazu unterhalten!
  
  Antworten ↓
Pingback: Ein AudioformatRant: Das Dilemma mit aac – ryuus Hort
Pingback: Auphonic | Radio Gaarden
Martin sagte am 13. April 2012 um 19:40 Uhr :

Das ist wirklich eine durchdachte und tolle Lösung, die viel Zeit spart. Aktuell kämpfe ich noch mit der korrekten Übernahme der Millisekunden aus dem Chapter-File, aber der „Rest“ des Workflows funktioniert schon echt am Schnürchen. Es tut sich was für Podcaster und als Neueinsteiger scheint das gerade eine spannende Zeit zu sein! Vielen Dank an alle Beteiligten und sagt bescheid, wenn man Euch irgendwie unterstützen kann!

Antworten ↓
- Georg Holzmann sagte am 1. Mai 2012 um 17:36 Uhr :
  
  Danke 😉 !
  
  Aber was meinst du mit der korrekten Übergabe der Millisekunden?
  Das sollte jetzt eigentlich schon funktionieren – falls nicht schreib mir bitte ein Mail … 😉
  
  LG
  Georg
  
  Antworten ↓
  - Martin sagte am 10. Mai 2012 um 18:10 Uhr :
    
    Ja, es klappt jetzt. Der Kommentar wurde nur etwas verspätet freigeschaltet 🙂
    Viele Grüße
    Martin
    
    Antworten ↓
Toby Baier sagte am 3. Mai 2012 um 14:12 Uhr :

Sehr cool! War bisher skeptisch, ob ich sowas wie Auphonic brauche, aber nachdem ich gestern mit Holgi bei Wrint geschnackt habe, hab ich es dann doch mal ausprobiert. Allein ein Preset mit den Metadaten ist schon praktisch, aber einfach unbearbeitetes WAV hochwerfen und Auphonic macht den Rest inkl. übertragen in meinen Web Space, das ist echt super praktisch! Danke!

Antworten ↓
Pingback: 15. Mai 2012: Podcast-Logbuch « Schichtstufen
Michaela sagte am 23. Juni 2012 um 10:49 Uhr :

Ich habe auphonic bei meiner letzten Podcastfolge ( http://bit.ly/MAUj53 ) das erste Mal benutzt und ich finde, das Ergebnis ist sehr gut geworden. Deine Serie hier über Podcasting finde ich echt klasse, auch wenn du manchmal etwas zu sehr in die Tiefe gehst und dich in Details verlierst, die mich nicht so interessant finde.
Was ich bis jetzt vermisse sind Tips über den Inhalt, wie man einen interessanten Inhalt gestalten kann. Ich habe das Gefühl, daß du etwas zu sehr Gewicht auf Technik legst, obwohl der Inhalt meines erachtens wichtiger ist.
Beste Grüsse vom Bodensee,
Michaela

Antworten ↓
- Tim Pritlove sagte am 23. Juni 2012 um 11:02 Uhr :
  
  Ja da hast Du schon recht, das verdient noch mehr Aufmerksamkeit.
  
  Antworten ↓