OpenAudioSearch (OAS) – Schlagworte und Recherche

Wir berichteten erst kürzlich über die Features des Cultural Broadcast Archive (CBA). Eines der zukünftigen Features des CBA soll die Transkription der Podcasts sein. Hier kommt Open Audio Search ins Spiel. 

Im ersten Schritt wird über einer Spracherkennungs-Engine eine Audiotranskription durchgeführt. So werden die Sounddateien in maschinenlesbare Texte umgewandelt. Die gewonnenen Transkripte der Sendungen werden in einer Suchmaschine bereitgestellt. Der User kann eine Web-Oberfläche nutzen um in den Transkripten nach zu recherchieren. Das Suchergebnis kann direkt angehört werden und ist mit einem Zeitstempel versehen. Das soll vor allem bei der Recherche helfen! 

Sollte man für eine Hausarbeit, eine Recherche oder aus Interesse nach einem Podcast oder Beitrag suchen, so kann man durch die automatische Kategorisierung und Verschlagwortung direkt auf dem richtigen Audio landen. Ein weiterer Vorteil: Die Engine kann auch RSS-Feeds abonnieren. So können Inhalte aus verschiedenen Quellen zeitgleich verarbeitet werden. Doch wie funktioniert OAS?

  1. Audio-& Metadaten laden
  2. Vorverarbeitung der Audiodaten
  3. Audiodateien transkribieren
  4. Informationen aus Transkript der Audiodateien extrahieren
  5. Transkript & Metadaten in Such-Engine indizieren 

Unter https://demo.openaudiosearch.org kann man bereits testen. Die Demoseite wird aktuell mit den RSS-Feeds der neuesten Beiträge von FRN und CBA gespeist. Die freien Radio-Redakteure sind eingeladen intensiv zu testen und zu überlegen, welche weiteren Funktionen sowohl für radiointerne Nutzung als auch für eine breite Öffentlichkeit nützlich sein könnten. Feedbacks können gerne an info@arso.xyz oder bei technischen Issues im Github-Repository angelegt werden. 

Open Audio Search ist gefördert durch Prototype Fund und netidee Förderungen.