Artyści Daniel John Jones i Seb Emina tworzą Infraordinary FM

Wykorzystując technologię głosową ElevenLabs

Ten artykuł został napisany przez artystów Daniel John Jones I Seb Emina, który stworzył stację radiową Podzwykłe FM wykorzystując technologię głosową ElevenLabs.

Aby w pełni skorzystać z tego wpisu na blogu, Podzwykłe FM Zalecamy słuchanie podczas czytania. Otwarte ten link w nowej karcie. Naciśnij przycisk odtwarzania. Powrót do tej strony. Kontynuować.

Usłyszysz o wydarzeniach z całego świata, które normalnie nigdy nie zostałyby uznane za warte uwagi: o otwarciu salonów kosmetycznych w Kuala Lumpur, o zgubieniu portfela w Kalifornii, o lekkim wietrze w Casablance. Wszystkie są oparte na faktach i aktualizowane w czasie rzeczywistym.

Podzwykłe FM jest pierwszą na świecie stacją radiową nadającą informacje w całości za pomocą generatywnych głosów sztucznej inteligencji. Informuje o wydarzeniach z ponad 150 krajów, omawiając codzienne zdarzenia na ziemi, morzu i niebie: pływy, ruchy samolotów, warunki pogodowe, wyniki flipperów, przedmioty zgubione i znalezione, aktualności z restauracji, ruchy statków i wiele innych.

Zostało zlecone przez Lab'Bel jako część wystawy zbiorowej Pięć stacji radiowych, seria dzieł sztuki, które są jednocześnie stacjami radiowymi i których można słuchać online do 21 marca 2024 r. Jesteśmy artystami, którzy za tym stoją, a jest to nasz drugi wspólny projekt po radiowym serwisie śledzącym wschód słońca z 2014 r. Globalne Radio Śniadaniowe.

Głosy, o imionach Thomas i Nicole, udostępniła firma ElevenLabs, która natychmiast dostrzegła potencjał tego pomysłu i złożyła im hojną ofertę sponsoringu rzeczowego. W połączeniu z pejzażem dźwiękowym inspirowanym japońską muzyką ambient i dźwiękami korporacyjnymi, ciepły, niemal szeptany rytm Thomasa i Nicole tworzy idealną atmosferę. To uspokajające, ale też trochę niesamowite: poczekalnia luksusowego spa w niedalekiej przyszłości.

Termin „infrazwyczajny” pochodzi od podrzędny, słowo wymyślone przez francuskiego pisarza Georges’a Pereca. „Dzienniki piszą o wszystkim, tylko nie o tym, co codzienne” – napisał w 1973 r. „W jaki sposób powinniśmy uwzględniać, kwestionować, opisywać to, co zdarza się każdego dnia i powtarza się każdego dnia: banał, powszedniość, oczywistość, pospolitość, zwyczajność, podrzędność, szum tła, nawyk?”

Tylko dzięki postępowi w technologii rozpoznawania głosu opartej na sztucznej inteligencji udało nam się zrealizować pomysł stworzenia rozbudowanej usługi radiowej, która oferuje dokładnie to, co chcemy osiągnąć, czyli stworzenia systemu umożliwiającego podłączanie różnych skryptów zamiany tekstu na mowę do interfejsów API oraz innych źródeł danych w czasie rzeczywistym.

Z Cornell Lab of Ornithology baza danych obserwacji ptaków do mapa maszyn do gry w pinball na całym świecie stworzona w oparciu o crowdsourcingwyzwaniem było znalezienie wystarczającej liczby źródeł, aby stworzyć oszałamiające poczucie szczegółowej, przypadkowej wszechwiedzy. W tych biuletynach kryją się czasem pewne sekrety: odniesienia literackie, trzaski analogowe, podsłuchane fragmenty głosów ludzkich didżejów.

Ludzie nie tylko słuchają, ale stają się słuchaczami. W dzisiejszej erze fragmentarycznej uwagi spodziewaliśmy się, że ludzie będą włączać transmisję na żywo na najwyżej kilka minut, ale okazało się, że wielu słuchaczy spędza na niej nawet kilka godzin. Badamy inne potencjalne przejawy, w tym wystawianie Podzwykłe FM w galerii, skąd woda wydobywa się z innych przestrzeni (pryszniców hotelowych? Windy?) i stworzenie dedykowanego artefaktu, który będzie odtwarzał tę muzykę w domu. Jeśli dysponujesz przestrzenią i jesteś zainteresowany zorganizowaniem fizycznej manifestacji Podzwykłe FM, proszę o kontakt.

Przede wszystkim jednak cieszymy się nim na jego własnych zasadach, przenosząc wyobraźnię słuchacza w miejsca, o których w przeciwnym razie mógłby nie pomyśleć. Kiedy włączyliśmy telewizor po raz pierwszy, poczuliśmy magię, że połączenie z innymi miejscami nastąpiło nie poprzez coś spektakularnego, niezwykłego, katastroficznego, jak w przypadku zwykłych wiadomości, ale poprzez rzeczy, które sami moglibyśmy robić.

Nie zdawaliśmy sobie sprawy, jak bardzo będzie to ludzkie i że nasza reakcja będzie pewnego rodzaju empatią — dla niezliczonych nieznanych osób, których restauracje serwują śniadania, które znalazły zestaw kluczy lub które patrzą na garbaty księżyc. Czasem dobrze jest przypomnieć sobie, co nas wszystkich łączy.

Oczywiście, nie jest to nic nowego, ale mamy nadzieję, że to po prostu nowy sposób na osiągnięcie tego celu.

Nasza technologia AI oferuje tysiące naturalnie brzmiących głosów w 32 językach. Szukasz darmowego rozwiązania do zamiany tekstu na mowę, czy wysokiej klasy AI do projektów komercyjnych? Nasze narzędzia spełnią twoje potrzeby.

Odkryj więcej

ElevenLabs

Twórz przy użyciu technologii audio AI zapewniającej najwyższą jakość