
I używaj go do filmów, reklam, podcastów i nie tylko
Przedstawiamy Eleven v3 Alpha
Wypróbuj v3Ponad 70 000 rozmów odbyło się z Salvadorem Dalím — dekady po jego śmierci — dzięki technologii Voice Cloning od ElevenLabs.
Muzeum Dalí w St. Petersburgu na Florydzie otwarto w 1982 roku, aby uczcić życie i twórczość legendarnego surrealisty Salvadora Dalí. Kolekcja zawiera ponad 2400 dzieł, w tym obrazy, ilustracje, rzeźby, książki i fotografie.
Muzeum zostało założone dzięki zbiorom A. Reynoldsa i Eleanor Morse, oddanych mecenasów i przyjaciół Dalí. Przez ponad 40 lat ich prywatna kolekcja stała się największą w USA. Dziś kuratorzy Muzeum nadal rozwijają jego wystawy.
Teraz, dzięki instalacji zasilanej AI o nazwie Ask Dalí, obecność artysty została cyfrowo odtworzona. Projekt — stworzony we współpracy z Muzeum i agencją kreatywną Goodby Silverstein & Partners (GS&P) — wykorzystuje ElevenLabs AI Voice i technologię, pozwalając odwiedzającym na rozmowę z Dalí za pomocą reprodukcji jego słynnego telefonu z homarem.Voice Cloning technology, allowing visitors to engage in conversation with Dalí via a reproduction of his famous lobster phone.
Odwiedzający mogą zadawać pytania i otrzymywać odpowiedzi w głosie i stylu artysty.
Wystawa łączy zaawansowaną technologię głosową z interaktywnym, surrealistycznym interfejsem. Od momentu uruchomienia, Ask Dalí zarejestrowało ponad 75 000 rozmów na tematy od sztuki i historii po współczesne wydarzenia i osobiste przemyślenia.
Martin Pagh Ludvigsen, lider projektu w GS&P, wyjaśnił inspirację stojącą za Głosem Dalí: „Pierwotnym pomysłem było stworzenie przewodnika, którego ludzie mogliby używać podczas spaceru po muzeum. Okazało się to zbyt skomplikowane, więc skupiliśmy się na czacie Q&A z Dalí w jednym miejscu.”
Użycie telefonu z homarem jako medium odzwierciedla fascynację Dalí — i jego miłość-nienawiść — do telefonów. Stworzył cztery kolorowe wersje i sześć modeli w kolorze kości słoniowej tego słynnego surrealistycznego obiektu, z których jeden jest dumnie prezentowany w Muzeum.
Non-profitowe Muzeum Dalí ma bogatą historię w zakresie technologii. Oprócz regularnych doświadczeń VR, prowadzi Dalí Lives, stałą wystawę z AI-generowaną, naturalnej wielkości rekreacją wideo artysty. Od momentu uruchomienia w 2018 roku, ta nagradzana wystawa pozostaje jedną z najpopularniejszych cyfrowych atrakcji Muzeum.
Głos Dalí jest zasilany przez Eleven Multilingual V2 text-to-speech model od ElevenLabs, wraz z GPT-4 od OpenAI, który obsługuje odpowiedzi konwersacyjne. Głos AI został przeszkolony na podstawie wywiadów, pism i wzorców mowy Dalí, aby stworzyć cyfrową osobowość jak najbliższą artyście.
To zrozumienie jest połączone z niską latencją przetwarzania audio ElevenLabs, co umożliwia natychmiastowe, realistyczne odpowiedzi głosowe. Modele AI uczą się i doskonalą interakcje z czasem, zwiększając zaangażowanie.
Martin Pagh Ludvigsen opisał, jak powstał pomysł: „Dwóch członków naszego zespołu kreatywnego natknęło się na demo modelu głosowego ElevenLabs w rozmowie z obsługą klienta. To zainspirowało pomysł — dlaczego nie stworzyć wystawy konwersacyjnej, gdzie ludzie mogliby rozmawiać z Dalí?”
Jednym z wyzwań było to, że pierwszymi językami Dalí były kataloński, hiszpański i francuski. Jednak dzięki wielojęzycznym możliwościom ElevenLabs zespół mógł trenować model w języku angielskim, zachowując charakterystyczne wzorce mowy Dalí.
Co ciekawe, gdy AI Dalí mówi po hiszpańsku, robi to z katalońskim akcentem, odzwierciedlając jego autentyczny styl mowy. Jak dotąd odwiedzający pozytywnie reagują na tę dbałość o szczegóły. Zespół odkrył, że byli w stanie zbliżyć się do katalońskiego akcentu, trenując model głosowy na przykładach Dalí mówiącego po angielsku, niż po hiszpańsku.
I używaj go do filmów, reklam, podcastów i nie tylko
Trenowanie głosu Dalí wymagało iteracyjnego procesu. Zespół uruchomił wiele wersji modelu, doskonaląc wynik, aż osiągnęli jak najbliższe dopasowanie.
Innym wyzwaniem było zapewnienie, że osobowość Dalí została wiernie odtworzona. Jak wyjaśniła Beth Harrison z Muzeum Dalí: „Naszym celem było ożywienie Dalí w jego Muzeum. Potrzebowaliśmy, aby jego cyfrowa osobowość była jak najbardziej realna.”
Aby to osiągnąć, zespół stworzył szczegółowy prompt dla GPT-4 oparty na nagranej mowie i pismach Dalí, zapewniając, że głos nie tylko brzmi jak Dalí, ale także odpowiada jak on.
Pierwszy prawdziwy test AI miał miejsce na South by Southwest (SXSW) w Austin, Teksas, gdzie zaprezentowano demo przed premierą. Choć system był jeszcze w fazie rozwoju, dokładność głosu i surrealistyczne odpowiedzi Dalí zrobiły wrażenie na publiczności.
Jednym z najbardziej zaskakujących wyników projektu była spontaniczność w odpowiedziach Dalí.
Beth Harrison podzieliła się: „Niektóre odpowiedzi są tak surrealistyczne, że tylko Dalí mógłby je wymyślić. Widzieliśmy nawet, jak odpowiada na pytanie innym pytaniem — jakby celowo angażował się w rozmowę.”
To nie zostało zaprogramowane w AI, ale wynikło naturalnie z jego konstrukcji.
Wystawa jest zaprojektowana z myślą o prywatności. Odwiedzający zadają pytania przez telefon jeden po drugim, a choć odpowiedzi są nagrywane, publiczne pytania nie są przechowywane.
Dodatkowo, nie ma procesu rejestracji, co sprawia, że doświadczenie jest płynne i intymne. Dotykowy charakter słuchawki telefonu zwiększa zaangażowanie, wzmacniając iluzję rozmowy bezpośrednio z Dalí.
Zespół już bada przyszłe instalacje, przesuwając granice technologii i kreatywności, aby ożywić wizjonerski świat Dalí w nowych i nieoczekiwanych sposobach.
Ask Dalí udowodniło, że AI może zrobić więcej niż tylko replikować mowę — może odtworzyć istotę artysty. Dzięki tej instalacji odwiedzający mogą doświadczyć dowcipu, uroku i tajemnicy surrealisty w głęboko osobisty sposób.
Top 10 najlepszych programów do zmiany głosu w 2025