
Automatize locuções de vídeos, leituras de anúncios, podcasts e mais, com a sua própria voz
Apresentando o Eleven v3 (alpha)
Experimente o v3Mais de 70.000 conversas aconteceram com Salvador Dalí — décadas após sua morte — graças à tecnologia de Voice Cloning da ElevenLabs.
O Museu Dalí em St. Petersburg, Flórida, foi inaugurado em 1982 para celebrar a vida e a arte do lendário surrealista Salvador Dalí. A coleção conta com mais de 2.400 peças, incluindo pinturas, ilustrações, esculturas, livros e fotografias.
O Museu foi fundado com obras coletadas por A. Reynolds e Eleanor Morse, patronos dedicados e amigos de Dalí. Ao longo de 40 anos, sua coleção particular cresceu e se tornou a maior de suas obras nos EUA. Hoje, os curadores do Museu continuam a expandir suas exposições.
Agora, graças a uma instalação movida por IA chamada Pergunte a Dalí, a presença do artista foi recriada digitalmente. O projeto — desenvolvido em colaboração com o Museu e a agência criativa Goodby Silverstein & Partners (GS&P) — usa ElevenLabs AI Voice e tecnologia Voice Cloning, permitindo que os visitantes conversem com Dalí através de uma reprodução de seu famoso telefone de lagosta.
Os visitantes podem fazer perguntas e receber respostas na voz e estilo do artista.
A exposição mistura tecnologia de voz avançada com uma interface interativa e surrealista. Desde seu lançamento, Pergunte a Dalí registrou mais de 75.000 conversas, com temas que vão da arte e história a eventos contemporâneos e reflexões pessoais.
Martin Pagh Ludvigsen, líder do projeto na GS&P, explicou a inspiração por trás da Voz de Dalí: “A ideia original era criar um guia que as pessoas pudessem usar enquanto caminhavam pelo museu. Isso acabou sendo um pouco complicado, então focamos em um chat de perguntas e respostas com Dalí em um único local.”
Usar o telefone de lagosta como meio reflete a fascinação de Dalí — e sua relação de amor e ódio — com telefones. Ele criou quatro versões coloridas e seis modelos off-white do famoso objeto surrealista, um dos quais está orgulhosamente exposto no Museu.
O Museu Dalí, sem fins lucrativos, tem uma forte história de abraçar a tecnologia. Junto com experiências regulares de VR, ele apresenta Dalí Lives, uma exposição permanente com uma recriação em vídeo em tamanho real gerada por IA do artista. Desde seu lançamento em 2018, essa exposição premiada continua sendo uma das experiências digitais mais populares do Museu.
A Voz de Dalí é movida pelo modelo Eleven Multilingual V2 text-to-speech da ElevenLabs, junto com o GPT-4 da OpenAI, que lida com as respostas conversacionais. A voz IA foi treinada com amostras de entrevistas, escritos e padrões de fala de Dalí para criar uma persona digital o mais fiel possível ao artista.
Esse entendimento é combinado com o processamento de áudio de baixa latência da ElevenLabs, permitindo respostas de voz instantâneas e realistas. Os modelos de IA continuam aprendendo e refinando as interações ao longo do tempo, aumentando o engajamento.
Martin Pagh Ludvigsen descreveu como a ideia surgiu: “Dois membros da nossa equipe criativa encontraram uma demonstração do modelo de voz da ElevenLabs em uma chamada de atendimento ao cliente. Isso gerou uma ideia — por que não criar uma exposição conversacional onde as pessoas pudessem falar com Dalí?”
Um desafio foi que as primeiras línguas de Dalí eram catalão, espanhol e francês. No entanto, as capacidades multilíngues da ElevenLabs permitiram que a equipe treinasse o modelo em inglês, preservando os padrões de fala distintos de Dalí.
Curiosamente, quando a IA de Dalí fala espanhol, ela o faz com um sotaque catalão, refletindo seu estilo autêntico de fala. Até agora, os visitantes têm respondido positivamente a essa atenção aos detalhes. A equipe descobriu que conseguiu se aproximar mais do sotaque catalão ao treinar o modelo de voz com exemplos de Dalí falando em inglês, em vez de espanhol.
Automatize locuções de vídeos, leituras de anúncios, podcasts e mais, com a sua própria voz
Treinar a voz de Dalí exigiu um processo iterativo. A equipe executou várias versões do modelo, refinando o resultado até alcançar a correspondência mais próxima possível.
Outro desafio foi garantir que a personalidade de Dalí fosse recriada fielmente. Como Beth Harrison do Museu Dalí explicou: “Nosso objetivo era trazer Dalí à vida em seu Museu. Precisávamos que sua persona digital parecesse o mais real possível.”
Para conseguir isso, a equipe elaborou um prompt detalhado para o GPT-4 com base nos discursos e escritos gravados de Dalí, garantindo que a voz não apenas soasse como Dalí, mas também respondesse como ele.
O primeiro teste real da IA ocorreu no South by Southwest (SXSW) em Austin, Texas, onde uma demonstração pré-lançamento foi apresentada. Embora o sistema ainda estivesse em desenvolvimento, a precisão da voz e as respostas surrealistas de Dalí impressionaram o público.
Um dos resultados mais surpreendentes do projeto foi a espontaneidade nas respostas de Dalí.
Beth Harrison compartilhou: “Algumas respostas são tão surreais que só Dalí poderia tê-las criado. Já vimos ele responder a uma pergunta com outra pergunta — quase como se estivesse deliberadamente engajando na conversa.”
Isso não foi programado na IA, mas surgiu naturalmente de seu design.
A exposição é projetada com a privacidade em mente. Os visitantes fazem perguntas pelo telefone uma de cada vez, e embora as respostas sejam gravadas, as perguntas públicas não são armazenadas.
Além disso, não há processo de inscrição, tornando a experiência fluida e íntima. A sensação tátil do fone de telefone aumenta o engajamento, reforçando a ilusão de estar falando diretamente com Dalí.
A equipe já está explorando futuras instalações, ultrapassando os limites da tecnologia e criatividade para trazer o mundo visionário de Dalí à vida de maneiras novas e inesperadas.
Pergunte a Dalí provou que a IA pode fazer mais do que replicar a fala — pode recriar a essência de um artista. Através desta instalação, os visitantes podem experimentar o humor, charme e mistério do surrealista de uma maneira profundamente pessoal.
Os 10 melhores softwares de modificação de voz em 2025