Apresentando o Eleven v3 (alpha)

Experimente o v3

O papel da Conversational AI nos jogos

A Conversational AI da ElevenLabs está transformando os jogos ao permitir interações dinâmicas com NPCs e narrativas imersivas.

A young man sitting on the floor, holding a game controller, illuminated by colorful neon lighting.

Os jogos estão mudando — e a voz está liderando essa transformação. Por anos, os mundos dos jogos dependeram de diálogos roteirizados e interações pré-definidas com NPCs, masa Conversational AI está rompendo esses limites, tornando os personagens mais responsivos, imersivos e vivos.

Personagens movidos por IA não estão mais limitados a caminhos roteirizados — agora eles reagem em tempo real às escolhas dos jogadores, remodelando a narrativa e aumentando o controle do jogador. Grandes desenvolvedores já estão integrando essa tecnologia, aprimorando o diálogo dos NPCs e criando companheiros movidos por IA que parecem realmente vivos.

Conheça Callum, um agente IA Mago construído com a Conversational AI da ElevenLabs. Ele pode atuar como Mestre de Masmorras, fornecer exposição no jogo ou até guiar jogadores em quebra-cabeças complicados. Com IA assim, é fácil ver como agentes conversacionais podem se integrar perfeitamente aos jogos, transformando NPCs em companheiros envolventes e dinâmicos.

Redefinindo a mídia com a Conversational Voice AI

Dejogos a streaming, o futuro da mídia é movido pela voz. Cada vez mais, o público busca experiências imersivas e em tempo real que borram a linha entre criador e consumidor.

A Conversational voice AI já está se mostrando uma característica chave dessa mudança e é uma tecnologia que se tornou comum para os consumidores, com personalização e interatividade agora amplamente esperadas dos dispositivos inteligentes que usamos diariamente. Quando se trata de jogos, no entanto, ainda não vimos uma aplicação totalmente integrada da tecnologia de Conversational voice AI — surpreendente, dado seu caráter inerentemente interativo como mídia e a rica narrativa que é tão crucial para qualquer experiência de jogo bem-sucedida.

Esses fatores tornam a voz IA uma combinação natural para jogos. A adoção está crescendo, liderada por grandes desenvolvedores, mas desafios permanecem. Desafios como latência, custo e consistência narrativa continuam sendo obstáculos importantes, mas os avanços contínuos estão gradualmente superando essas lacunas.

Mesmo com esses desafios, os sinais são claros: a Conversational voice AI está prestes a mudar as expectativas para experiências de jogos. À medida que suas aplicações crescem, não está apenas redefinindo como jogamos, mas como nos conectamos com histórias, personagens e mundos.

Um mercado em crescimento: Conversational AI na mídia e entretenimento

Diagram showing various AI development platforms, game studios, real-time AI engines, voice AI innovators, NPC and character AI engines, and community platforms.

O mercado de Conversational AI está crescendo rapidamente. Globalmente, espera-se que salte de $13,2 bilhões em 2024 para $49,9 bilhões até 2030, à medida que tecnologias interativas se tornam mais comuns. Dentro do setor de mídia e entretenimento como um todo, as aplicações de IA devem crescer a uma taxa anual sólida de 17,5%, atingindo $10,24 bilhões em 2024 e $51,37 bilhões até 2034.

Esse boom é alimentado pela demanda por experiências mais personalizadas, recomendações mais inteligentes e maneiras dinâmicas de engajar o público — eos jogosnão são exceção.

Esse impacto da IA na indústria de jogos é significativo. Espera-se que a IA contribua com um aumento de receita de $3,1 bilhões para a indústria de jogos até o final de 2024, e a Conversational voice AI está emergindo como uma das tendências mais definidoras que moldam o setor. Além disso, 70% dos desenvolvedores de jogos veem a IA como essencial para a próxima geração de videogames, destacando seu papel central nas experiências de jogo futuras. E embora nem todos os desenvolvedores estejam comprometendo sua pesquisa com a Conversational voice AI no momento, prevemos que os desenvolvedores que implementarem corretamente liderarão o caminho por meio de maior retenção e satisfação dos jogadores.

Casos de uso

Com isso em mente, é claro que a Conversational voice AI já faz parte dos planos de muitos estúdios de desenvolvimento — e vemos um vasto potencial para sua aplicação em jogos de mundo aberto, comunidades multiplayer e tutoriais no jogo.

Interações aprimoradas com NPCs e companheiros

Na vanguarda da inovação em jogos, estúdios já estão implementando a Conversational voice AI para melhorar as interações com personagens não jogáveis (NPCs).

Um exemplo notável éInworld AI, cujo plugin para Unreal Engine 5 oferece um kit de ferramentas poderoso para criar NPCs realistas com motivações, objetivos e histórias únicas. O Contextual Mesh da Inworld garante que os personagens permaneçam fiéis ao mundo do jogo, enquanto seu recurso Character Brain impulsiona performances realistas, permitindo que emoções influenciem o tom de voz, animações e expressões faciais. Os desenvolvedores podem até integrar perfis de jogadores, relacionamentos e objetivos de personagens nos ciclos de jogo, desbloqueando novas mecânicas e mais oportunidades de narrativa imersiva.

Com uma avaliação de $500 milhões e financiamento significativo, a Inworld está rapidamente se estabelecendo como líder no campo.

Em outros lugares,Electronic Arts (EA) está explorando como a IA pode elevar o comportamento dos NPCs por meio de sua SEED (Search for Extraordinary Experiences Division), estabelecendo novos padrões de engajamento. Enquanto isso,Avatar Cloud Engine (ACE) da Nvidia impulsiona personagens movidos por IA, permitindo interações naturais e conversacionais que vão além dos limites de um sistema tradicional de 'ramificação narrativa'. Como diz John Spitzer da Nvidia, seu objetivo é entregar as “animações complexas e fala conversacional necessárias para que as interações digitais pareçam reais.”

O Projeto NEO NPC da Ubisoft aproveita o Audio2Face da Nvidia e o Large Language Model da Inworld para criar NPCs que respondem autenticamente às escolhas dos jogadores enquanto permanecem profundamente ligados à tradição do jogo. O resultado é um diálogo que parece tanto espontâneo quanto consistente com a narrativa. Neste caso, os designers da Ubisoft criaram histórias de fundo e personalidades para garantir que os NPCs mantenham um nível de autenticidade que permaneça fiel ao jogo. Além disso, como visto no vídeo de demonstração abaixo, os jogadores podem construir ativamente relacionamentos com os NPCs que encontram por meio da natureza e do tom da conversa, o que, por sua vez, impacta como a narrativa se desenrola. A Ubisoft também foi cuidadosa ao adicionar filtros para toxicidade dos jogadores e mecanismos para manter as interações dentro do escopo da narrativa.

Para estúdios que ainda não estão prontos para mergulhar totalmente na Conversational voice AI, há maneiras de começar a explorar as possibilidades com menos compromisso. Um primeiro passo comum é aproveitar a tecnologia Text-to-Speech (TTS) para criar diálogos “rascunho” para testar interações de personagens antes de gravar com dubladores. Essa abordagem não apenas agiliza o desenvolvimento inicial, mas também permite iteração rápida. À medida que os estúdios se tornam mais confortáveis com a tecnologia, podem passar a usar TTS para locuções completas de personagens, lidando com tudo, desde a criação inicial até a implementação final.

A Conversational voice AI está tornando os NPCs mais dinâmicos e responsivos, permitindo que os estúdios criem interações mais ricas que parecem mais realistas.

Narrativas únicas, vez após vez

É claro, então, como a Conversational voice AI pode expandir o potencial narrativo dos jogos, oferecendo histórias que evoluem em direções inesperadas com base nas decisões dos jogadores.

Isso é especialmente poderoso em jogos de mundo aberto como a sérieFalloutda Bethesda ouRed Dead RedemptioneGrand Theft Autoda Rockstar. Esses títulos, conhecidos por suas narrativas profundas e ambientes ricos, já permitem que decisões iniciais moldem resultados posteriores. Ao integrar a Conversational AI, os desenvolvedores podem adicionar novas camadas de interatividade - desbloqueando diálogos únicos, easter eggs ocultos e enredos dinâmicos a cada nova jogada.

Para os estúdios, é claro, isso significa maior rejogabilidade e uma extensão dos ciclos de vida dos jogos que, para os títulos mencionados, já se estendem por uma década. Os jogadores são incentivados a retornar, explorando oportunidades perdidas e novos resultados, criando uma situação vantajosa tanto para engajamento quanto para lucratividade.

O desafio, é claro, é a escala. Jogos de mundo aberto já são empreendimentos vastos, e incorporar a Conversational AI exige que os desenvolvedores projetem resultados ainda mais diversos. No entanto, à medida que a tecnologia amadurece, esperamos que a capacidade de enriquecer o jogo torne esses esforços bem recompensados.

Comunidade

Para muitos jogadores, a comunidade está no coração de sua experiência de jogo. A explosão de plataformas como Twitch, e em menor medida Discord, ilustra isso perfeitamente — em 2024 até agora, o Twitch recebeu mais de 17,1 bilhões de visitas mensais, com cerca de 6,91 milhões de streamers ativos e quase 56.531.804 horas de conteúdo diariamente — números que destacam seu imenso alcance e relevância como um centro para comunidades de jogos.

Mesmo além dos jogos, esse ethos comunitário influenciou como marcas e empresas abordam suas estratégias, com muitas agora priorizando o cultivo de comunidades autênticas e orgânicas no centro de sua identidade e marketing. A Conversational voice AI tem o potencial de aprimorar esses espaços, adicionando uma nova camada de interatividade e engajamento que complementa as dinâmicas existentes.

Veja o ai_licia, por exemplo. Projetado especificamente para Twitch e Discord, o ai_licia atua como um co-anfitrião IA, enriquecendo transmissões ao vivo com interações divertidas e personalizadas. Sua integração perfeita com o Twitch permite que ele combine o tom e a personalidade de um membro típico da comunidade, tornando as interações naturais e relevantes.

Impulsionado pela ElevenLabs, o ai_licia é personalizável para se alinhar com a cultura de cada comunidade e jogos preferidos. Sua memória multiplataforma o diferencia, permitindo que ele reconheça e lembre-se dos usuários entre sessões, promovendo um senso de pertencimento. Além do engajamento, o ai_licia também pode simplificar a integração de novos membros, garantindo que eles rapidamente encontrem seu lugar dentro da comunidade.

Embora ainda esteja em seus estágios iniciais, ferramentas de Conversational AI como o ai_licia demonstram o imenso potencial para remodelar comunidades de jogos. Ao fomentar laços mais fortes, melhorar a retenção e encorajar conexões mais profundas, a Conversational voice AI está prestes a redefinir como jogadores e fãs interagem nos espaços mais vibrantes dos jogos.

Treinamento e tutoriais: elevando a orientação no jogo

Chess.com Gives Their Virtual Chess Teacher a Voice

Chess.com & ElevenLabs Partnership

Chess.com, founded in 2007, has long been dedicated to serving the global chess community by offering innovative tools for playing, connecting, and learning online. One of their top learning apps, Learn Chess with Dr. Wolf, features an interactive virtual chess teacher who adapts to users' abilities, providing personalized guidance to help them improve their game.

Initially, Dr. Wolf offered only text-based commentary. However, after receiving user feedback highlighting the need for audio guidance—particularly to assist younger players struggling with reading—the Chess.com team recognized the potential to enhance the learning experience by adding a voice component. To achieve this, they partnered with ElevenLabs to find a voice that was both authoritative and warm, maintaining the personal touch of a seasoned chess coach.

The integration of ElevenLabs' voice technology has been met with overwhelmingly positive responses. Users have noted that audio guidance allows them to keep their eyes on the chessboard, leading to a more natural and effective learning process. As Gabe Jacobs, the product manager on the Dr. Wolf team, stated:

"The introduction of a voice for Dr. Wolf has transformed our app. It's not just a feature—it’s brought a whole new dimension to learning chess online."
— Gabe Jacobs, Product Manager, Dr. Wolf Team

Uma das oportunidades mais claras para a Conversational voice AI está nos tutoriais no jogo. Ao permitir interações dinâmicas de voz, os desenvolvedores podem tornar o aprendizado mais envolvente e acessível para os jogadores.

Chess.comfornece um exemplo perfeito. SeuDr. Wolftutorjá era popular como uma ferramenta baseada em texto para ajudar jogadores a aprimorar suas habilidades no xadrez. Para levar isso adiante,Chess.comfez parceria com a ElevenLabs para dar ao Dr. Wolf uma voz calorosa e autoritária. O resultado? Uma experiência mais imersiva e intuitiva que ajudou mais de 100 milhões de usuários - especialmente os mais jovens - a se engajarem de forma mais natural com o aplicativo.

Para os desenvolvedores, esse sucesso destaca uma lição importante: a Conversational voice AI não é apenas um recurso. É uma maneira de aprofundar o engajamento dos jogadores, melhorar a retenção e criar uma experiência de usuário mais intuitiva.

Desafios

Embora vejamos a Conversational voice AI como uma evolução natural para enriquecer as experiências no jogo — e com investimento significativo de grandes players — o caminho para a integração total não está isento de obstáculos. Para que a Conversational AI realmente revolucione os jogos, vários desafios precisam de atenção.

Latência: a necessidade de interação em tempo real

Interação perfeita é crítica para manter os jogadores imersos, mas a latência continua sendo um grande obstáculo. Os jogadores esperam diálogos naturais e em tempo real, mas as tecnologias atuais muitas vezes lutam para entregar isso. Modelos de Linguagem de Grande Escala (LLMs) como o GPT-3 podem levar de 3 a 15 segundos para responder, excedendo em muito a janela ideal de 200 a 800 milissegundos para trocas semelhantes às humanas. Esses atrasos são esperados, mas acabam tirando a imersão e quebrando o fluxo do jogo para os usuários.

A IA baseada em voz adiciona mais complexidade, com o processo de speech-to-speech (reconhecimento, geração de resposta e entrega) introduzindo atrasos adicionais. Tecnologias como edge computing, que processam dados mais próximos dos jogadores, estão ajudando a reduzir os tempos de resposta. Estamos continuando a reduzir a latência do nosso text to speech para até 200 ms para geração e tempo de rede.

Mantendo a consistência narrativa

Enredos ramificados são uma das características mais atraentes dos jogos, mas também apresentam desafios. A Conversational AI deve se adaptar às decisões dos jogadores enquanto mantém a história coerente, uma tarefa complicada pelas limitações de memória nos modelos atuais, que podem perder detalhes narrativos importantes.

Os desenvolvedores estão abordando isso construindo sistemas para rastrear elementos essenciais da história, garantindo que as interações permaneçam consistentes e alinhadas com o enredo do jogo. Eles também estão usando o feedback dos jogadores para refinar as respostas da IA e garantir que a tecnologia melhore, em vez de interromper, a narrativa. Avanços no processamento em tempo real estão permitindo que os jogos se adaptem dinamicamente às escolhas dos jogadores, ajudando a Conversational AI a se integrar mais naturalmente em enredos complexos.

Custo

Paradox Interactive Speeds Up Voiceovers with ElevenLabs

Paradox Interactive & ElevenLabs Partnership

Paradox Interactive, the renowned Swedish game developer behind titles like Stellaris and Crusader Kings III, has partnered with ElevenLabs to integrate advanced voice technology into their game development process. This collaboration aims to streamline voice generation, reducing production time and costs.

Incorporating ElevenLabs' generative AI technology offers Paradox several benefits, including efficient iteration during pre-production, cost savings on extensive dialogues, flexible localization for global markets, enhanced accessibility for visually impaired players, and the ability to explore new narratives and expansions with ease.

Ernesto Lopez, Audio Director for Stellaris and Crusader Kings III, expressed enthusiasm about the partnership:

"We’re incredibly pleased with the results from the ElevenLabs platform. The samples created by their contextually aware engine have exceeded our expectations, inspiring us to push the limits of our projects and imagine more intricate and richer voice-over designs for our games."
— Ernesto Lopez, Audio Director, Paradox Interactive

Um dos maiores obstáculos para os desenvolvedores é o custo da implementação em larga escala da Conversational voice AI. O desenvolvimento de jogos já é um empreendimento financeiro significativo, abrangendo anos e exigindo investimento substancial. PegueGrand Theft Auto VI, por exemplo - apesar do lançamento de seu primeiro trailer em dezembro de 2023, sua data de lançamento permanece desconhecida, marcando mais de uma década desde o lançamento deGTA V. A produção de títulos de grande sucesso envolve custos enormes, destacando as pressões financeiras que os estúdios enfrentam antes mesmo de trazer um jogo ao mercado.

Os jogos geralmente são vendidos por $60–$70, com pacotes de expansão opcionais ou compras no jogo muitas vezes estendendo seu ciclo de vida. Para títulos comoGTA V, esses complementos são abraçados pelos jogadores e fornecem aos estúdios fluxos de receita adicionais sem alterar significativamente o custo inicial do jogo base. No entanto, implementar a Conversational AI introduziria não apenas custos de produção mais altos, mas também despesas contínuas relacionadas à execução de LLMs à medida que os jogadores interagem com o jogo. Esses custos aumentados poderiam levar os estúdios a absorver a despesa ou repassá-la aos consumidores por meio de preços mais altos.

No entanto, esse desafio apresenta uma oportunidade. Os estúdios poderiam explorar novos modelos de precificação, como assinaturas ou recursos de IA em camadas, para equilibrar os custos de desenvolvimento e o acesso dos jogadores. Com a abordagem certa, os desenvolvedores podem transformar recursos movidos por IA em uma fonte de receita sustentável.

Aceitação dos jogadores

Como acontece com muitas inovações em IA, o sucesso final da Conversational AI nos jogos depende de um fator crítico: a aceitação dos jogadores. Embora essa tecnologia ofereça um potencial imenso, é provável que enfrente resistência de alguns jogadores — particularmente puristas dos jogos que veem a presença da IA como uma mudança indesejada que poderia minar a autenticidade de um jogo.

Esse ceticismo não é infundado, já que tentativas passadas de implementar IA em jogos ocasionalmente falharam. Por exemplo, oProject Avada Keywords Studios, que visava criar um jogo 2D inteiramente usando IA, falhou porque a tecnologia não conseguiu substituir o talento humano e exigiu intervenção de sete estúdios de desenvolvimento de jogos separados para corrigir. Da mesma forma, os PCs Copilot+ da Microsoft, projetados para jogos movidos por IA, encontraram problemas significativos de compatibilidade - apenas metade dos 1.300 jogos de PC testados funcionaram sem erros, com títulos populares comoFortnite,League of Legends, eHalo Infiniteexperimentando falhas e problemas de inicialização. Esses erros destacam os riscos de sistemas de IA mal integrados, que podem alienar jogadores e interromper a experiência de jogo.

Quando bem implementada, a Conversational AI pode criar narrativas de jogo mais ricas, aprimorando tanto experiências de jogador único quanto dirigidas pela comunidade. Para que isso tenha sucesso em larga escala, a IA deve ir além de ser um truque ou uma reflexão tardia - precisa realmente melhorar a narrativa, a interatividade e a imersão do jogo. Os jogadores aceitarão quando virem que a Conversational AI adiciona valor significativo, criando experiências mais ricas e envolventes sem comprometer a autenticidade que eles esperam.

Olhando para o futuro

Line graph showing AI-driven gaming revenue growth from 2023 to 2033.

Embora desafios como latência, consistência narrativa e custo sejam reais, estão longe de serem intransponíveis. Com inovação contínua nos tempos de resposta e capacidades de narrativa ramificada, a Conversational voice AI está pronta para oferecer experiências imersivas e perfeitas que redefinem os jogos.

Além do jogo, essa tecnologia representa uma oportunidade significativa para os estúdios melhorarem a retenção de jogadores e impulsionarem o ROI por meio de narrativas mais ricas, interações dinâmicas e engajamento comunitário mais forte. Ao contrário da IA generativa, a Conversational voice AI se integra naturalmente aos mundos de jogos existentes, enriquecendo a experiência sem interromper histórias ou mecânicas estabelecidas.

Na ElevenLabs, temos orgulho de ajudar desenvolvedores a dar vida a personagens realistas e interações significativas. O potencial da Conversational voice AI para transformar não apenas os jogos, mas toda a mídia é imenso — e estamos animados para moldar essa evolução.

A Conversational voice AI não é mais apenas uma tecnologia emergente — ela está aqui, e o momento de adotá-la é agora. Ao desbloquear novas possibilidades para experiências imersivas, personalizadas e interativas, está redefinindo como os jogadores se envolvem com jogos e comunidades.

Embora existam desafios, soluções inovadoras estão fechando a lacuna, tornando a Conversational voice AI viável e positiva para o ROI. Na ElevenLabs, vemos essa tecnologia como uma força transformadora e temos orgulho de estar na vanguarda, ajudando desenvolvedores a criar experiências mais ricas e dinâmicas. O futuro dos jogos é conversacional, e estamos apenas começando.

Explore artigos da equipe ElevenLabs

ElevenLabs

Crie com o áudio IA da mais alta qualidade