
O Estado da Voz IA Conversacional na Educação
Como a Voz IA Conversacional apresenta uma oportunidade de multiplicar por 10 os resultados de aprendizagem
A faculdade de medicina é desafiadora, para dizer o mínimo.
Há poucos anos, os estudantes passavam os dias memorizando infinitos flashcards e informações de livros densos. Ainda assim, havia a sensação de que, por mais fatos que você decorasse, nada preparava totalmente os futuros médicos para interações reais com pacientes.
Os fundadores da Sketchy conheciam bem essa sensação. Eles eram estudantes de medicina em 2013, desenhando personagens em guardanapos para ajudar a fixar o aprendizado de microbiologia.
Logo, esses rabiscos em guardanapos se transformaram em uma plataforma de aprendizado visual completa, agora usada por centenas de milhares de estudantes de medicina em todo o mundo.
Mas há uma parte da jornada clínica que nem as melhores ilustrações conseguiam capturar: conversas reais com pacientes.
Quando a Sketchy começou a experimentar simulações de pacientes, o objetivo não era apenas recriar cenários. Era evocar uma resposta emocional nos estudantes.A hesitação na voz de um paciente. Uma leve confusão.As sutis dicas que transformam conhecimento clínico em julgamento clínico.
Foi aí que ElevenLabs entrou em cena.
Sketchy já havia se destacado, transformando conteúdo médico complexo em memórias visuais. Mas, ao aprofundar na educação clínica, a equipe notou uma lacuna.
Os estudantes estavam se formando com um forte conhecimento básico, mas muitas vezes faltava prática em raciocínio clínico, comunicação, empatia e a incerteza confusa que caracteriza o atendimento real ao paciente.
A preparação para OSCE, estágios e exames orais exige mais do que memorização. Requer flexibilidade e presença ativa. E nenhum baralho de flashcards ensina como responder quando um paciente faz sua primeira pergunta, ou como lidar com nuances culturais ao dar notícias difíceis.
A Sketchy começou a explorar maneiras de simular esses momentos. A resposta não era mais conteúdo estático ou vídeos de escolha ramificada. Precisava parecer uma conversa real, com toda a realidade e imprevisibilidade que vem com isso.
“Já estávamos usando IA para criar casos interativos”, compartilhou Ben Muller, MD, Diretor de Conteúdo da Sketchy. “Mas a experiência não parecia totalmente humana até adicionarmos a voz.”
Os primeiros experimentos com modelos de voz prontos foram decepcionantes. Tom monótono. Ritmo robótico. Desconexão emocional. No aprendizado clínico, essas peças faltantes importam.
O que tornou a ElevenLabs diferente foi o quão real soava, até nas inflexões. A plataforma deu à Sketchy acesso a vozes emocionalmente expressivas em dezenas de idiomas, com controle fino sobre ritmo, tom e até peculiaridades fonéticas.

Um dos primeiros desafios? Temperatura. Literalmente.
“Os modelos de voz estavam lendo coisas como ‘98 °F’ como ‘noventa e oito graus... F”, lembrou o Dr. Muller. A solução envolveu a criação de dicionários de fonemas para orientar a pronúncia. Um pequeno detalhe técnico, mas significativo. Porque no diálogo clínico, a precisão conta.
Assim que a ElevenLabs foi integrada, as mudanças na experiência dos estudantes foram imediatas.
As simulações de pacientes pararam de soar como atores lendo roteiros e começaram a parecer conversas que você realmente teria na enfermaria. A Sketchy usou a ElevenLabs para criar vozes para personagens com personalidades distintas — hesitantes, calorosas, assertivas e confusas. Cada uma foi adaptada para corresponder a cenários clínicos específicos.
Um estudante trabalhando em um caso de asma pode encontrar uma mãe preocupada fazendo perguntas rápidas. Outro caso pode envolver um adolescente minimizando sintomas. Os agentes de IA começaram a responder de forma autêntica, ajustando sua entrega para soar como fala humana natural.
Logo, feedbacks extremamente positivos começaram a chegar:
“Foi muito divertido... Mal posso esperar por mais casos.”
“Adorei a personalidade do paciente e a conversa realista que ela conseguiu ter.”
Os estudantes estavam fazendo mais do que apenas aprender: estavam se conectando em práticas interativas do mundo real. E foi isso que inspirou a criação da Sketchy em primeiro lugar.
A Sketchy não estava buscando novidade por si só. Suas equipes de conteúdo e produto testaram rigorosamente como as interações de voz moldavam a confiança, a memória e a prontidão a longo prazo dos estudantes. O que encontraram foi encorajador.
Ao substituir múltipla escolha passiva por diálogo ativo, os estudantes praticaram o que dizer e como dizer.
Como o formato era interativo, a equipe também pôde estudar como os estudantes aprendiam: onde eles pausavam, onde hesitavam e quão rapidamente se adaptavam.
Para a Sketchy, esses insights não eram abstratos. Eles alimentaram diretamente o design de futuras simulações, ajudando a refinar tanto o conteúdo educacional quanto a lógica de IA por trás disso como um ciclo de desenvolvimento de aprendizado benéfico.
Do ponto de vista comercial, integrar a ElevenLabs fazia sentido.
As interações com Voz IA se tornaram um diferencial claro, especialmente para instituições que buscam formatos de aprendizado mais imersivos e repetíveis. Os casos com voz mantêm os alunos engajados por mais tempo e incentivam sessões de retorno mais frequentes (uma métrica que a equipe acompanha de perto).
Mas o verdadeiro valor era mais difícil de quantificar. Os estudantes saíam das simulações mais bem preparados e também mais curiosos, reflexivos e dispostos a tentar novamente e melhorar.
Essa mudança de mentalidade para um aprendizado ativo, autodirigido e centrado no humano não é fácil de criar. Mas com a tecnologia de voz certa, tornou-se possível para a Sketchy.
A Sketchy agora vê a voz IA como um pilar de sua futura plataforma, não uma inovação isolada.
Novos casos de uso já estão em desenvolvimento, abrangendo cenários que vão além dos fatos clínicos para áreas como ética, trabalho em equipe e resolução de conflitos.
À medida que as ferramentas de diagnóstico com IA melhoram, a equipe da Sketchy espera que seu papel evolua. Não será
suficiente treinar os estudantes para fornecer o diagnóstico correto. Eles também precisarão ensinar como interpretar saídas de IA, gerenciar incertezas e comunicar riscos aos pacientes com clareza e empatia.
Nesse contexto, a conexão humana se torna uma vantagem competitiva.
E a voz, genuína, imperfeita, com som humano, desempenha um papel central.
Se há uma lição que a Sketchy ofereceria aos colegas no mundo EdTech, é esta: Não apenas digitalize o que já existe.Use IA para construir o que não poderia existir antes.
A Voz IA desbloqueou novas capacidades para simular pacientes que interrompem. Emoções que te pegam de surpresa. Personagens que moldam como o caso de um paciente é percebido emocionalmente. Isso não são truques. São ferramentas que treinam os estudantes para navegar no mundo real, em vez de um roteiro linear.
Como disse Girish Krishnaswamy, CEO da Sketchy: “O objetivo nunca foi substituir instrutores ou automatizar a empatia. Foi dar superpoderes aos educadores e tornar o aprendizado inesquecível para os estudantes.”

Como a Voz IA Conversacional apresenta uma oportunidade de multiplicar por 10 os resultados de aprendizagem

Chess.com dá voz ao seu professor virtual de xadrez
Desenvolvido por ElevenLabs Agentes