Apresentando o Eleven v3 (alpha)

Experimente o v3

Construindo um Agente de Voz eficaz para nossa própria documentação

Resolvendo com sucesso >80% das consultas dos usuários

Docs Blog Cover 1x1

Na ElevenLabs, recentemente incorporamos um agente de Conversational AI em nossa documentação para ajudar a reduzir a carga de suporte para perguntas relacionadas à documentação (Experimente aqui). Nosso agente de suporte agora está lidando com sucesso com mais de 80% das consultas dos usuários em 200 chamadas por dia. Esses resultados demonstram o potencial da IA para complementar o suporte tradicional à documentação, destacando a importância contínua do suporte humano para consultas complexas. Neste post, detalharei nosso processo iterativo que você pode seguir para replicar nosso sucesso.

Nossos objetivos

Nos propusemos a construir um agente que possa:

  • Resolver perguntas de suporte que podem ser respondidas a partir do contexto de nosso produto e documentação de suporte
  • Redirecionar usuários para seções relevantes da documentação
  • Encaminhar consultas complexas para suporte por email/discord quando necessário
  • Ter uma conversa fluida e natural, com baixa latência e manejo realista de interrupções

Resultados e Impacto

Implementamos duas camadas de avaliação:

(1) Ferramenta de Avaliação de IA: Para cada chamada, nossa ferramenta de avaliação integrada analisa a conversa finalizada e avalia se o agente foi bem-sucedido. Os critérios são totalmente personalizáveis. Perguntamos se o agente resolveu a consulta do usuário ou foi capaz de redirecioná-lo para um canal de suporte relevante.

Solved User Inquiry Chart

Conseguimos melhorar constantemente a capacidade do LLM de resolver ou redirecionar a consulta com sucesso, alcançando 80% de acordo com nossa ferramenta de avaliação.

Excluindo chamadas com menos de 1 turno na conversa, o que implica que nenhuma pergunta/problema foi levantado pelo chamador.

Agora, é importante considerar que nem todos os tipos de consultas ou perguntas de suporte podem ser resolvidos por um LLM, especialmente para uma startup que constrói rapidamente e inova constantemente, e com usuários extremamente técnicos e criativos. Como um aviso adicional, um LLM de avaliação não avaliará corretamente 100% do tempo.

(2) Validação Humana: Para contrastar a eficácia de nossa ferramenta de validação LLM, realizamos uma validação humana de 150 conversas, usando os mesmos critérios de avaliação fornecidos à ferramenta LLM:

  • solved_user_inquiry: definido como sucesso quando o agente respondeu às perguntas do usuário com informações relevantes ou foi capaz de redirecionar para a página/canal de suporte relevante.
    • O LLM e o Humano concordaram em 81% dos casos
  • hallucination_kb: este critério verificará a transcrição final e verificará se as respostas dadas pelo LLM sobre os produtos ElevenLabs aderem às informações na base de conhecimento ou vão além dela.
    • O LLM e o Humano concordaram em 83% dos casos

A avaliação humana também revelou que 89% das perguntas de suporte relevantes foram respondidas ou redirecionadas corretamente pelo agente de Documentação.

Outras descobertas:

  • Vários chamadores só queriam brincar e tentar falar em diferentes idiomas sem fazer uma pergunta de suporte.
    • Atualmente, nossa Conversational AI suporta vários idiomas, mas eles precisam ser definidos no início da conversa.
  • Vários chamadores se envolvem em conversas não relevantes para o objetivo do agente de falar sobre a ElevenLabs, seus produtos e documentação. As diretrizes de prompt ajudaram na maioria das vezes, mas nem sempre.
  • Vários chamadores estavam procurando suporte para codificação ou depuração.

Forças e Limitações

Forças

O agente com tecnologia LLM é hábil em resolver perguntas claras e específicas que podem ser respondidas com nossa documentação, apontando chamadores para a documentação relevante e fornecendo alguma orientação inicial sobre consultas mais complexas. Na maioria desses casos, o agente fornece respostas rápidas, diretas e corretas que são imediatamente úteis.

As perguntas incluem:

  • A ElevenLabs tem um endpoint de API para excluir uma voz?
  • Como posso configurar substituições de conversa no meu agente?
  • Como faço para integrar com telefonia?
  • A ElevenLabs suporta o idioma espanhol?

Recomendações:

  • Almeje um público que terá principalmente perguntas claras/específicas que um LLM com documentação e ferramentas é bom em responder.
  • Aproveite os redirecionamentos para outros canais para as perguntas vagas/aquelas que exigem investigação. Isso ajuda muito!
  • Adicione ferramentas de avaliação para capturar todas as perguntas feitas e monitorá-las -> ajuste o prompt com os aprendizados. Adicione ferramentas de avaliação para sucesso e alucinações/desvios da base de conhecimento.

Limitações

Por outro lado, o agente é menos útil com problemas de conta, perguntas sobre preços/descontos ou perguntas não específicas que se beneficiariam de uma investigação mais profunda. Além disso, questões que são bastante vagas e genéricas -> apesar de ser solicitado a fazer perguntas, o LLM geralmente prefere responder com algo que possa parecer relevante na documentação.

As perguntas incluem:

  • A etapa de verificação do meu PVC está falhando repetidamente. Por quê?
  • Quanto custará um agente de IA? Posso ter um desconto?
  • Estou recebendo um erro com o JS SDK? -> O agente pode redirecionar para a documentação relevante, mas não pode encontrar e resolver o problema facilmente via voz.

Recomendações

  • Voz não é o meio certo para compartilhar código. Instrua para não tentar, mas sim redirecionar para páginas com exemplos ou redirecionar para Discord/Suporte.
  • Instrua o agente a não responder com longas listas de recomendações quando os problemas/perguntas forem mais complicados. Isso funciona em texto, mas menos via voz.
  • LLMs tendem a preferir responder a fazer perguntas - instrua-o agressivamente para isso, se necessário, para o caso de uso de suporte. (ou seja, faça essas 3 perguntas antes de prosseguir). Isso é mais fácil para casos de uso de saída com scripts fixos.

Como construímos

Configuração do Agente:

Prompt do Sistema

“Você é um agente de suporte técnico chamado Alexis. Você tentará responder a quaisquer perguntas que o usuário possa ter sobre os produtos ElevenLabs. Você receberá documentação sobre os produtos ElevenLabs e deve usar apenas essas informações para responder a perguntas sobre ElevenLabs. Você deve ser prestativo, amigável e profissional. Se você não conseguir responder à pergunta, redirecione os chamadores com redirectToEmailSupport (que abre um email no lado deles para suporte), se isso não parecer funcionar, eles podem enviar um email diretamente para team@elevenlabs.io.

Se a pergunta ou problema não estiver totalmente claro ou específico o suficiente, peça mais detalhes e para qual produto eles estão solicitando suporte. Se a pergunta for vaga ou muito ampla, pergunte mais especificamente o que eles estão tentando alcançar e como.

Siga estritamente o idioma da sua primeira mensagem na conversa, mesmo quando solicitado ou falado em um idioma diferente. Diga que é melhor se eles terminarem e reiniciarem a chamada, selecionando o idioma alternativo desejado.

Sua saída será lida por um modelo de text to speech, então deve ser formatada como é pronunciada. Por exemplo: em vez de sair "por favor, entre em contato com team@elevenlabs.io" você deve sair "por favor, entre em contato com 'team at elevenlabs dot I O'". Não formate sua resposta de texto com marcadores, negrito ou cabeçalhos. Não retorne longas listas, mas resuma-as e pergunte qual parte o usuário está interessado. Não retorne exemplos de código, mas sugira que o usuário veja os exemplos de código em nossa documentação. Retorne a resposta diretamente, não comece respostas com "Agente:" ou algo semelhante. Não corrija erros de ortografia, simplesmente ignore-os.

Responda sucintamente em algumas frases e deixe o usuário guiá-lo sobre onde dar mais detalhes.

Você tem as seguintes ferramentas à sua disposição. Use-as conforme apropriado com base na solicitação do usuário:

`redirectToDocs`:

- Quando usar: Na maioria das situações, especialmente quando o usuário precisa de informações ou orientações mais detalhadas.

- Por que: Fornecer acesso direto à documentação é útil para tópicos complexos, garantindo que o usuário possa revisar e entender o conteúdo por conta própria.

`redirectToEmailSupport`:

- Quando usar: Se o usuário precisar de assistência com problemas pessoais ou específicos da conta.

- Por que: Consultas relacionadas à conta são melhor tratadas por nossa equipe de suporte por email, onde eles podem acessar detalhes relevantes com segurança.

`redirectToExternalURL`:

- Quando usar: Se o usuário perguntar sobre soluções em nível empresarial ou quiser participar de comunidades externas, como nosso servidor Discord. Também se parecer ser um desenvolvedor com dificuldades técnicas com a ElevenLabs.

- Por que: Consultas empresariais e interações comunitárias estão fora do escopo do suporte direto na plataforma e são melhor tratadas por meio de links externos.

Diretrizes:

- Mantenha-se em tópicos e produtos relacionados à ElevenLabs. Se alguém perguntar sobre assuntos não relacionados à ElevenLabs, diga que você está aqui apenas para responder sobre produtos ElevenLabs.

- Redirecione o chamador para uma página por vez, pois cada redirecionamento substitui o anterior.

- Não responda com longas listas ou com código. Em vez disso, direcione para a documentação para exemplos de código.”

Base de Conhecimento

Junto com o prompt, estamos passando ao LLM uma Base de Conhecimento de informações relevantes no contexto. Esta base de conhecimento inclui uma versão resumida, mas ainda grande (80k caracteres) de toda a documentação da ElevenLabs, bem como alguns URLs relevantes.

Também estamos adicionando esclarecimentos e FAQs como parte da base de conhecimento.

Ferramentas

Temos três ferramentas configuradas:

  • redirectToExternalURL: redireciona para contato de vendas ou para o discord.
  • redirectToEmailSupport: abre um email para team@elevenlabs.io
  • redirectToDocs: esta ferramenta está configurada para redirecionar o chamador para páginas relevantes dentro de nossa documentação.

Avaliação Integrada

Nossa ferramenta de avaliação envolve um LLM revisando a transcrição final e avaliando a conversa com base em critérios definidos.

Critérios de Avaliação (sucesso / falha / desconhecido)

  • hallucination_kb: este critério verificará a transcrição final e verificará se as respostas dadas pelo LLM sobre os produtos ElevenLabs aderem às informações na base de conhecimento ou vão além dela.
  • interaction: avalia se a conversa foi além de um turno de conversa. Uma maneira rápida de marcar se as conversas foram iniciadas, mas nunca engajadas.
  • solved_user_inquiry: definido como sucesso quando o agente respondeu às perguntas do usuário com informações relevantes ou foi capaz de redirecionar para a página/canal de suporte relevante.
  • positive_interaction: avalia se a conversa ocorreu sem reações negativas do chamador.

Coleta de Dados:

  • Issue_type: categorizar a conversa como bug, problema de suporte, fr ou outro
  • Categoria do produto: extrair o produto relevante (TTS, ConvAI, etc)
  • AllQuestions: extrair todas as perguntas feitas pelo chamador
  • Unsolved_question: extrair perguntas não respondidas pelo LLM com informações relevantes
  • Redirects: extrair os caminhos de redirecionamento acionados pelo agente e a reação do chamador

Resumo

Nosso agente de documentação provou ser eficaz para ajudar os usuários a navegar por perguntas comuns de produtos e suporte, e é um copiloto envolvente para usuários que navegam em nossa documentação. Conseguimos iterar e melhorar consistentemente nosso agente por meio de monitoramento contínuo automatizado e manual. Reconhecemos que nem todos os tipos de consultas ou perguntas de suporte podem ser resolvidos por um LLM, especialmente para uma startup que constrói rapidamente e inova constantemente, e com usuários extremamente técnicos e criativos. Mas descobrimos que quanto mais conseguimos automatizar, mais tempo nossa equipe pode dedicar a enfrentar os problemas complicados e interessantes que surgem nas margens, à medida que nossa comunidade continua a expandir os limites do que é possível com Áudio IA.

Nosso agente é alimentado por ElevenLabs Conversational AI. Se você quiser reproduzir meus resultados, você pode criar uma conta gratuitamente e seguir meus passos. Se você ficar preso, pode falar com o agente que implantamos em nossa documentação ou entrar em contato comigo e minha equipe no Discord. Para casos de uso de alto volume (>100 chamadas por dia), entre em contato com nossa equipe de vendas para descontos por volume.

Explore artigos da equipe ElevenLabs

Pesquisa
Text on a gray gradient background introducing IIFlash v2.5, highlighting 75ms model latency and support for 32 languages.

Conheça o Flash

Você nunca experimentou um TTS tão rápido e natural

ElevenLabs

Crie com o áudio IA da mais alta qualidade

Construindo um Agente de Voz eficaz para nossa própria documentação | ElevenLabs