Salta al contenido

El estado de la IA conversacional en soporte

La IA conversacional puede hacer que ofrecer soporte sea más barato y escalable

Over-ear headphones with sound wave graphics on a dark blue background.

Stripe es sinónimo de buen soporte, a menudo yendo más allá para sorprender y agradar. Pero un gran soporte es mucho más que las notas escritas a mano y los tótems impresos en 3D que vemos en Twitter. Más de una década de trabajo humano y de ingeniería de software ha permitido a Stripe crear un servicio de atención al cliente que ayuda a millones de empresas cada año. Me uní a Stripe en 2015, cuando la empresa acababa de superar las 200 personas y el equipo de soporte cabía en una sola mesa de reuniones.

Fui uno de los primeros fichajes en Dublín, una de las primeras sedes de la cobertura global de soporte de Stripe. En mis cinco años allí, Stripe reorganizó el equipo de soporte en especializaciones, incorporó proveedores externos como soporte de primer nivel, amplió canales, añadió idiomas y, finalmente, planes de soporte de pago. Tras ayudar a diseñar y probar estos programas de soporte, vi de primera mano la complejidad de escalar la atención al cliente—una complejidad que la IA conversacional podría haber simplificado.

IA conversacional
Diagrama de IA conversacional

La IA conversacional tiene tres elementos que funcionan juntos de forma fluida: Voz a Texto capta la intención del usuario, los modelos de lenguaje interpretan y generan respuestas inteligentes, y Texto a Voz transforma esas respuestas en una conversación natural.

  • Voz a Texto: El “oído” de la IA convierte el lenguaje hablado del usuario en texto, con gran precisión.
  • Modelos de lenguaje: El “cerebro” de la IA procesa ese texto y entiende el contexto para generar respuestas inteligentes.
  • Texto a Voz: La voz transforma las respuestas en texto en un habla natural.
  • Turnos de palabra: Un servicio dedicado detecta interrupciones y asegura que la conversación sea natural y fluida.

Cuando entré en Stripe, mi trabajo era aprender todo lo posible sobre el producto. Como parte de la formación, acompañaba a agentes más experimentados y aprendía de muchas interacciones previas de soporte—un enfoque muy parecido a cómo aprende un agente de IA.

La IA es muy buena reconociendo patrones, y gran parte del soporte consiste en eso. Todo empieza con un usuario explicando su problema. El agente de soporte procesa esa información, intenta relacionarla con lo que ya sabe y responde al usuario. Pero el soporte no es solo recitar una base de conocimientos; un buen servicio requiere empatía, creatividad y colaborar con el usuario para resolver su problema. Por desgracia, la mayoría de las interacciones de soporte no cumplen con esto.

El estado actual del soporte

El soporte es un punto de contacto importante, pero suele ser frustrante. Piensa en la última vez que tuviste que llamar a una aerolínea. Horas esperando y—cuando por fin te atienden—te dicen que tu problema es de otro departamento, y el ciclo sin fin continúa.

El problema no es solo para el cliente. Ofrecer una buena experiencia de soporte es difícil, y aún más a gran escala. En nuestro mundo digital, el soporte sigue estando limitado por lo físico. Imagina que de repente tienes una avalancha de clientes: puedes lanzar una instancia de AWS para mantener tu web, pero no puedes simplemente pulsar un botón y activar el soporte.

Escalar un equipo de soporte requiere tiempo y dinero. En Norteamérica, encontrar, formar e incorporar a un agente de soporte cuesta unos 12.000 dólares. Sumando ese gasto inicial, el coste medio de un agente es de unos 30-40 dólares por hora. Algunas empresas optan por externalizar el soporte, con tarifas de 8 a 30 dólares la hora. Puede parecer atractivo, pero ese precio bajo implica menos control sobre la calidad, los procesos y la responsabilidad.

¿Y si pudieras activar el soporte en minutos y escalarlo sin límites? ¿Y si pudieras ofrecer soporte de calidad a bajo coste? Esa es la promesa de la IA conversacional, y tras años trabajando en soporte, creo que es un cambio radical.Conversational AIY después de haber pasado años trabajando en soporte, creo que es un cambio total en las reglas del juego.

Alexis es un ejemplo de agente IA de ElevenLabs. Se creó como agente de soporte dentro de la documentación de ElevenLabs y ahora gestiona más de cien llamadas al día.

Imagina que Alexis fuera humano. Para empezar, dudo que muchos agentes humanos pudieran gestionar 100 llamadas al día. Si tienes un agente muy eficiente y llamadas sencillas, podría hacer unas 60, y probablemente unas 40 si es menos experimentado o las consultas son más complejas. Así que tendrías que contratar al menos a dos agentes y seguramente pagar horas extra.

Si los agentes estuvieran en Norteamérica, el coste de gestionar 100 llamadas sería al menos 700 dólares, unos 1719 de media, y podría llegar a 4094. Es mucho, así que quizá decidas externalizar. Eso costaría entre 128 y 480 dólares, con una media de 288—mucho más barato, pero hay costes ocultos en la formación y supervisión de estas empresas, además del riesgo para tu marca si no cumplen tus estándares.

Método Mín. Media Máx.
Humano (interno) 1.40 3.44 8.19
Humano (externalizado) 0.256 0.576 0.96
IA 0.026 0.031 0.036
Fuente: thinkhdi.com

El coste de tener un agente de soporte IA puede ser tan bajo como 0,015 dólares por minuto para el audio. El LLM puede costar menos de un céntimo o unos pocos céntimos por minuto, según el modelo y el tamaño de tu base de conocimientos. Así, gestionar cien llamadas costaría unos 13-18 dólares. Eso es más de 110 veces más barato que un agente interno medio y 18 veces más barato que uno externalizado. Como experiencia objetiva de soporte, creo que Alexis es muy bueno. Y a ese precio, es increíble.

La IA conversacional en acción

En el mundo mayoritariamente analógico de la cadena de suministro, Traba es un puente tecnológico para el talento, ayudando a empresas industriales a reclutar y gestionar a sus trabajadores. Aunque Traba ofrece apps y paneles de control, la comunicación telefónica sigue siendo clave para una plantilla acostumbrada a partes de horas en papel y tablones de anuncios.

Traba analizó en qué llamadas telefónicas invertía más tiempo su equipo de operaciones y detectó dos áreas principales: responder consultas de soporte o repasar listas de comprobación de horarios. Para el CTO Akshay Buddiga, la automatización era la respuesta obvia, pero el momento también es importante. “Cuando identificamos un proceso que queremos hacer más eficiente, preferimos incorporar la automatización desde el principio en vez de intentar adaptarla después.”

Traba está muy centrada en la eficiencia y en adelantarse en innovación tecnológica, así que trasladar estas llamadas a IA conversacional tenía sentido por varias razones. Buscaban velocidad y ahorro, pero también era clave la experiencia del usuario. Como comentó el ingeniero Joseph Besgen: “Queríamos que sonara como una conversación, no como una grabación.” La demo de ElevenLabs sonaba tan real que, durante las pruebas, el padre de un empleado de Traba no supo distinguir si era IA o alguien del equipo de su hijo.

Aunque programar a miles de trabajadores industriales es complejo, no debería ser tan difícil pedir cita con un médico. Pero, ¿has intentado llamar a tu médico últimamente? Es frustrante para los pacientes y un uso ineficiente del tiempo del personal sanitario. En colaboración con ElevenLabs, los asistentes de EliseAI están cubriendo ese hueco en la administración sanitaria, gestionando desde citas hasta facturación. Un hospital ya tiene el 86% de sus llamadas gestionadas completamente por

El futuro

Graph showing state of Conversational AI across industry sectors

Al analizar el crecimiento de la IA conversacional por sectores, surgen tendencias interesantes. EdTech fue la primera industria en adoptar la IA conversacional, ya que por fin se podía ofrecer tutoría personalizada y aprendizaje de idiomas a precios asequibles. El soporte al cliente fue el siguiente, porque estas interacciones se basan en reconocer patrones: la respuesta está en una base de conocimientos y el agente IA la busca para responder al usuario. También vemos un aumento de aplicaciones verticales de principio a fin, sobre todo en logística y sanidad—como Traba y EliseAI. Son áreas repetitivas y predecibles, fáciles de gestionar por un agente IA.

IA conversacional aporta apoyo del ámbito atómico al mundo de los bits. Ahora, el soporte puede ser una mejor experiencia para las empresas y sus clientes. Al igual que su proveedor de nube, su equipo de soporte de IA puede escalar hacia arriba o hacia abajo. Sus clientes nunca tendrán que esperar en espera y usted se ahorrará el dolor de cabeza operativo de tener que activar centros de soporte en todo el mundo.

Durante el último año, los agentes de voz han sido buenos conversando y recuperando información, pero creo que esto es solo el principio. En 2025, creo que los agentes de voz IA serán el estándar para agendar reuniones entrantes y resolver dudas tipo “especialista de producto”. Aunque quizá solo gestionen llamadas de consulta, esto reducirá mucho el volumen de soporte y permitirá que los equipos humanos se centren en tareas de mayor valor.

En 2026, pasaremos de recuperar información a realizar acciones. El agente de voz IA estándar hará llamadas a la API y se conectará con apps de terceros. Harán tareas como reservar reuniones o tramitar devoluciones de forma habitual.

En 2027, veo a los agentes de voz IA evolucionando del soporte al éxito del cliente. Creo que incluso acuerdos de ventas completos serán gestionados por un agente IA, quizá en ambos lados de la negociación. Para muchos, esto parece el último paso, pero yo creo que es solo el principio. Tareas muy contextuales y creativas, que antes creíamos solo humanas, serán cada vez más terreno de la IA.

El soporte dejará de ser solo un gasto: primero se neutralizarán los costes y, con el tiempo, se convertirá en una fuente de ingresos para la empresa. Los agentes de voz IA contactarán proactivamente con clientes, reduciendo la rotación y aumentando el valor de cada cliente. La IA conversacional ofrece muchas ventajas del soporte humano, pero además tiene memoria perfecta, habla decenas de idiomas y funciona 24/7. El futuro ya está aquí. Imagina un soporte instantáneo, empático y eficaz—siempre. Pronto, casi te apetecerá llamar a una aerolínea solo por diversión.

Descubre artículos del equipo de ElevenLabs

Crea con el audio IA de la más alta calidad