Presentamos Eleven v3 Alpha

Prueba v3

El estado de la IA conversacional en el soporte

La IA conversacional puede hacer que la prestación de asistencia sea más económica y escalable

Over-ear headphones with sound wave graphics on a dark blue background.

Stripe es sinónimo de gran soporte, y a menudo va más allá para sorprender y deleitar. Sin embargo, un gran apoyo va más allá de las notas escritas a mano y los tótems impresos en 3D que vemos en Twitter. Más de una década de ingeniería humana y de software ha permitido a Stripe crear una oferta de servicio al cliente que apoya a millones de empresas al año. Me uní a Stripe en 2015, cuando la empresa acababa de dar propinas a 200 personas y el equipo de soporte cabía en una mesa de conferencias.

Fui una de las primeras contrataciones en Dublín, uno de los primeros puestos de avanzada en la cobertura de soporte global de Stripe. Durante mis cinco años allí, Stripe reorganizó el equipo de soporte en especializaciones, introdujo proveedores externos como soporte de nivel 1, expandió canales, agregó idiomas y, finalmente, planes de soporte pagos. Después de haber ayudado a diseñar y probar estos programas de soporte en evolución, vi de primera mano las complejidades de ampliar el servicio al cliente, complejidades que la IA conversacional podría haber simplificado.

IA conversacional
Diagrama de IA conversacional

La IA conversacional tiene tres elementos. Estos tres elementos funcionan juntos a la perfección: Speech-to-Text captura la intención del usuario, los modelos de lenguaje interpretan y generan respuestas inteligentes, y Text-to-Speech transforma esas respuestas en una conversación natural.

  • Conversión de voz a texto: Los oídos de IA convierten el lenguaje natural hablado del usuario en texto, con gran precisión.
  • Modelos de lenguaje: El cerebro de IA procesa este texto y comprende el contexto para generar respuestas inteligentes.
  • Texto a voz: La voz transforma las respuestas de texto en un habla que suena natural.
  • Turnos de conversación: un servicio dedicado monitorea las interrupciones y garantiza que la conversación sea natural y se sienta humana.

Cuando me uní a Stripe, mi trabajo consistía en asimilar la mayor cantidad posible del producto. Como parte de mi formación, seguiría de cerca a agentes más experimentados y aprendería de una letanía de interacciones de soporte anteriores, un enfoque similar a cómo aprendería un agente de IA.

La IA es excelente en el reconocimiento de patrones, y gran parte del soporte es un ejercicio de reconocimiento de patrones. Comienza con un usuario que explica su problema. El agente de soporte procesa esa información, intenta compararla con su conocimiento existente y presenta una respuesta al usuario. Sin embargo, el soporte es más que simplemente recitar una base de conocimientos; un excelente servicio al cliente requiere empatía, creatividad y trabajo en conjunto con el usuario para resolver su problema. Lamentablemente, la mayoría de las interacciones de soporte resultan deficientes.

El status quo del soporte

El soporte es un punto de contacto importante, pero a menudo es doloroso. Piense en la última vez que tuvo que llamar a una aerolínea. Estás en espera durante horas y, cuando finalmente logras comunicarte con alguien, te dicen que tu problema está relacionado con otro departamento y el ciclo de Sísifo continúa.

El dolor no está sólo del lado del cliente. Ofrecer una excelente experiencia de soporte es difícil, y aún más difícil a gran escala. En nuestro mundo de bits centrado en el software, el soporte está limitado en gran medida por los átomos. Imagine que recibe una gran afluencia de clientes de la noche a la mañana: puede simplemente poner en marcha una instancia de AWS para mantener su sitio en funcionamiento; no puede simplemente accionar un interruptor y activar el soporte.

Se necesita tiempo y dinero para ampliar una función de soporte. En América del Norte, encontrar, capacitar e incorporar a un agente de soporte cuesta alrededor de USD 12 000. Incluyendo ese desembolso inicial, el costo promedio de un agente de soporte es de aproximadamente $30 a $40 por hora. Algunas empresas optan por subcontratar a sus agentes de soporte, con una tarifa por hora que oscila entre $8 y $30 por hora. Parece atractivo a primera vista, pero ese precio bajo conlleva una falta de control sobre la responsabilidad, los procesos y la calidad del soporte.

¿Pero qué pasaría si pudieras generar soporte en minutos y escalarlo infinitamente? ¿Qué pasaría si pudieras contar con soporte de alta calidad a bajo costo? Esa es la promesa de Conversational AIY después de haber pasado años trabajando en soporte, creo que es un cambio total en las reglas del juego.

Alexis es un ejemplo de un agente de IA de ElevenLabs. Fue construido como un agente de soporte. Dentro de la documentación de ElevenLabs y actualmente atiende más de cien llamadas al día.

Imagínese que Alexis fuera humano. Para empezar, no creo que muchos agentes de soporte humano puedan manejar 100 llamadas al día. Si tuviera un agente muy eficiente y llamadas directas, podría hacer alrededor de 60, y probablemente cerca de 40 para un agente menos calificado o con consultas más complejas. Entonces necesitarías contratar al menos dos agentes y probablemente pagar algunas horas extras.

Si los agentes estuvieran radicados en América del Norte, el costo para ellos de manejar 100 llamadas sería de al menos $700, aproximadamente $1719 en promedio, y podría llegar hasta $4094. Eso es mucho, por lo que podrías decidir subcontratarlo. Eso sería entre $128 y $480, con un promedio de $288, mucho más barato a primera vista, pero hay costos ocultos en la incorporación y supervisión de estas empresas de subcontratación, así como riesgos de marca y reputación si no están a la altura de sus estándares.

Tabla de costos de soporte ancho: 100 colapso-frontera: colapso; margen: 20 píxeles 0; tamaño de fuente: 16 píxeles; alinear texto: izquierda; $ tabla cabeza { color de fondo: #f2f2f2; $ tabla cabeza de toro { relleno: 10 píxeles; borde inferior: 2px sólido #ddd; $ tabla tbody tr:nth-child(par) { color de fondo: #f9f9f9; $ tabla tbody tr:nth-child(impar) { color de fondo: #ffffff; $ tabla tbody td { relleno: 10 píxeles; borde inferior: 1px sólido #ddd; $ pie td { estilo de fuente: cursiva; alinear texto: izquierda; relleno: 10 píxeles; color: #555; color de fondo: #f2f2f2; borde superior: 2px sólido #ddd; $ 1,40 3.44 8.19 0,256 0,576 0,96 0,036
Método Mín. Promedio. Máximo.
Humano (interno)
Humano (subcontratado)
IA 0,026 0,031
Fuente: thinkhdi.com

El costo de ejecutar un agente de soporte de IA puede ser tan bajo como $0,015 por minuto para el componente de audio. El LLM puede costar menos de un centavo o un par de centavos por minuto, dependiendo del modelo elegido y del tamaño de su base de conocimientos. Entonces, eso sería alrededor de $13-18 por cien llamadas. Eso es 110 veces más barato que el agente interno promedio y 18 veces más barato que el agente subcontratado promedio. Como experiencia de apoyo objetivo, creo que Alexis es bastante genial. Por ese precio, es increíble.

La IA conversacional en acción

En el mundo en gran medida analógico de la cadena de suministro, Traba es un puente tecnológico para el talento, ayudando a las empresas industriales a reclutar y gestionar a sus trabajadores. Si bien Traba ofrece aplicaciones y paneles de control, la comunicación telefónica sigue siendo un conector fundamental para una fuerza laboral acostumbrada a las planillas de horas en papel y a las bolsas de trabajo con corcho. 

Traba analizó en qué llamadas telefónicas pasaba más tiempo su equipo de operaciones y encontró dos áreas dominantes: atender consultas de soporte o ejecutar listas de verificación de programación. Para el CTO Akshay Buddiga, la automatización era la respuesta obvia, pero el tiempo también es importante. “Cuando identificamos un proceso que queremos hacer más eficiente, preferimos incorporar la automatización desde el principio en lugar de intentar adaptar las soluciones más adelante”.

Traba está totalmente centrado en la economía unitaria y en mantenerse a la vanguardia de la innovación tecnológica, por lo que trasladar estas llamadas a la IA conversacional resultó atractivo por múltiples razones. Teniendo en cuenta la velocidad y el costo, el equipo comenzó a buscar soluciones. Pero la experiencia del usuario también fue clave. Como señaló el ingeniero de software Joseph Besgen: “Queríamos que sonara como una conversación, no sólo como escuchar una grabación”. La demostración de ElevenLabs sonaba tan real que, durante la prueba, el padre de un empleado de Traba no podía distinguir si se trataba de IA o de alguien del equipo de su hijo. 

Si bien existe una complejidad inherente a la programación de miles de trabajadores de la industria ligera, no debería ser tan difícil programar una (1) cita con el médico. ¿Pero has intentado llamar a tu médico últimamente? Es frustrante para los pacientes y un uso ineficiente del tiempo del personal sanitario. En asociación con ElevenLabs, de EliseAI Los asistentes están llenando el vacío en la administración de la atención médica, manejando todo, desde la programación de citas hasta la facturación. Un hospital ahora tiene el 86% de sus llamadas manejadas enteramente por agentes de IA. Esto supone no sólo una reducción del 66% en el coste por llamada, sino también ganancias de eficiencia para el personal administrativo. EliseAI también ha aumentado el acceso a la atención médica para las comunidades que no hablan inglés. 

El futuro

Graph showing state of Conversational AI across industry sectors

Surgen algunas tendencias interesantes cuando consideramos el crecimiento de la IA conversacional por sector. EdTech fue la primera industria que adoptó la IA conversacional, ya que las empresas finalmente pudieron brindar tutoría personalizada y aprendizaje de idiomas a un precio asequible. Las aplicaciones de soporte al cliente se sumaron rápidamente, ya que las interacciones de soporte son particularmente adecuadas porque son ejercicios de reconocimiento de patrones: la respuesta existe en una base de conocimiento y el agente de IA trabaja para hacerla coincidir con la pregunta del usuario. También observamos un aumento en las aplicaciones verticalizadas de extremo a extremo, particularmente en sectores como la logística y la atención médica: Traba y EliseAI, por ejemplo. Nuevamente, estas son áreas que son repetitivas y predecibles, por lo que un agente de IA puede manejarlas fácilmente.

Conversational AI aporta apoyo del ámbito atómico al mundo de los bits. Ahora, el soporte puede ser una mejor experiencia para las empresas y sus clientes. Al igual que su proveedor de nube, su equipo de soporte de IA puede escalar hacia arriba o hacia abajo. Sus clientes nunca tendrán que esperar en espera y usted se ahorrará el dolor de cabeza operativo de tener que activar centros de soporte en todo el mundo.

Durante el último año, los agentes de voz han sido buenos en la conversación y la recuperación de conocimiento, pero creo que eso es solo el comienzo. En 2025, creo Agentes de voz de IA será el protocolo estándar para la programación de reuniones entrantes y problemas de soporte de tipo "especialista en productos". Si bien pueden limitarse a llamadas de recuperación de conocimiento, esto reducirá considerablemente el volumen de soporte y liberará a los equipos humanos para realizar trabajo de mayor valor.

En 2026, habremos pasado de recuperar conocimientos a realizar acciones. El agente de voz de IA estándar realizará llamadas API y se conectará con aplicaciones de terceros. Realizarán rutinariamente acciones como concertar reuniones y emitir reembolsos.

En 2027, veo que los agentes de voz de IA progresarán desde el soporte hasta el éxito del cliente. Creo que cosas como transacciones de venta completas serán administradas por un agente de IA, posiblemente tanto del lado del comprador como del vendedor. Para muchos, esta parece la última frontera, pero creo que es sólo el comienzo. Las tareas profundamente contextuales y creativas, que alguna vez creímos que eran exclusivamente humanas, se convertirán cada vez más en el dominio de la IA.

El soporte pasará de ser un centro de costos: primero neutralizando gastos, a eventualmente convirtiéndose en un centro de ganancias para el negocio. Los agentes de voz de IA se comunicarán de forma proactiva con los clientes, reduciendo la pérdida de clientes y aumentando el valor de vida del cliente. La IA conversacional proporciona muchos de los beneficios del soporte humano, pero también viene con una memoria perfecta, decenas de idiomas y está operativa las 24 horas del día, los 7 días de la semana. El futuro está llegando y, en muchos sentidos, ya está aquí. Imagínese recibir apoyo instantáneo, empático y efectivo, en todo momento. Pronto casi querrás llamar a una aerolínea, sólo por diversión.

Explora más

ElevenLabs

Crea con audio con IA de la más alta calidad

Empieza gratis

¿Ya tienes una cuenta? Inicia sesión