Presentamos ElevenLabs Conversational AI 2.0

Conversational AI 2.0 se lanza con funciones avanzadas y preparación para empresas.

Conversational AI across different industries

Presentamos Conversational AI 2.0, una evolución significativa de nuestra plataforma diseñada para permitir la creación de los agentes de voz más sofisticados, capaces y confiables del mundo. Basándonos en la base establecida hace solo cinco meses, esta versión introduce mejoras significativas y preparación empresarial integral, marcando una nueva era de comunicación y comprensión.

Área de Funcionalidad Conversational AI v1 Conversational AI v2
Flujo de Interacción API Conversacional Básica Modelo de Turnos de Última Generación
Acceso al Conocimiento N/A RAG Integrado (Baja Latencia, Alta Privacidad)
Multilingüe Cambio Manual Detección Automática de Idioma Integrada
Personajes Una Voz por Agente Cambio de Personaje Múltiple dentro de un Solo Agente
Preparación Empresarial Seguridad Estándar Cumplimiento HIPAA, Residencia en la UE, Seguridad y Fiabilidad Mejoradas
Modalidad Solo voz Solo voz, solo texto, y voz + texto
Soporte de Telefonía Solo entrada Twilio Soporte completo de entrada + salida, con programación de llamadas en lote e integración completa de SIP trunking

Construyendo interacciones más humanas

En el corazón de una comunicación efectiva se encuentra el flujo natural de interacción. Conversational AI 2.0 introduce modelos personalizados diseñados específicamente para hacer que las interacciones con IA sean más fluidas e intuitivas.

  • Turnos naturales para entender el flujo de la conversación. Los sistemas de voz tradicionales a menudo tienen dificultades con el ritmo del diálogo humano, lo que lleva a pausas incómodas o interrupciones no naturales. Conversational AI 2.0 incorpora un modelo de turnos de última generación diseñado para superar esto. Este modelo avanzado analiza las señales conversacionales en tiempo real, como “eh” “ah”, permitiendo al agente entender cuándo interrumpir o cuándo esperar. El resultado es un diálogo fluido y natural, como se demuestra en escenarios como interacciones de servicio al cliente donde un agente maneja sin problemas las pausas mientras un usuario busca información ("Oh, déjame comprobar. Eh...") antes de proporcionar una respuesta rápida. Esta capacidad mejora significativamente la experiencia del usuario, aumenta la eficiencia en la realización de tareas y hace que las interacciones se sientan más genuinamente conversacionales.
  • Comunicación multilingüe con detección de idioma integrada. Las empresas necesitan comunicarse a través de barreras lingüísticas. Conversational AI 2.0 integra la detección automática de idiomas directamente en el agente. Esto permite que la IA identifique el idioma que habla el usuario y responda adecuadamente dentro de la misma interacción, permitiendo "discusiones multilingües sin interrupciones" sin necesidad de configuración manual o prompts del usuario. Esta función es invaluable para empresas globales que buscan ofrecer un servicio consistente y de alta calidad a bases de clientes diversas, abriendo puertas a mercados más amplios y experiencias de usuario más inclusivas.

Conocimiento y creatividad desatados

Más allá de la fluidez conversacional, la inteligencia y la adaptabilidad son clave. Conversational AI 2.0 empodera a los agentes con un acceso al conocimiento sin precedentes y una flexibilidad creativa.

  • RAG integrado: agentes informados, mínima latencia, máxima privacidad. Retrieval-Augmented Generation (RAG) permite a los modelos de IA acceder e incorporar información de fuentes de conocimiento externas en sus respuestas. ElevenLabs ha integrado esta capacidad de manera única directamente en la arquitectura del agente de voz, permitiendo la recuperación desde tu base de conocimiento específica. Crucialmente, esto se logra con mínima latencia y máxima privacidad. Esto desbloquea aplicaciones empresariales poderosas, como asistentes médicos que recuperan directrices de tratamiento específicas al instante, o agentes de soporte que acceden a la información más reciente del producto desde la documentación interna.

Optimización de operaciones

  • Multimodalidad Diseñar tus agentes para que coincidan exactamente con el comportamiento que necesitas puede ser un trabajo desafiante. Hacerlo dos veces, una para agentes de texto y otra para agentes de voz, es aún más difícil. ElevenLabs Conversational AI ahora admite multimodalidad, para que puedas crear agentes que puedan comunicarse por texto, voz o ambos al mismo tiempo. Crucialmente, esto significa que tu agente solo necesita definirse una vez, reduciendo la carga en tu equipo de ingeniería.
  • Batch calls: Manual outbound calling presents operational limitations for organizations seeking to reach large audiences efficiently. ElevenLabs has developed Batch Calling for our Conversational AI platform to address these challenges, enabling users to automate and scale their outbound voice communications. Batch Calling allows the initiation of multiple outbound calls simultaneously using your Conversational AI agents, perfect for use cases such as sending alerts, conducting surveys, or delivering personalized messages to extensive contact lists with increased speed and consistency. [link to batch calling post]

Built for the enterprise: trust, security, and scalability

Diseñado para la empresa: confianza, seguridad y escalabilidad

  • Full HIPAA Compliance: Essential for healthcare applications, ensuring patient data privacy and regulatory adherence, directly supporting use cases like the medical RAG example.
  • Enterprise-Grade Security: Implementing comprehensive security measures to protect data and ensure system integrity.
  • Third-Party Integrations: Designed for flexibility, allowing seamless connection with existing enterprise systems and workflows.
  • Optional EU Data Residency: Addressing data sovereignty requirements for organizations operating in or serving the European Union.
  • Industry-Leading Reliability: Engineered for high availability and consistent performance, ensuring agents are dependable for critical business functions.

These features demonstrate a commitment to providing a platform that enterprises can trust for mission-critical deployments.

Estas características demuestran un compromiso con proporcionar una plataforma en la que las empresas puedan confiar para implementaciones críticas.

Conversational AI 2.0 es sustancialmente mejor que 1.0

El lanzamiento de Conversational AI 2.0 llega solo cuatro meses después de la versión inicial, destacando el compromiso de ElevenLabs con la innovación rápida. Mientras que la V1 estableció una base para una voz conversacional de alta calidad, la V2 representa un avance monumental en múltiples dimensiones:

Este ciclo de desarrollo rápido subraya nuestra dedicación a empujar los límites de lo que es posible con la voz IA y a ofrecer valor a nuestros usuarios rápidamente.

El futuro es ahora: empieza con Conversational AI 2.0

ElevenLabs Conversational AI 2.0 proporciona las herramientas para crear agentes de voz verdaderamente inteligentes, naturales y confiables. Desde mejorar el servicio al cliente hasta habilitar nuevas formas de contenido interactivo y agilizar el acceso al conocimiento empresarial, las posibilidades son vastas.documentation, visit our developer portal, or contact our sales team to discover how Conversational AI 2.0 can transform your business.

Descubre artículos del equipo de ElevenLabs

Producto
Multimodal

Presentamos la IA Conversacional Multimodal

Nuestros agentes de IA ahora pueden procesar simultáneamente palabras habladas y entradas de texto, lo que lleva a interacciones más naturales, eficientes y resilientes.

Desarrollador
Abstract

Pruebas de Agentes de Conversación IA

Descubre cómo probar y mejorar agentes de conversación IA de manera efectiva usando criterios de evaluación robustos y simulaciones de conversación.

ElevenLabs

Crea con audio con IA de la más alta calidad

Empieza gratis

¿Ya tienes una cuenta? Inicia sesión