Presentamos Eleven v3 Alpha

Prueba v3

Comparación de Scribe con el modelo 4o Speech to Text de OpenAI

Un mes después de su lanzamiento, Scribe sigue demostrando que es el modelo de speech to text más avanzado de la industria.

Introducing iScribe v1, the world's most accurate speech-to-text model.

En solo un mes desde su lanzamiento, nuestro modelo de conversión de voz a texto Scribe ha atraído a miles de empresas gracias a su precisión líder en la industria. Desde subtítulos en medios hasta centros de llamadas y transcripciones médicas, Scribe se ha convertido rápidamente en el modelo preferido por los desarrolladores.

Rendimiento líder en la industria

Varios análisis de terceros confirmaron nuestros propios puntos de referencia de precisión, con Scribe superando a todos los modelos, incluidos los nuevos modelos de transcripción 4o de OpenAI. Por ejemplo, un punto de referencia de Artificial Analysis revela que Scribe supera tanto al 4o como al 4o mini en la Tasa de Error de Palabras, en promedio:

  • 4o transcribe comete un 16% más de errores que Scribe
  • 4o mini transcribe comete un 71% más de errores que Scribe

INSERTAR GRÁFICO

Scribe también supera o está a la par con los modelos de transcripción 4o y 4o mini en el propio punto de referencia de lanzamiento de OpenAI, para 11 de los 15 idiomas que probaron. Observando el japonés y el hindi, por ejemplo, Scribe es mejor que ambos modelos 4o de OpenAI por márgenes significativos, en los propios puntos de referencia de OpenAI:

  • En japonés, el modelo 4o de conversión de voz a texto de OpenAI comete un 55% más de errores que Scribe, y un 105% más de errores en su modelo 4o mini
    • El modelo de conversión de voz a texto 4o de OpenAI comete un 55% más de errores que Scribe
    • Su modelo 4o mini comete un 105% más de errores que Scribe
  • Hindi:
    • El modelo de conversión de voz a texto 4o de OpenAI comete un 18% más de errores que Scribe
    • Su modelo 4o mini comete un 37% más de errores que Scribe

Tomamos decisiones con Scribe para ser lo más útiles posible para los clientes, incluso si puede crear inconsistencias en los puntos de referencia de la industria. Por ejemplo:

  1. Scribe captura números como “uno” “dos” “tres”, lo cual es más útil para transcripciones, sin embargo, el punto de referencia FLEURS usa los números reales “1”, “2”, “3”, creando así errores
  2. Scribe es capaz de detectar palabras como “eh” “ah” “oye”, otra característica útil para que los clientes obtengan más contexto, pero estas palabras no forman parte de los puntos de referencia, creando nuevamente errores artificiales

Por eso es útil mirar los resultados finales al pensar en el rendimiento. Por ejemplo, en inglés, el modelo 4o Speech to Text de OpenAI tiene un rendimiento similar al de Scribe en los puntos de referencia. Sin embargo, comparar transcripciones en inglés realmente destaca las capacidades avanzadas de Scribe.tráiler de House of Dragons de HBO, Scribe no comete errores, capta efectos de sonido y los etiqueta correctamente, creando una transcripción inmersiva.

Periodistas comentan jugadas memorables de Messi

 / 

En este análisis de transcripción de una

Scribe de ElevenLabs (Tiempo tomado para crear la transcripción: 4.66s)Messi. ¡Messi! ¿Qué? ¿Estás de broma? Una obra de arte. Este hombre es absolutamente puro magia futbolística. Alba adentro. Es ¡Messi! ¡Oh, no! ¡No! De nuevo, el hombre medicina llega y clava su lanza ardiente.

¿Puedo preguntar al honorable caballero

OpenAI’s 4o (Tiempo tomado para crear la transcripción: 5.01s)¡Messi! ¿Estás de broma? ¡Este hombre es absolutamente loco, como la pura magia futbolística! Alba adentro, es ¡Messi! ¡De nuevo! El hombre medicina llega y

¿Puedo preguntar al honorable caballeroaudiencia parlamentaria del Reino UnidoLo siento

Accesibilidad con transcripción de tartamudeo

Con cada avance en IA, un grupo a menudo pasado por alto se beneficia enormemente: las personas que tartamudean. El tartamudeo, un trastorno del habla genético que afecta a ~1% de la población, plantea desafíos únicos para los sistemas de reconocimiento automático de voz (ASR). En un estudio con muestras de prueba donde el tartamudeo ocurrió en casi una de cada cuatro palabras, el rendimiento de Scribe es particularmente impresionante con un 98.7% de precisión en promedio. Esto nuevamente demuestra que Scribe lidera la industria y proporciona un modelo adaptado a todas las necesidades empresariales. (Tiempo tomado para crear la transcripción: 4.66s)Escuchen, escuchen. (murmullo de la multitud) Lo siento, debe ser algo relacionado con mi origen antípoda. ¿Podría repetir la pregunta, por favor, porque no la seguí?(risa de la multitud) Vaya. Oh, vaya. Muy popular hoy. Um, yo- yo estaba diciendo que- que un número de colegas parlamentarios que tienen discapacidades encuentran bastante difícil moverse por ciertas partes de la propiedad. Dado que estamos haciendo este trabajo de renovación, ¿qué se puede hacer para asegurar que aquellos con una discapacidad puedan moverse más libremente y el lugar sea accesible?Sr. Paul. (risa de la multitud) Lo siento mucho. ¿Podría hacerlo muy lentamente en inglés antípoda? Gracias. Solo da cualquier respuesta antigua. Yo- yo creo que la respuesta... Creo que la respuesta podría ser ayudada si puedes responder por escritocuando leas, Sr. Presidente. Bien, Chris Elmore. (ríe) Gracias, Sr. Vicepresidente, lo intentaré en el primer intento.(murmullo de la multitud) Oh, no. Eres galés. ¿Puedo- puedo- puedo- porque soy galés, así que Dios lo ayude.

Soluciones para empresas

El rendimiento de Scribe cobra vida con su conjunto de características adaptadas para resolver las necesidades de los clientes empresariales. (Tiempo tomado para crear la transcripción: 5.01s)Lo siento, debe ser algo relacionado con mi origen antípoda. ¿Podría repetir la pregunta, por favor, porque no la seguí?Bueno, muy popular hoy. Estoy viendo que un número de colegas parlamentarios que tienen discapacidades encuentran bastante difícil moverse por ciertas partes de la propiedad. Dado que estamos haciendo este trabajo de renovación, ¿qué se puede hacer para asegurar que aquellos con una discapacidad puedan moverse más libremente y el lugar sea accesible?Lo siento mucho. Por favor, ¿podría hacerlo muy lentamente en inglés antípoda?Creo que la respuesta podría ser ayudada si puedes responder por escritocuando lo leas. Gracias, Sr. Vicepresidente. Lo intentaré en el primer intento. Porque soy galés, así que Dios lo ayude.

El rendimiento de Scribe cobra vida con su conjunto de características adaptadas para resolver las necesidades de los clientes empresariales.

Empieza hoy

  • Prueba Scribe hoy
  • La diarización inteligente de altavoces te permite resumir reuniones, presentaciones de ventas o llamadas de atención al cliente para obtener los insights más precisos y accionables e incrementar la colaboración y formación entre tu equipo
  • contactar con nuestro equipo de ventas
  • Soporte para 99 idiomas, llega fácilmente al mundo con una sola integración
  • Todas estas características están disponibles en nuestra API, permitiendo a los desarrolladores construir sin compromisos
  • Una versión de transmisión en tiempo real de Scribe, junto con una de baja latencia, también están previstas para las próximas semanas. Esto consolidará a Scribe como el modelo de conversión de voz a texto más avanzado jamás creado, cubriendo todos tus casos de uso empresarial y dándote más opciones y flexibilidad entre velocidad, precio y precisión.

Soluciones para empresas

El rendimiento de Scribe cobra vida con su conjunto de características diseñadas para resolver las necesidades de los clientes empresariales.contactar a nuestro equipo de ventas, estaremos encantados de organizar una demostración y mostrarte cómo podemos ayudar a tu negocio.

Explora más

ElevenLabs

Crea con audio con IA de la más alta calidad

Empieza gratis

¿Ya tienes una cuenta? Inicia sesión