Nuevo

Voces y Text-to-Speech

Diferencias entre los motores de voz Native y Premium, y cuándo usar cada uno

Resumen rápido

Aspecto Native Premium
Motor WebSpeech (navegador) Azure / Google Cloud
Calidad de voz Variable Alta, consistente
Reconocimiento Bueno en Chrome Excelente en todos
Latencia Baja Muy baja
Disponibilidad Todos los planes Starter, Pro, Business, Enterprise
Coste Usa minutos nativos Usa minutos premium

Motor Native (WebSpeech)

El motor Native usa la tecnología de voz integrada en tu navegador (Web Speech API). No requiere conexión a servicios externos de IA.

Ventajas

Limitaciones

💻 Recomendación

Si usas Native, utiliza Chrome o Edge para la mejor experiencia.

Motores Premium (Azure / Google)

Los motores Premium usan servicios de IA en la nube (Azure Neural Speech, Google Cloud TTS) para reconocimiento y síntesis de voz de alta calidad.

Ventajas

Limitaciones

✨ Para reuniones importantes

Premium ofrece la mejor experiencia de traducción.

¿Cuándo usar cada uno?

Usa Native cuando...

  • Quieras ahorrar minutos premium
  • La conversación es informal o interna
  • Todos usan Chrome/Edge
  • Solo necesitas traducción español-inglés

Usa Premium cuando...

  • Necesitas máxima calidad (presentaciones, clientes)
  • Hay participantes con navegadores variados
  • Usas idiomas menos comunes
  • El ambiente tiene ruido de fondo
  • La claridad es crítica (legal, médico, técnico)

Cómo elegir el motor

El motor se selecciona automáticamente según tu plan y configuración:

Para cambiar el motor:

  1. Dentro de la sala, abre la configuración (icono de engranaje)
  2. Busca la opción "Motor de voz"
  3. Selecciona Native o Premium
  4. El cambio se aplica inmediatamente

BYOK: Trae tu propia API Key

Los planes Pro+ permiten configurar BYOK (Bring Your Own Key) para usar tus propias credenciales de proveedores externos.

Proveedores BYOK disponibles

Beneficios de BYOK

Ver guía: Configurar ElevenLabs con BYOK →

Cómo se consumen los minutos

Los minutos se consumen por la traducción, no por la duración de la llamada ni por hablar:

Acción Consume
Tú hablas (STT) No consume
Escuchas traducción con audio (TTS) Minutos del hablante (nativos o premium)
Subtítulos traducidos (sin audio) Minutos nativos o premium (según motor)
Subtítulos o audio original (sin traducción) No consume
Silencio / pausas No consume

💡 Medición

El consumo se mide en caracteres procesados, convertidos a minutos (aprox. 900 chars = 1 minuto).

Preguntas frecuentes

¿Puedo mezclar Native y Premium en la misma sala?

No directamente. El motor se configura a nivel de sala/usuario. Cada participante usa el motor según su plan y configuración.

¿El motor Native funciona sin internet?

El TTS (síntesis de voz) funciona offline en algunos navegadores. El STT (reconocimiento) y la traducción siempre requieren internet.

¿Qué motor usa ElevenLabs?

ElevenLabs es un motor premium separado, disponible solo con BYOK en planes Pro+. Ofrece las voces más naturales del mercado.

¿Ambos motores consumen minutos?

Sí. Native consume minutos nativos y Premium consume minutos premium. La diferencia es el coste: Premium usa servicios de IA externos (Azure, Google) con mayor coste por uso, mientras que Native tiene un coste menor al usar tecnología del navegador para el TTS.