Referencia Técnica Business & Enterprise

Proveedores BYOK Soportados

Azure Speech, Google Cloud, ElevenLabs y Deepgram. Usa el que mejor se adapte a tus necesidades.

goMeetalk soporta los siguientes proveedores de voz para BYOK. La disponibilidad de proveedores depende de tu plan. Puedes configurar uno o varios segun tus necesidades de STT (Speech-to-Text) y TTS (Text-to-Speech).

Proveedores BYOK por plan
  • Pro: ElevenLabs
  • Business: Azure, Google, ElevenLabs, Deepgram
  • Enterprise: Azure, Google, ElevenLabs, Deepgram + proveedores custom

Esta referencia cubre el set completo de proveedores disponibles en Business/Enterprise. Para Pro, consulta la guia BYOK Pro.

¿Qué es STT y TTS?

STT (Speech-to-Text): Convierte tu voz en texto (transcripción).
TTS (Text-to-Speech): Convierte el texto traducido en voz para que otros lo escuchen.

Azure Speech Services

STT TTS

STT (Speech-to-Text) + TTS (Text-to-Speech). Requiere región.

💰 ~$1.00/hora transcripcion (aprox., consulta pricing oficial)
🔊 ~$4.00/1M caracteres TTS (aprox., consulta pricing oficial)
🌍 Regiones recomendadas: westeurope, eastus

Google Cloud Speech

STT TTS

STT + TTS. Usa credenciales JSON (Service Account).

💰 ~$1.44/hora transcripcion (aprox., consulta pricing oficial)
🔊 ~$4.00/1M caracteres TTS (aprox., consulta pricing oficial)
🔑 Autenticación vía JSON key file

ElevenLabs

TTS

Solo TTS. Voces ultra-realistas con clonación de voz.

💰 Starter: desde $5/mes (consulta pricing oficial)
💰 Creator: consulta pricing oficial
💰 Pro: consulta pricing oficial

Deepgram

STT

Solo STT. Excelente para transcripción en tiempo real con baja latencia.

💰 ~$0.85/hora transcripcion (aprox., consulta pricing oficial)
Optimizado para streaming en tiempo real
🔑 API key simple

Comparativa de proveedores

Proveedor STT TTS Costo aproximado Mejor para
Azure Speech ~$1.00/hora STT Empresas con infraestructura Azure
Google Cloud ~$1.44/hora STT Empresas con infraestructura GCP
ElevenLabs Desde $5/mes Voces premium ultra-realistas
Deepgram ~$0.85/hora STT Baja latencia, tiempo real

¿Cuál elegir?

Puedes combinar proveedores

Por ejemplo: usa Deepgram para STT (menor latencia y costo) y ElevenLabs para TTS (mejor calidad de voz). Puedes combinar proveedores si tu plan lo permite y tienes claves BYOK validas para cada uno.

¿Listo para configurar?

Consulta nuestra guía paso a paso para configurar tus claves API.

Configurar BYOK

Artículos relacionados