¿Qué es Conformer?
Conformer-2 es el último modelo de reconocimiento de voz de AssemblyAI, diseñado para ofrecer una precisión superior en la transcripción de audio, incluso en condiciones ruidosas. Con un entrenamiento basado en 1.1 millones de horas de datos de audio en inglés, este modelo mejora significativamente la exactitud en la transcripción de nombres propios, datos alfanuméricos y situaciones con ruido de fondo.
¿Cuáles son las características de Conformer?
- Mejora del 31.7% en la transcripción alfanumérica: Ideal para aplicaciones que requieren precisión en números y códigos.
- Reducción del 6.8% en la tasa de error de nombres propios: Perfecto para transcribir nombres y direcciones con mayor exactitud.
- 12% más robusto frente al ruido: Funciona mejor en entornos con sonidos de fondo.
- Latencia reducida hasta un 53.7%: Obtén resultados más rápidos que nunca.
¿Cuáles son los casos de uso de Conformer?
- Centros de llamadas: Transcribe conversaciones con mayor precisión, incluso en entornos ruidosos.
- Podcasts y webinars: Genera transcripciones más legibles y precisas.
- Aplicaciones de IA generativa: Mejora la calidad de los datos de entrada para modelos de lenguaje avanzados.
¿Cómo usar Conformer?
- Accede a Conformer-2 a través de la API de AssemblyAI.
- Sube un archivo de audio o ingresa un enlace de YouTube en el Playground para obtener una transcripción en minutos.
- Utiliza el parámetro speech_threshold para controlar el procesamiento de archivos con poco contenido de voz.










