Traduction vocale instantanée (< 400 ms)
Le pipeline de traduction d'Instant Talk fonctionne en cinq étapes enchaînées en temps réel. Votre voix est capturée et envoyée à Deepgram nova-3 qui la transcrit dans l'une des 26 langues supportées. Le texte transcrit est transmis à DeepL (pour les langues européennes) ou à Google Gemini 2.5 Flash (pour les langues supplémentaires) pour une traduction de haute précision. La traduction est ensuite envoyée à Cartesia (sonic-2) ou ElevenLabs (eleven_flash_v2_5) qui synthétise une voix naturelle dans la langue cible. Agora RTC livre enfin ce flux audio aux participants concernés.
L'ensemble de ce pipeline s'exécute en moins de 400 millisecondes dans des conditions réseau normales. La traduction commence pendant que vous parlez, pas après. Il n'y a aucun bouton à appuyer, aucune pause à marquer : la technologie détecte vos prises de parole automatiquement et lance la traduction en continu.
Cette latence est suffisamment courte pour que la conversation reste naturelle. Un participant francophone et un participant japonais peuvent s'interrompre, réagir, rebondir — comme dans n'importe quelle réunion, sans le décalage d'une traduction différée.