Changelog

Historique des versions et roadmap

Chaque version d'Instant Talk est construite à partir des retours de nos utilisateurs. Voici ce que nous avons livré et ce qui arrive.

Mai 2025 — v1.4 : 26 langues, ElevenLabs et pipeline optimisé

Extension de la couverture linguistique à 26 langues avec traduction vocale complète. Les 14 nouvelles langues — néerlandais, roumain, grec, suédois, hongrois, tchèque, bulgare, danois, finnois, slovaque, norvégien, arabe, thaï, vietnamien — sont supportées via une architecture de fallback intelligente : Cartesia sonic-2 pour les langues principales, ElevenLabs eleven_flash_v2_5 pour les autres avec le même niveau de latence.

Optimisation du pipeline de reconnexion Deepgram : la détection des erreurs 1011 (déconnexion serveur) déclenche désormais une reconnexion en 150ms flat au lieu d'un backoff exponentiel. Impact : continuité de session perçue lors des instabilités réseau passagères, sans interruption audible pour les participants.

Correction du doublement TTS : un guard sur les segments audio vides empêche l'envoi de requêtes de synthèse vocale pour des transcriptions sans contenu. Correction de la mort de l'AudioContext lors des reconnexions Agora via le passage en track.clone() — le contexte audio reste actif même pendant les cycles de reconnexion.

Avril 2025 — v1.3 : résumés IA et tableau de bord

Lancement des résumés IA post-meeting. À la fin de chaque réunion, Google Gemini 2.5 Flash génère un résumé structuré incluant les points clés, les décisions prises et les actions à mener avec les responsables identifiés. Le résumé est disponible dans le dashboard dans les 60 secondes suivant la fin de la réunion.

Nouveau tableau de bord avec historique complet des réunions sur 12 mois. Chaque réunion affiche : durée, nombre de participants, langues utilisées, lien vers la transcription complète et le résumé IA. Export de la transcription en PDF, Markdown ou texte brut depuis le dashboard.

Analytics de base disponibles pour tous les plans : temps de réunion cumulé par semaine/mois, langues les plus utilisées, nombre de réunions par période. Analytics avancés (participants, latence réseau, fuseaux horaires) disponibles pour les plans Business et Enterprise.

Mars 2025 — v1.2 : planification et invitations

Système de planification de réunions avec envoi d'invitations par email. Les participants reçoivent un lien d'invitation sécurisé, signé cryptographiquement et expirant à la fin de la réunion planifiée. L'accès invité ne requiert pas la création d'un compte.

Salle d'attente (waitroom) : l'hôte peut contrôler l'accès à la réunion et admettre les participants manuellement depuis le panneau de gestion. Les participants en attente voient un écran d'attente avec le nom de la réunion et une indication que l'hôte va les admettre prochainement.

Rappels automatiques par email : 15 minutes avant la réunion et 1 minute avant. Les rappels incluent le lien de réunion direct et les informations de connexion. Configuration des rappels désactivable depuis les paramètres de compte.

Février 2025 — v1.1 : sous-titres et qualité audio

Lancement des sous-titres synchronisés en temps réel. Les sous-titres sont affichés dans la langue cible de chaque participant au fur et à mesure de la reconnaissance vocale, sans attendre la fin de la phrase. Support RTL (droite à gauche) pour l'arabe et l'hébreu avec affichage inversé automatique.

Amélioration de la qualité audio : passage de Cartesia sonic-1 à sonic-2, modèle multilingue avec une meilleure naturalité vocale, notamment sur les langues asiatiques. Réduction de la latence moyenne de 520ms à 380ms sur les connexions européennes grâce à l'optimisation du routage Agora.

Gestion multi-participants améliorée : chaque participant entend les autres dans sa propre langue avec un mixage audio propre, sans artefacts lors des prises de parole simultanées. L'hôte dispose d'un contrôle individuel des micros et caméras depuis le panneau de gestion.

Janvier 2025 — v1.0 : lancement public

Lancement public d'Instant Talk Global. Pipeline de traduction vocale temps réel end-to-end : Deepgram nova-3 pour la transcription, DeepL pour la traduction, Cartesia sonic-2 pour la synthèse vocale, Agora RTC pour le transport audio. 12 langues à la disponibilité : français, anglais, espagnol, allemand, italien, portugais, japonais, coréen, chinois mandarin, russe, polonais, turc.

Infrastructure de base : authentification via Supabase, base de données PostgreSQL avec auto-création des tables au premier démarrage, hébergement Vercel, tokens Agora à TTL 60 minutes. Facturation via Stripe avec trois plans : Premium (24 €/mois), Business (99 €/mois), Enterprise (sur devis).

Lancement avec un SLA cible de 99,5 % et une politique de maintenance planifiée avec préavis 48 heures. Page de statut accessible sur /status. Support par email avec réponse garantie sous 48 heures ouvrées pour le plan Premium, sous 4 heures pour Business, sous 30 minutes pour Enterprise.

Roadmap — Juin à Décembre 2025

Q2 2025 — Intégrations : lancement des intégrations Google Calendar, Outlook/Microsoft 365 et Slack. Publication de l'API REST publique v1 avec documentation OpenAPI. SDK Node.js et Python disponibles sur npm et PyPI. Application Zapier dans la marketplace.

Q3 2025 — Enterprise : déploiement SSO via SAML 2.0 et Azure Active Directory. Intégrations CRM Salesforce et HubSpot. Analytics Enterprise avec exports CSV/JSON et API de reporting. Nouveau plan Enterprise avec SLA contractuels renforcés et account manager dédié.

Q4 2025 — Mobile & qualité : application mobile iOS et Android (Capacitor) avec support des notifications push pour les rappels de réunion. Amélioration de la qualité de transcription pour les accents régionaux et les vocabulaires techniques. Support de 5 nouvelles langues : swahili, ourdou, persan, catalan, ukrainien. Lancement d'un programme de partenaires pour les intégrateurs et revendeurs.