Multilingue par défaut, prêts pour plus
PT, ES, IT, EN au lancement. Le modèle vocal, les prompts et les evals — ce qui change entre les langues.
Ce que « multilingue » signifie vraiment
Ce n'est pas une couche de traduction sur un worker anglais. Chaque langue a sa voix, son modèle de prosodie, son jeu d'evals et sa liste de ce que le worker peut dire.
PT-PT et PT-BR sont deux workers distincts, pas un seul. Idem pour ES-ES et ES-MX. Les accents comptent, les idiomes comptent, les registres de formalité comptent.
Les evals sont la partie difficile
Nous avons 1 200 tours de conversation notés par langue et nous les relançons à chaque mise à jour de modèle. Un tour à 4,6 en anglais peut tomber à 3,1 en italien à cause d'une seule conjugaison ratée sous pression.
Sans evals par langue, nous livrerions des régressions chaque semaine. Avec eux, nous les attrapons avant le client.
La suite
FR et DE sont en bêta privée. NL et PL sont sur la roadmap Q4. Chaque nouvelle langue représente environ six semaines de travail, surtout en curation d'evals plutôt qu'en fine-tuning. Le modèle est la partie bon marché maintenant.
