Multilingue por defeito, prontos para mais
PT, ES, IT, EN no lançamento. O modelo de voz, os prompts e os evals — o que muda entre idiomas.
O que «multilingue» significa de facto
Não é uma camada de tradução por cima de um worker em inglês. Cada idioma tem a sua voz, o seu modelo de prosódia, o seu eval set e a lista do que o worker pode dizer.
PT-PT e PT-BR são dois workers diferentes, não um. O mesmo para ES-ES e ES-MX. Os sotaques importam, os idiomas importam e os registos de formalidade importam.
Os evals são a parte difícil
Temos 1 200 turnos de conversa avaliados por idioma e voltamos a corrê-los em cada update de modelo. Um turno com 4,6 em inglês pode ficar em 3,1 em italiano por uma conjugação errada sob pressão.
Sem evals por idioma, enviaríamos regressões todas as semanas. Com eles, apanhamos as regressões antes do cliente.
O que vem a seguir
FR e DE estão em beta privado. NL e PL estão no roadmap para Q4. Cada novo idioma são cerca de seis semanas de trabalho, sobretudo em curadoria de evals e não em fine-tuning. O modelo é a parte barata agora.
