Mehrsprachig als Standard, bereit für mehr
PT, ES, IT, EN zum Launch. Voice-Modell, Prompts und Evals — was sich zwischen Sprachen ändert.
Was "mehrsprachig" wirklich bedeutet
Es ist keine Übersetzungsschicht auf einem englischen Worker. Jede Sprache ist ihre eigene Stimme, ihr eigenes Prosody-Modell, ihr eigenes Eval-Set und ihre eigene Liste dessen, was der Worker sagen darf.
PT-PT und PT-BR sind zwei verschiedene Workers, nicht einer. Ebenso ES-ES und ES-MX. Akzente zählen, Idiome zählen, Formalitätsregister zählen.
Evals sind der schwere Teil
Wir haben 1.200 bewertete Gesprächsturns pro Sprache und führen sie bei jedem Modell-Update erneut aus. Ein Turn, der auf Englisch 4,6 scored, kann auf Italienisch 3,1 scoren — wegen einer einzigen Konjugation, die das Modell unter Druck falsch macht.
Ohne die sprachspezifischen Evals würden wir jede Woche Regressionen shippen. Mit ihnen fangen wir Regressionen, bevor der Kunde sie merkt.
Was als Nächstes kommt
FR und DE sind in privater Beta. NL und PL stehen für Q4 auf der Roadmap. Jede neue Sprache ist ungefähr sechs Wochen Arbeit — meist Eval-Curation statt Modell-Fine-Tuning. Das Modell ist jetzt der günstige Teil.
