🟢 Kategoria A — Wysoka jakość
Najlepiej wytrenowane języki z dużymi korpusami danych. Bardzo dobra dokładność, stabilne znaczniki czasu, poprawna interpunkcja.
Zachodnioeuropejskie
- en – English
- es – Español
- fr – Français
- de – Deutsch
- it – Italiano
- pt – Português
- nl – Nederlands
Środkowoeuropejskie
- pl – Polski
- cs – Čeština
- sk – Slovenčina
Wschodnioeuropejskie
- ru – Русский
- uk – Українська
Skandynawskie
- sv – Svenska
- no – Norsk
- da – Dansk
- fi – Suomi
Azjatyckie
- ja – 日本語
- ko – 한국어
- zh – 中文
- yue – 粵語 (Kantoński)
Inne
- tr – Türkçe
- ar – العربية
- he – עברית
🟡 Kategoria B — Średnia jakość
Dobre rozpoznawanie przy czystym audio i standardowym akcencie. Możliwe słabsze interpunkcje i sporadyczne błędy segmentacji.
Bałkańskie / Wschodnioeuropejskie
- bg – Български
- hr – Hrvatski
- sr – Српски
- sl – Slovenščina
- ro – Română
- hu – Magyar
Bałtyckie / Greckie
- el – Ελληνικά
- et – Eesti
- lt – Lietuvių
- lv – Latviešu
Indyjskie
- hi – हिन्दी
- bn – বাংলা
- ta – தமிழ்
- te – తెలుగు
- ml – മലയാളം
- mr – मराठी
Południowo-wschodnioazjatyckie
- vi – Tiếng Việt
- th – ไทย
- id – Bahasa Indonesia
- ms – Bahasa Melayu
Inne
- fa – فارسی
- ur – اردو
🟠 Kategoria C — Niższa jakość / Niszowe
Rozpoznawanie języka działa, transkrypcja powstanie, ale z większym współczynnikiem błędów (WER). Czasem fonetyczne „zgadywanie", słabsze znaczniki czasu. To nie są języki „nieobsługiwane" – tylko słabiej wytrenowane.
Europejskie niszowe
- br – Brezhoneg
- fo – Føroyskt
- la – Latina
- lb – Lëtzebuergesch
- oc – Occitan
- cy – Cymraeg
Afrykańskie
- af – Afrikaans
- sw – Kiswahili
- yo – Yorùbá
- sn – chiShona
- so – Soomaali
- ha – Hausa
- mg – Malagasy
- ln – Lingála
Azjatyckie niszowe
- bo – བོད་སྐད
- jw – Basa Jawa
- su – Basa Sunda
- haw – ʻŌlelo Hawaiʻi
- mi – Te Reo Māori
Inne
- sa – संस्कृतम्
- sd – سنڌي
- si – සිංහල
- ps – پښتو
- tk – Türkmen
- tt – Татар
⚠️ Ważne zastrzeżenie
Powyższy podział jest orientacyjny i oparty na praktycznych obserwacjach. Rzeczywista jakość transkrypcji zależy od wielu czynników:
- Jakość nagrania (szumy, muzyka w tle)
- Akcent i dialekt mówcy
- Szybkość mówienia
- Terminologia specjalistyczna
Zalecamy zawsze zweryfikować wygenerowane napisy przed ich publikacją.