Mozilla chce rozpoznávat hlas, pomoci má komunita
Mozilla by ráda ovládla lidskou řeč. Nejen pro vlastní projekty, výsledná data má v plánu sdílet. Sama ale nemá dostatek prostředků k tomu, aby dostatek dat získala, a proto spustila project Common Voice. Může do něj přispět úplně každý tím, že pouze do mikrofonu přečte napsaný text. Cílem je takto nasbírat 10 000 hodin záznamu.
Ještě v roce 2017 by Mozilla chtěla výsledná data vydat pod open source licencí, aby je mohl použít každý, kdo chce zpracovávat uživatelský hlas. Projekty, která tak činí již teď, totiž nemají příliš dobré vzorky a rozpoznávání je pak velmi obtížné, často je třeba frázi vyslovit několikrát, aby ji software rozpoznal. To může být obrovský problém například u open source alternativ Google Home a Amazon Alexy, kde je přesné rozpoznávání na první pokus velmi důležité.
Takto se Mozilla snaží vytvářet data pro otevřené STT enginy
Zapojit se můžete na voice.mozilla.org, pro čtení stačí mít funkční mikrofon a prohlížeč s podporou WebRTC, pro pouhý poslech a schvalování nahrávek ostatních bohatě postačí reproduktor. Pokud plánujete přidávat nahrávky, nezapomeňte si v profilu nastavit informace o vás, které pomáhájí správnému rozpoznání textu.
Zdroj: Mozilla