Avatar
Jan Demel
Redaktor
Avatar
Jan Demel:

Ahoj všichni. Před nedávnem jsem dostal nápad, že bych si udělal takového menšího Jarvise z filmu Iron Man. Nechci, aby uměl nějaké složitější příkazy typu přidávání úloh do kalendáře apod. Třeba jenom, aby byl schopný ráno říct, kolik je hodin apod. narazil jsem ale hned ze začátku. Lokalizaci bych chtěl v češtině a když jsem hledal nějaký STT engine, který by naši ve světě velice nevýraznou češtinu podporoval, neuspěl jsem.

Napadá někoho nějaké řešení, jak by se taková věc dala uskutečnit? Mě napadlo jenom překonvertovat si nějaké klíčové slovo (třeba "džarvisi") do pole bytů a potom nějak vzorkovat vstup z mikrofonu a hledat to tam.

Odpovědět 5.10.2015 23:57
To co se zdá být nemožné, je vždy možné.
Avatar
Lako
Člen
Avatar
Odpovídá na Jan Demel
Lako:

V angličtině to budeš mít mnohem jednodušší, knihovny jsou na .netu defacto hotové..
Nicméně chápu, že to chceš dělat v češtině.
Při rozpoznávání řeči se rozpoznávají jednotlivé hlásky dle jejich délky a formantů, což jsou frekvence zastoupené v nich..(hodně jednoduše řečeno)..
Určitě bych to nedělal v c#, jako výslednou aplikaci ano, ale začátek- tedy na to prototypování bych vřele doporučil matlab.
Jinak je to běh na hodně dlouhou trať, jestli chceš aby to fungovalo pořádně. Jestli ti bude stačit jen pár příkazů, tak si zřejmě vystačíš i s jednoduchým porovnáváním toho signálu oproti nahrávkám.

Nebo si počkej na siri/google now/cortanu, dřív nebo později si nás na tý mapě najdou.

 
Nahoru Odpovědět  +1 6.10.2015 0:37
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 2 zpráv z 2.