Diskuze: VikiTron - chytrý vyhledávač
V předchozím kvízu, Online test znalostí PHP, jsme si ověřili nabyté zkušenosti z kurzu.

Tvůrce

Zobrazeno 19 zpráv z 19.
//= Settings::TRACKING_CODE_B ?> //= Settings::TRACKING_CODE ?>
V předchozím kvízu, Online test znalostí PHP, jsme si ověřili nabyté zkušenosti z kurzu.
Myslím, že i když je 500000 záznamů hodně, tak je to jen kapka
v moři dat a bylo by lepší se specializovat na určitou oblast.
S menším záběrem bych si dovedl představit, že to přežije.
když sem dal hledat pí tak to nenašlo nic, teda jen ho to přepsalo
Myslím že se projekt daří
Zaměřil bych se nejdříve na doplnění česka a to bych vyšperkoval... A
pak až bych se pustil do zbytku světa
Ok, specializace je super nápad!
V současnosti mám 2 problémy, nad kterýmy si lámu hlavu a nevím co
dál:
Mám databáze navrhnuté poměrně chytře (přístupová doba na jakýkoli
záznam je asi 0.5 ms), takže vícenásobné hledání není až takový
výpočetní problém
Ahoj, je to supr u jmén jsem vyzkoušel asi pět a ani u jednoho jsem se
nedozvěďěl kdy slaví svátek Opravdu zvládne porovnat vesničku s 2140 (podle tronu jen 1982) s
prahou.
Matematickou
rovnici
3x + 3 = 9
mi to nevyřešilo, ale to asi nevadí, jelikož ani google ji nevyřešil, jen nabídl odkaz na diskuzi, kde se taková rovnice řeší: http://answers.yahoo.com/question/index?…
design titulní stránky se mi moc nelíbí, stránka s výsledky e pěkná,
ale:
http://validator.w3.org/check?…
a titulní stránka už je o trochu lepší, ale stejně: http://validator.w3.org/check?…
vypada to zajimave
mozna by bylo lepsi dat lidem moznost rozsirovat databazi
a pak by se cekalo na schvaleni
jinak databazi s 500 000 frazi jsi fakt delal jenom ty?
nebo treba jsi vyucival i jine databaze?
jinak by mozna nebylo lepsi udelat vetsi popis (nebo treba aspon wiki)
treba k minecraft tam je ze je to pocitacova hra
ale neni tam treba uveden autor hry, ze je sandbox atd.
jinak napad je velice originalni a pekny
Misaz:
Matematika tam není zatím vůbec, ale bude. Jen nevím kdy. Snad do měsíce,
ještě o tom budu psát. Validitu moc extra neřeším, důležité pro mě je
správné zobrazení ve všech Windowsových a Linuxových prohlížečích 3
verze zpět od nejnovější.
next-x:
Rozšíření databází určitě udělám společně s API zase na export dat.
Mám těch faktických dat hodně, akorát je to rozdělené do spousty
kategorií, které lidé moc nehledají. Obsáhnout všechno není jednoduché.
Databáze jsem netvořil sám, kdyby jsi četl první příspěvek, tak by jsi
věděl, že jsem spolupracoval s majiteli databází, kteří souhlasili s
volným šířením po internetu, takže můžu s daty pracovat jak jenom
chci.
Měl bych takovou poznámku k funkcionalitě. Zvažoval jsi již o vytvoření nějakého web-spideru, který by prohledával "knowledge" weby, a pomocí algoritmu by jsi z nich vytěhoval podstatné informace ? Třeba z wikipedie. Myslím, že ač je konkurence celkem velká (Wolfram Alpha, třeba), bylo by to jedině plus.
Ano, plánuji udělat robota, co bude procházet větší část internetových zdrojů a na základě toho sestavovat znalostní grafy. Zejména weby, kde se vyskytují články, zpravodajské servery, lepší blogy a tak dále...
Část dat ve vyhledávání pochází ze zaindexovaných stránek. Problém indexu je to, že to je celé velmi pomalé, protože server musí posílat spoustu HTTP požadavků a čekat na odpověďi.
Pokud tu aplikaci uděláš vícevláknovou, tak to vyhledávání pomalé být nemusí.
Pro to je u vyhledávačů potřebné celkem velké množství serverů (třeba seznam běží na 70+ serverech), taky je důležité škálování. Jinak se mi projekt opravdu líbí, až přidám do browseru bookmarky, určitě si do nich stránku přidám.
me se projekt jak jsem psal libi
ale bude nekdy existovat offline verze?
klidne treba 500 MB ale neco aby lide mohli prohlizet i bez netu
Chtěl jsi asi napsat robotických vyhledávacích klientů. Není to vždy nutné.
Offline verzi plánuji už celkem dlouho. Snažím se to udělat v HTML5. Popíšu ti, jak si to zhruba představuji, až bude offline verze povolená:
Otevřeš hlavní stránku webu v prohlížeči s podporou HTML5 a cachování. Někde na stránce klikneš na tlačítko "povolit offline prohlížení" a zobrazí se nabídka kategorií toho, co lze prohledávat. Vybereš si co chceš a povolíš začátek stahování. Stránku pak budeš moci opustit a mezitím se bude na pozadí prohlížeče stahovat offline verze rozhraní (to bude muset být celé v javascriptu). Když pak v offline režimu vyťukáš adresu http://vikitron.com, tak javascript detekuje stav, že jsi offline a začne zobrazovat rozhraní z cache. Dokonce bych tam mohl udělat i funkci, že budeš moci tvořit omezeně obsah a po připojení se to celé synchronizuje.
Mám to prakticky hotové, ale ještě jsem nedomyslel způsob, jak aktualizovat data. Musím ještě nějak přinutit prohlížeče, aby si stáhly novější verzi toho, co jim předám v nějakém strukturovaném seznamu... nebo ideálně předám updatovanou databázi a oni si to nějak zařadí.
Znáš http://www.wolframalpha.com/ ?
Tam můžeš zadat docela široké spektrum dotazů.
Není to něco podobného o co se snažíš?
Zobrazeno 19 zpráv z 19.