Lekce 25 - PostgreSQL - Fulltextové vyhledávání - Fulltextový index
V předchozí lekci, PostgreSQL - Fulltextové vyhledávání, jsme si představili fulltextové vyhledávání v PostgreSQL databázích a podívali se na jeho výhody oproti klasickému hledání.
V dnešním PostgreSQL tutoriálu se opět podíváme na fulltextové vyhledávání. Naučíme se vytvářet vlastní konfigurace textového vyhledávání, čímž si zlepšíme možnosti vyhledávání v českém jazyce. A také naši databázi rozšíříme o fulltextový index.
Vše si ukážeme na databázi databaze_pro_web
.
Jestliže již tuto databázi nemáte, tak si její aktuální verzi můžete
stáhnout pod článkem a naimportovat.
Konfigurace textového vyhledávání
Konfigurace textového vyhledávání řídí míru a
způsob redukce dokumentů a vyhledávaných výrazů na
tsvector
a tsquery
. Každá taková konfigurace je
definována těmito složkami:
- Slovníky - používají se k odebrání slov, která by neměla být uvažována při hledání (tzv. stop slova). A dále k normalizaci slov, aby se různé odvozené formy stejného slova shodovaly. Úspěšně normalizované slovo se nazývá lexém. Jedna konfigurace může obsahovat klidně i více slovníků.
- Parser (analyzátor) - slouží k rozdělení textu na tzv.
tokeny, tedy jednotlivá slova nebo fráze. Tyto tokeny
nabývají různých datových typů, podle toho v jakém formátu jsou daná
slova nebo fráze, např. máme typy
asciiword
,word
,hword
,hword_part
,email
,url
,int
a další.
Tvorba slovníku
Slovníky se v PostgreSQL tvoří podle šablon.
Šablony poskytují funkce, pomocí kterých se slovníky vytváří z předaných souborů s požadovanými daty. Jedná se např. o soubory se stop slovy, předponami, příponami, synonymy, atd.
Šablony si můžeme sami vytvořit nebo využít již předpřipravených od PostgreSQL:
...konec náhledu článku...
Pokračuj dál
Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.
Koupit tento kurz
Před koupí tohoto článku je třeba koupit předchozí díl
Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.
- Neomezený a trvalý přístup k jednotlivým lekcím.
- Kvalitní znalosti v oblasti IT.
- Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.
Popis článku
Požadovaný článek má následující obsah:
V PostgreSQL tutoriálu se opět podíváme na fulltextové vyhledávání. Naučíme se vytvářet vlastní konfigurace textového vyhledávání a fulltextový index.
Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.