IT rekvalifikace s garancí práce. Seniorní programátoři vydělávají až 160 000 Kč/měsíc a rekvalifikace je prvním krokem. Zjisti, jak na to!
Hledáme nové posily do ITnetwork týmu. Podívej se na volné pozice a přidej se do nejagilnější firmy na trhu - Více informací.

Lekce 25 - PostgreSQL - Fulltextové vyhledávání - Fulltextový index

V předchozí lekci, PostgreSQL - Fulltextové vyhledávání, jsme si představili fulltextové vyhledávání v PostgreSQL databázích a podívali se na jeho výhody oproti klasickému hledání.

V dnešním PostgreSQL tutoriálu se opět podíváme na fulltextové vyhledávání. Naučíme se vytvářet vlastní konfigurace textového vyhledávání, čímž si zlepšíme možnosti vyhledávání v českém jazyce. A také naši databázi rozšíříme o fulltextový index.

Vše si ukážeme na databázi databaze_pro_web. Jestliže již tuto databázi nemáte, tak si její aktuální verzi můžete stáhnout pod článkem a naimportovat.

Konfigurace textového vyhledávání

Konfigurace textového vyhledávání řídí míru a způsob redukce dokumentů a vyhledávaných výrazů na tsvector a tsquery. Každá taková konfigurace je definována těmito složkami:

  • Slovníky - používají se k odebrání slov, která by neměla být uvažována při hledání (tzv. stop slova). A dále k normalizaci slov, aby se různé odvozené formy stejného slova shodovaly. Úspěšně normalizované slovo se nazývá lexém. Jedna konfigurace může obsahovat klidně i více slovníků.
  • Parser (analyzátor) - slouží k rozdělení textu na tzv. tokeny, tedy jednotlivá slova nebo fráze. Tyto tokeny nabývají různých datových typů, podle toho v jakém formátu jsou daná slova nebo fráze, např. máme typy asciiword, word, hword, hword_part, email, url, int a další.

Tvorba slovníku

Slovníky se v PostgreSQL tvoří podle šablon.

Šablony poskytují funkce, pomocí kterých se slovníky vytváří z předaných souborů s požadovanými daty. Jedná se např. o soubory se stop slovy, předponami, příponami, synonymy, atd.

Šablony si můžeme sami vytvořit nebo využít již předpřipravených od PostgreSQL:


 

...konec náhledu článku...
Pokračuj dál

Znalosti v hodnotě stovek tisíc získáš za pár korun

Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.

Koupit tento kurz

Koupit všechny aktuálně dostupné lekce s funkcí odevzdávání úloh a certifikátem za pouhých 1 550 Kč
Aktuální stav konta 0 Kč
Koupí tohoto balíčku získáš přístup ke všem 47 článkům (28 lekcí, 10 testů, 9 praktických cvičení) tohoto kurzu.

Před koupí tohoto článku je třeba koupit předchozí díl

Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.

Co od nás v dalších lekcích dostaneš?
  • Neomezený a trvalý přístup k jednotlivým lekcím.
  • Kvalitní znalosti v oblasti IT.
  • Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.

Popis článku

Požadovaný článek má následující obsah:

V PostgreSQL tutoriálu se opět podíváme na fulltextové vyhledávání. Naučíme se vytvářet vlastní konfigurace textového vyhledávání a fulltextový index.

Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.

Článek pro vás napsal Radek Vymětalík
Avatar
...
Aktivity