AplikaceAplikace
logo
Co je Slovo v kostce?

Aplikace Slovo v kostce (WaG) poskytuje rychlý a základní přehledu o tom, jak se používá zadané slovo. Soustředí v sobě informace, které lze získat z korpusů ČNK pomocí dostupných nástrojů, a vytváří tak přehledný profil slova z různých perspektiv.

Výsledky, které se v aplikaci zobrazují, jsou získávány ze zdrojů ČNK: data o psaném jazyce pocházejí zejména z korpusu SYN2015, který odráží současnou psanou češtinu v různých jejích podobách (beletrie, odborná a popularizační literatura, publicistika), informace o mluvené češtině čerpáme z korpusu ORAL verze 1, který je tvořen přepisy neformálních spontánních nahrávek.

Kromě profilu slova v češtině (modul Vyhledat slovo) nabízí aplikace také informace o jeho možných překladech do jiných jazyků (modul Hledat ve dvou jazycích); pro tyto účely se využívá paralelní vícejazyčný korpus InterCorp, který obsahuje texty spolu s jejich překlady z nebo do více než 30 jazyků.

Jak využívat Slovo v kostce?

Výsledky analýzy zadaného slova jsou v aplikaci uspořádány do dlaždic. Každá dlaždice obsahuje informaci o tom, z jakého zdroje údaje pocházejí, a odkaz vedoucí do některé z aplikací pro práci s korpusy ČNK, kde lze zpravidla vyhledat detailnější údaje.

Pro každou dlaždici je v záhlaví k dispozici stručná nápověda otaznik, v některých případech lze údaje v dlaždici zobrazit ve formě tabulky tabulka či upravit výsledky dodatečným nastavení volitelných parametrů kolecko.

Všechny prezentované údaje jsou získány automatickou analýzou – přesnost a věrohodnost frekvenčních informací závisí na tom, jak spolehlivá je anotace v korpusech. Klíčová je přitom především role lemmatizace (tj. přiřazení základního tvaru) a morfologického značkování, jejichž chybovost ani s použitím nejmodernějších nástrojů nemůže být nulová. Pro podrobné a spolehlivé vyhodnocení je tedy klíčové ověřovat výsledky ve zdrojových datech, a to zejména s ohledem na adekvátnost anotace.

Další zdroje

Aplikace Slovo v kostce (WaG) slouží jako vstupní brána do světa jazykových korpusů. Ty jsou dnes základním zdrojem informací o přirozeném jazyce a využívají se ve všech oblastech lingvistického bádání. Další informace o jazykových korpusech a korpusových nástrojích jsou k dispozici na portále www.korpus.cz, mj.:

  • korpusová báze znalostí ve formě wiki – obsahuje informace o projektu ČNK i o jednotlivých korpusech, vysvětlení pojmů, návody na použití nástrojů apod.
  • univerzální korpusový vyhledávač KonText – umožňuje prohledávání všech korpusů dostupných v rámci ČNK
  • nástroj pro analýzu klíčových slov KWords – výchozí bod pro analýzu textu/diskurzu
  • nástroj pro slovotvornou analýzu Morfio – identifikuje dvojice slov spjaté formálními slovotvornými vztahy
  • uživatelská poradna a podpora – ideální místo, kde se zeptat, pokud si nevíte rady

Pro plné využití všech těchto možností je třeba projít bezplatnou registrací.