Aplikace Slovo v kostce (WaG) poskytuje rychlý a základní přehledu o tom, jak se používá zadané slovo. Soustředí v sobě informace, které lze získat z korpusů ČNK pomocí dostupných nástrojů, a vytváří tak přehledný profil slova z různých perspektiv.
Výsledky, které se v aplikaci zobrazují, jsou získávány ze zdrojů ČNK: data o psaném jazyce pocházejí zejména z korpusu SYN2015, který odráží současnou psanou češtinu v různých jejích podobách (beletrie, odborná a popularizační literatura, publicistika), informace o mluvené češtině čerpáme z korpusu ORAL verze 1, který je tvořen přepisy neformálních spontánních nahrávek.
Kromě profilu slova v češtině (modul Vyhledat slovo) nabízí aplikace také informace o jeho možných překladech do jiných jazyků (modul Hledat ve dvou jazycích); pro tyto účely se využívá paralelní vícejazyčný korpus InterCorp, který obsahuje texty spolu s jejich překlady z nebo do více než 30 jazyků.
Výsledky analýzy zadaného slova jsou v aplikaci uspořádány do dlaždic. Každá dlaždice obsahuje informaci o tom, z jakého zdroje údaje pocházejí, a odkaz vedoucí do některé z aplikací pro práci s korpusy ČNK, kde lze zpravidla vyhledat detailnější údaje.
Pro každou dlaždici je v záhlaví k dispozici stručná nápověda , v některých případech lze údaje v dlaždici zobrazit ve formě tabulky
či upravit výsledky dodatečným nastavení volitelných parametrů
.
Všechny prezentované údaje jsou získány automatickou analýzou – přesnost a věrohodnost frekvenčních informací závisí na tom, jak spolehlivá je anotace v korpusech. Klíčová je přitom především role lemmatizace (tj. přiřazení základního tvaru) a morfologického značkování, jejichž chybovost ani s použitím nejmodernějších nástrojů nemůže být nulová. Pro podrobné a spolehlivé vyhodnocení je tedy klíčové ověřovat výsledky ve zdrojových datech, a to zejména s ohledem na adekvátnost anotace.
Aplikace Slovo v kostce (WaG) slouží jako vstupní brána do světa jazykových korpusů. Ty jsou dnes základním zdrojem informací o přirozeném jazyce a využívají se ve všech oblastech lingvistického bádání. Další informace o jazykových korpusech a korpusových nástrojích jsou k dispozici na portále www.korpus.cz, mj.:
Pro plné využití všech těchto možností je třeba projít bezplatnou registrací.