AplikaceAplikace
Slovo v kostce

Co je to korpus?

Jazykový korpus je elektronický soubor autentických textů (psaných nebo mluvených), v němž je možné jednoduše vyhledávat jazykové jevy (zejm. slova a slovní spojení) a zobrazovat je v jejich přirozeném kontextu.

Korpusy ČNK zahrnují vedle psaného současného jazyka (v rozsahu přes 4 mld. slov) i soubory spontánního mluveného jazyka (přes 7 mil. slov), diachronní korpus starších textů a paralelní korpus InterCorp obsahující překlady z nebo do více než 30 jazyků.

Aplikace

  1. KonText

    Aplikace KonText je základním nástrojem pro práci s korpusy. Umožňuje vyhledávání v korpusech pomocí jednoduchých i komplexních dotazů, zobrazení formou konkordančních řádků, vypočtení frekvenční distribuce, asociačních měr kolokací a další práci s jazykovými daty. Přehledně jsou všechny funkce KonTextu popsány v manuálu.

  2. SyD

    Nástroj SyD je určen pro všestranný průzkum variant jak v současném jazyce, tak v průběhu jeho vývoje. Využívá korpusů ČNK, s jejichž pomocí zjišťuje, jak často se která varianta užívá v současnosti a užívala v průběhu vývoje češtiny. Pro jeho vyzkoušení stačí zadat dvě varianty jednoho jevu, které si vzájemně konkurují, např. téměř × skoro.

  3. Morfio

    Nástroj Morfio slouží pro vyhledávání slovotvorných vztahů mezi jednotkami v korpusech, např. lovit - úlovek. Umožňuje najít všechny dvojice slov tvořené stejným způsobem a vyhodnotit morfologickou produktivitu jejich tvoření. Aplikace využívá rozsáhlých korpusů psaného jazyka, které pokrývají širokou paletu slovotvorných možností současné češtiny.

  4. KWords

    Aplikace KWords poskytuje základní východisko pro empiricky podloženou interpretaci textů tím, že analyzuje slova v zadaném textu a porovnává jejich frekvenci s referenčním korpusem. Výsledkem takové analýzy je identifikace klíčových slov, tj. jednotek vyskytujících se signifikantně častěji v analyzovaném textu než v korpusu, který představuje neutrální jazykový úzus.

  5. Treq

    Aplikace umožňuje snadné vyhledávání překladových ekvivalentů v oboustranných česko-cizojazyčných slovnícícch vytvořených automaticky na základě dat paralelního korpusu InterCorp.

Podpora a zdroje informací

  1. Wiki

    Internetová příručka ČNK ve formě wiki představuje komplexní bázi znalostí pro práci s korpusy. Kromě informací o nástrojích a datech ČNK obsahuje i slovníček pojmů z korpusové lingvstiky a kurz v 7 lekcích.

  2. Podpora

    Pro registrované uživatele je k dispozici naše centrum podpory. Vedle hlášení chyb a požadavků na nové funkce obsahuje zejména internetovou Poradnu, v níž na dotazy uživatelů odpovídají členové týmu ČNK.

  3. Biblio

    Biblio je repozitář vědeckých publikací a kvalifikačních prací, které jsou založeny na zdrojích ČNK. Repozitář je přístupný všem návštěvníkům tohoto portálu a slouží jako neustále doplňovaná bibliografie korpusové lingvistiky. Chcete vědět více?

  4. Rada ČNK

    Rada ČNK je stálým poradním orgánem výzkumné infrastruktury Český národní korpus. Rada průběžně sleduje vědeckou kvalitu projektu, vyjadřuje se k jeho dalšímu směřování a na svých každoročních zasedáních hodnotí výsledky projektu.

  5. Jazyková data

    Není pro vaše výzkumné cíle přístup ke korpusům přes vyhledávací rozhraní dostačující? ČNK poskytuje také datové balíčky odvozené od zveřejněných korpusů způsobem, který respektuje omezení vyplývající z dohod uzavřených s poskytovateli textů, z autorského zákona a dalších platných předpisů.

  6. Pro školy

    Zřídili jsme nový repositář korpusových cvičení pro využití ve výuce jazyků na ZŠ a SŠ. Na této pravidelně aktualizované stránce můžete najít předem připravené pracovní listy s úlohami, které stačí jen vytisknout, i tipy pro přímou práci s korpusy a korpusovými nástroji ve výuce.

  7. K-centrum CLARIN

    K-centrum projektu ČNK poskytuje informace, konzultace a technickou podporu v oblasti korpusové lingvistky se zaměřením na empirický výzkum češtiny. Je součástí K-center evropské infrastruktury CLARIN zaměřené na jazykové zdroje a nástroje pro práci s nimi pro humanitní a společenské vědy.