AppsApps

Korpusy ONLINE a jejich využití

Date
Speaker
  1. Václav Cvrček
Abstract

V říjnu t.r. snad už definitivně dojde ke zveřejnění korpusů ONLINE_NOW a ONLINE_ARCHIVE, které slouží k monitorování dynamického obsahu českého internetu (webová media, diskuse/fóra a sociální sítě). Bez velkého přehánění lze říct, že se jedná o korpusy, které jsme tu dosud neměli: jsou obrovské (v součtu se jedná o náš největší korpus češtiny), denně aktualizované, specificky strukturované a pravděpodobně budou i využívané k neobvyklým účelům. Jejich vytvoření tak představovalo pro infrastrukturu ČNK poměrně důkladnou zátěžovou zkoušku. Přednáška shrne, jak vypadají korpusy ONLINE, jaké potíže provázely jejich vytvoření a k čemu je lze využít.

Materiály ke stažení