AplikaceAplikace

InterCorp s jednotnou morfologickou a syntaktickou anotací podle Universal Dependencies: zážitky tvůrců a uživatelů

Datum
Přednášející
  1. Olga Nádvorníková
  2. Alexandr Rosen
  3. Martin Vavřín
Abstrakt

Paralelní korpus InterCorp je ve verzi 13ud nově dostupný s morfologickou a syntaktickou anotací podle Universal Dependencies (UD), tedy podle standardu, který je navržen jako obecný pro všechny jazyky. Po stručném úvodu do principů UD a představení úprav anotace pro vyhledávač Manatee + KonText projdeme postup značkování, jehož základem je sada nástrojů UDPipe. Ve druhé části semináře ukážeme, jak lze UD využít při kontrastivním zkoumání konkrétních forem a jevů v textech více jazyků. V průběhu semináře upozorníme na výhody i záludnosti jednotné anotace v této podobě, konkrétně třeba na příkladu kontrastivního výzkumu syntaktické komplexity ve čtyřech jazycích.