AppsApps

Určování autorství dokumentů s použitím stylometrie a strojového učení

Date
Speaker
  1. Jan Rygl
Abstract

Určování autorství nachází v dnešní době uplatnění především v soudnictví (znalecké posudky: ověřování autorství listin, odhalování plagiátů) a v boji s extremismem (dohledávání autorství ilegálních dokumentů na Internetu). K odhalování identity autora se využívá strojové učení a stylometrie. Stylometrické techniky extrahují z textu soubor rysů autora (otisk autora), které následně zpracovává strojové učení. Můžeme tak řešit problémy verifikace a přiřazování autorství. Součástí prezentace bude shrnutí čtyřletého vývoje systému ART (Authorship Recognition Tool) pro Ministerstvo vnitra a plány NLP Centra na další stylometrické aplikace.