Příspěvek datově vychází z materiálu slovesných lemmat extrahovaných ze srovnatelných korpusů čtyř indoevropských jazyků – češtiny, angličtiny, němčiny a španělštiny – anotovaných pro jejich morfematickou strukturu s použitím velkých datových zdrojů. Zkoumáme možnosti propojení tohoto vzorku, poskytujícího informaci o morfematické struktuře sloves, a syntakticky anotovaných dat k výzkumu vztahu morfematické struktury sloves a jejich syntaktického chování, především ve vtahu k jejich valenci, a to napříč celým frekvenčním spektrem. V příspevku budou prezentovány dílčí experimenty, které demonstrují různé možnosti, jak lze k otázce slovesné morfematické komplexity a slovesné valence přistupovat s použitím různých typů datových zdrojů.