Türkçe Sıfatların İstem Bilgisi

Nuh Doğan

Türkçe Sıfatların İstem Bilgisi

Nuh Doğan

2016, Modern Türklük araþtýrmalarý dergisi

visibility

…

description

32 pages

link

1 file

Výňatek (obsah a teoretický úvod) z knihy Markéta Lopatková, Zdeněk Žabokrtský, Václava Kettnerová a kol.: Valenční slovník českých sloves. Univerzita Karlova v Praze, Nakladatelství Karolinum, Praha, 2008. 5 Obsah Úvod 7 Podoba slovníkového hesla Struktura slovníku VALLEX 1 Lexémy, lexikální formy a lexikální jednotky . . 2 Lexikální formy a lemmata . . . . . . . . . . . . 2.1 Reflexivní lemmata . . . . . . . . . . . . 2.2 Vid a vidové protějšky . . . . . . . . . . 2.3 Varianty lemmatu . . . . . . . . . . . . . 2.4 Homografy (homonyma) . . . . . . . . . 3 Lexikální jednotky . . . . . . . . . . . . . . . . 4 Valenční rámce . . . . . . . . . . . . . . . . . . 4.1 Aktanty a volná doplnění . . . . . . . . . 4.2 Morfematické vyjádření . . . . . . . . . . 4.3 Atribut obligatornosti slovesného doplnění 4.4 Expanze valenční pozice . . . . . . . . . 5 Doplňující syntaktické informace . . . . . . . . . 5.1 Kontrola . . . . . . . . . . . . . . . . . . 5.2 Reflexivita . . . . . . . . . . . . . . . . . 5.3 Reciprocita . . . . . . . . . . . . . . . . 5.4 Syntakticko-sémantické třídy . . . . . . . 5.5 Frazémy a idiomy . . . . . . . . . . . . . 11 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 13 13 14 14 15 16 16 18 18 21 23 23 24 24 25 25 26 27 Seznam značek 29 Seznam literatury 31 Slovník 35 7 Úvod Valence patří k jazykovým jevům, které vzbuzují zájem lingvistů, ale i odborníků zabývajících se automatickým zpracováním přirozených jazyků. Její dobrá znalost je totiž nezbytná pro každého, kdo pracuje s jazykem – pro učitele, redaktory, novináře, studenty apod. Valence zároveň hraje klíčovou roli při úlohách automatického zpracování přirozeného jazyka, jakými jsou např. strojový překlad, rozlišování významů slov či vyhledávání informací. Co je to tedy valence? Termínu valence známého z oblasti chemie, kde označuje mocenství atomu, v lingvistickém kontextu poprvé užil uprostřed minulého století francouzský syntaktik Lucien Tesnière. Metaforicky tímto termínem označil schopnost slovesa (podobnou vlastnosti atomů) vázat k sobě určitý počet jazykových elementů. Pod pojmem valence se rozumí „počet a povaha míst (argumentů), které na sebe dané sloveso (popř. slovo jiného slovního druhu) váže“ (Encyklopedický slovník češtiny, Karlík et al., 2002). Je to tedy schopnost slova vázat na sebe určitý počet jiných, syntakticky závislých jazykových jednotek. Tato schopnost se primárně týká významové roviny jazyka, tedy hloubkové větné stavby. Valenční pozice jsou naplňovány valenčními doplněními, jako je aktor (konatel či nositel děje), patient (zasažený objekt), adresát, původ a výsledek děje, označovanými obvykle jako aktanty, ale i volnými doplněními vyjadřujícími okolnosti děje, jako jsou způsob děje, místo, směr apod. Jednotlivé valenční pozice jsou různě významově těsné. Neobsazením některých pozic dochází k porušení významové úplnosti, což může vést i k porušení gramatické správnosti věty, srov. např. nepřijatelné věty *Petr dává, *Marie nenávidí, *Jan se choval. Doplnění obsazující takové valenční pozice se nazývají obligatorní. Zvláštní pozornost je v teorii valence věnována případům, kdy obligatorní valenční pozice zůstávají v povrchové podobě věty neobsazeny a posluchač/čtenář si příslušné pozice zaplňuje z kontextu promluvy/textu, např. ve spojeních obvykle nakupuje v supermarketu či děti přišly není vyjádřen patient, resp. směr, tyto informace by měly být posluchači/čtenáři zřejmé z kontextu promluvy/textu. Jiné valenční pozice jsou nepovinné, fakultativní – jsou sice přítomny ve valenčním rámci a mohou být přítomny ve významové (hloubkové) reprezentaci věty, jejich neobsazením však nevzniká významově ani gramaticky narušená věta, např. Petr se pevně držel (zábradlí), Eva se najedla (ovoce), Dívka píše (mamince) dopis. Ostatní pozice s velmi volným vztahem ke slovesu se často označují jako nevalenční, např. Jana se procházela (po lese), Petr se budil (časně), Eva si četla (pro své potěšení), i když v teoretickém popisu jsou do valence slovesa (v širším smyslu) zahrnuty. Valence se promítá i do povrchové realizace věty. Jednotlivé aktanty typicky vlivem slovesa nabývají určité realizace – jejich morfematická podoba je určována rekcí řídícího slovesa. Např. konatel bývá v aktivní větě typicky vyjádřen nominativem, zatímco patient se obvykle realizuje akuzativem (např. Petrkonatel ztratil botu patient ), jiná slovesa vyžadují konatele v dativu (např. Petrovikonatel se ve škole líbí), opět jiná slovesa mají patient v dativu (např. rodičekonatel bránili jejich štěstí patient ) či ve formě předložkové skupiny (např. doufali ve vítězství patient ). Naproti tomu forma valenčních volných doplnění bývá dána významem těchto doplnění (děti přišly domů/do školy/na hřiště) a nebývá řízena slovesem. Valence je teoreticky zkoumána zhruba od poloviny 20. století, jmenujme zde již zmíněného L. Tesnièra (viz Tesnière, 1959). Důraz na zkoumání významové složky valence pak přinesly především studie Fillmorovy (Fillmore, 1968, 1969). V českém prostředí se k významným pracím věnovaným valenci řadí zejména studie Danešovy (Daneš, 1971, Daneš – Hlavsa, 1987), práce Panevové (Panevová, 1974, 1980, 1994), Karlíkovy (Karlík, 2000) a Sgallovy (Sgall, 1998, 2006). Další odkazy lze nalézt v seznamu literatury na konci úvodní části. 8 Valenční slovník českých sloves VALLEX Je zřejmé, že valenční vlastnosti sloves (i dalších slovních druhů) jsou velmi rozmanité. Nelze je odvodit obecnými pravidly, je třeba je popsat pro jednotlivé lexikální položky, tedy v podobě valenčního slovníku, který obsahuje popis valence jednoho slova po druhém. Z těchto důvodů vzniká v Ústavu formální a aplikované lingvistiky na Matematicko-fyzikální fakultě Univerzity Karlovy v Praze od roku 2001 elektronický Valenční slovník českých sloves VALLEX, jehož tištěnou verzi máte nyní v rukou. Valenční slovník českých sloves (VALLEX jako VALency LEXicon) je výsledkem snah o formální zachycení valenčních charakteristik českých sloves v rámci teorie Funkčního generativního popisu (FGP), která byla navržena Petrem Sgallem (viz Sgall, 1967) a je dále rozvíjena jím a jeho spolupracovníky (viz zejména Sgall et al., 1986). Teorii valence ve FGP propracovala zejména Jarmila Panevová (Panevová, 1974, 1980, 1994). Slovník VALLEX je úzce spojen s Pražským závislostním korpusem (PDT, Prague Dependency Treebank, viz Hajič, 2005, Hajič et al., 2006). Zatímco v PDT je FGP verifikován pomocí komplexní analýzy velkého množství textových dat, ve VALLEXu je využita zejména valenční teorie vyvíjená v rámci FGP. VALLEX poskytuje informace o valenční struktuře českých sloves v jejich jednotlivých významech, které charakterizuje pomocí glos a příkladů. Pro jednotlivá valenční doplnění uvádí VALLEX možná morfematická vyjádření, pokud jsou jejich formy dány slovesnou rekcí. Kromě těchto základních údajů uvádí i některé další syntaktické, případně syntakticko-sémantické charakteristiky, jako je vlastnost kontroly, možnost recipročního užití či syntakticko-sémantická třída slovesa. VALLEX popisuje chování 2 730 českých lexémů, které zahrnují 6 460 lexikálních jednotek – ,daných sloves v daném významu‘. Zdůrazněme zde, že VALLEX (v návaznosti na teoretické předpoklady FGP) zachycuje valenční chování pravých vidových protějšků v rámci jediného lexému, jednotlivá hesla ve slovníku tedy odpovídají celým lexémům. Pokud bychom počítali dokonavá a nedokonavá slovesa zvlášt’, dostali bychom se k počtu 4 250 sloves. Hlavním kritériem výběru sloves ve VALLEXu byla jejich frekvence v Českém národním korpusu SYN20001 – v prvním kroku bylo vybráno přibližně 2 500 nejčastějších slovesných lemmat, posléze byl tento výběr doplněn tak, aby slovník obsahoval ke každému slovesu i jeho vidové protějšky. Při navrhování koncepce VALLEXu byl kladen důraz na přesnost a lingvistickou adekvátnost popisu valence u velkého množství sloves. Slovníková hesla byla zpracována manuálně s přihlédnutím ke korpusovému i slovníkovému materiálu s následnou rozsáhlou automatickou, poloautomatickou i ruční kontrolou. Od samého začátku se předpokládalo využití VALLEXu jak pro člověka jako uživatele jazyka, tak pro počítačové zpracování češtiny a pro další aplikační účely, jako např. strojový překlad, vyhledávání v textech apod. Kromě tištěné verze VALLEXu byla připravena též jeho elektronická podoba ve formě webové stránky umožňující pohodlné vyhledávání podle různých kritérií: lemma, syntakticko-sémantická třída, funktor, formy doplnění a další. Tento elektronický slovník i jeho verzi ve formátu XML vhodném pro automatické zpracování (viz zejména Žabokrtský, 2005) lze nalézt na adrese Ústavu formální a aplikované lingvistiky Matematicko-fyzikální fakulty Univerzity Karlovy v Praze.2 Důrazem na možnost všestranného využití se VALLEX liší od jiných dostupných valenčních slovníků češtiny – jmenujme zejména velmi propracovaný tištěný slovník Slovesa pro praxi (Svozilová et al., 1997), který popisuje 767 českých sloves. Ze slovníků pro automatické zpracování jazyka uved’me slovník BRIEF (Pala – Ševeček, 1997), který však neobsahuje popis významové struktury, a Czech syntactic lexicon (Skoumalová, 2001), který vznikl ze slovníku BRIEF automatickým doplněním významové struktury (ani jeden z těchto slovníků není veřejně dostupný). Z dalších významných českých slovníků citujme ještě tištěný Slovník slovesných, substantivních a adjektivních vazeb a spojení (Svozilová et al., 2005), elektronický valenční slovník PDT-VALLEX (Hajič et al., 2003), zachycující valenci sloves a vybraných 1 http://ucnk.ff.cuni.cz 2 http://ufal.mff.cuni.cz/vallex/2.5 (VALLEX, verze 2.5) 9 deverbativních substantiv a adjektiv v PDT (Hajič, 2005, Hajič et al., 2006), a zatím nepublikovaný slovník Verbalex (Hlaváčková – Horák, 2006). Dodejme, že budování valenčních slovníků jak v tištěné, tak v elektronické podobě stojí v centru pozornosti i pro desítky dalších jazyků; odkazy na nejdůležitější slovníky jsou uvedeny v seznamu literatury. Příprava současné verze slovníku VALLEX trvala více než pět let. Jejím primárním cílem bylo vytvořit kvalitní veřejně dostupný valenční slovník, který by vyhovoval lingvistům i odborné veřejnosti na jedné straně a který by na straně druhé mohl sloužit pro počítačové zpracování češtiny. Doufáme, že tohoto cíle bylo dosaženo. VALLEX je formálně strukturovaný slovník – jeho tištěnou verzi nyní držíte v ruce a jeho elektronická verze je dostupná na adrese Ústavu formální a aplikované lingvistiky Matematicko-fyzikální fakulty Univerzity Karlovy v Praze. Věříme dále, že snaha o shromáždění syntaktických informací vztahujících se k valenci – stejně jako důraz na konzistentní popis systémových vlastností lexikálních jednotek – činí z VALLEXu praktickou pomůcku pro účely didaktické, překladatelské a pro práci s češtinou vůbec, ale i užitečný zdroj dat pro účely aplikační. Výsledky uložené v tomto slovníku prezentují valenci jako problém jak syntaktický (kombinatorický), tak lexikografický. Práce s bohatými daty ovšem ukazuje, že slovníkový přístup k zachycení valence přináší stále otevřené teoretické otázky, které vyžadují další podrobné lingvistické zkoumání. Poděkování Při zpracovávání sloves pro slovník VALLEX jsme využívali následující slovníky (některé z nich přes webové rozhraní DEBDict)3 a korpusy českých textů: • BRIEF (Pala – Ševeček, 1997); • Slovník spisovné češtiny pro školu a veřejnost (Mejstřík, 2003, dále SSČ); • Slovník spisovného jazyka českého (Havránek, 1964, dále SSJČ); • Slovesa pro praxi (Svozilová et al., 1997); • Slovník slovesných, substantivních a adjektivních vazeb a spojení (Svozilová et al., 2005); • Český národní korpus (Blatná – Čermák, 2005, dále ČNK)4 ; • Pražský závislostní korpus (Hajič et al., 2006, dále PDT)5 . Rádi bychom zde poděkovali za podporu a za rozsáhlé lingvistické i technologické rady a pomoc kolegům z Ústavu formální a aplikované lingvistiky. Zvláštní dík patří zejména paní profesorce Jarmile Panevové. Práce na slovníku VALLEX, verze 2.5, probíhala v rámci výzkumného záměru Ministerstva školství, mládeže a tělovýchovy ČR č. MSM0021620838 (Moderní metody, struktury a systémy informatiky). Dále byla částečně podporována grantem programu MŠMT ČR Výzkumná centra, č. LC536 (Centrum komputační lingvistiky) a dvěma granty programu Informační společnost číslo 1ET100300517 a 1ET101120503. 3 http://nlp.fi.muni.cz/projekty/deb2/debdict/index.html 4 http://ucnk.ff.cuni.cz 5 http://ufal.mff.cuni.cz/pdt2.0/ 11 Podoba slovníkového hesla Zde uvádíme pouze přehled struktury hesla pro usnadnění orientace (viz též obrázek na následující straně), jednotlivé pojmy jsou vysvětleny v následujícím oddíle. Lemma – v záhlaví slovníkového hesla je uvedeno lemma (infinitivní tvar) reprezentující heslové sloveso, příp. seznam lemmat (v pořadí nedokonavé, dokonavé, iterativum), odd. 2. Vid – jako horní index je u každého lemmatu uveden údaj o vidu (značky impf , pf , iter; případně následovány arabskou číslicí, pokud je slovníkové heslo reprezentováno více lemmaty se stejným videm), odd. 2.2. Varianty – pokud má slovesné lemma varianty, jsou všechny varianty (oddělené lomítkem) uvedeny v záhlaví hesla, odd. 2.3. Homografy – jsou rozlišeny římskou číslicí v dolním indexu u lemmatu, odd. 2.4. Číslo LU – pokud má sloveso více významů, tzn. má více lexikálních jednotek (dále LU), je každá z nich označena arabskou číslicí, odd. 3. Idiom – idiomatická užití jsou uvedena značkou idiom za číslem LU, odd. 5.5. Omezení – pokud se daná LU vztahuje jen k některým lemmatům ze seznamu uvedeného v záhlaví, jsou za značkou jen uvedena všechna lemmata, ke kterým se tato LU vztahuje (s vyznačeným videm a případnými variantami a indexem pro homografy); omezení se neuvádí pro iterativa. Valenční rámec – každá LU je popsána pomocí formálního zápisu rámce, který uvádí počet a typ (tzv. funktor) valenčních doplnění, jejich možná morfematická vyjádření (dolní index) a obligatornost (horní index – pokud není uveden, jde o obligatorní doplnění, značka opt zachycuje fakultativní doplnění, značka typ doplnění typické), odd. 4. Glosa – každá LU je charakterizována glosou, která je na novém řádku za valenčním rámcem; pokud je heslové sloveso specifikováno několika lemmaty, jsou zde glosy pro všechna nedokonavá a dokonavá lemmata; glosy jsou uvedeny vždy údajem o vidu. Příklad – každá LU obsahuje příklad užití uvedený značkou př.; pokud je heslové sloveso specifikováno několika lemmaty, jsou zde příklady pro všechna nedokonavá a dokonavá lemmata; příklady jsou vždy uvedeny údajem o vidu. Doplňující syntaktické informace • kontrola – slovesa kontroly mají za značkou control uveden funktor členu valenčního rámce tohoto slovesa, který koreferuje se subjektem infinitivu závislého slovesa (kontroluje ho), odd. 5.1; • reflexivita – za značkou rfl jsou uvedeny možné syntaktické funkce morfému se/si, odd. 5.2; • reciprocita – za značkou rcp jsou uvedeny dvojice, příp. trojice valenčních doplnění, která mohou vstupovat do vztahu reciprocity, odd. 5.3; • syntakticko-sémantická třída – za značkou class je uvedena syntakticko-sémantická třída slovesa v daném významu, odd. 5.4. 12 Ukázka dvou slovníkových hesel 13 Struktura slovníku VALLEX Obsah Valenčního slovníku českých sloves VALLEX zde popíšeme pouze z hlediska jeho struktury. Lingvistické aspekty vyžadující širší vysvětlení či diskusi jsou většinou ponechány stranou, odkazujeme pouze na základní literaturu týkající se dané problematiky. Odborná terminologie, kterou v textu užíváme, bud’patří k ustálené lingvistické terminologii, nebo vychází z terminologie Funkčního generativního popisu (FGP), který slouží jako podkladová teorie VALLEXu. Pokud tomu tak není, jsou potřebné termíny zavedeny v textu. 1 Lexémy, lexikální formy a lexikální jednotky Slovník VALLEX je na nejvyšší úrovni tvořen lexémy, kterým odpovídají jednotlivá slovníková hesla. Lexémem přitom rozumíme abstraktní jednotku, která v sobě spojuje formální i významovou složku (viz Cruse, 1986), u polysémních/polysémických/víceznačných lexémů též označovanou jako hyperlexém (viz i Filipec – Čermák, 1985, Karlík et al., 2002). Lexém sdružuje množinu všech možných manifestací slovesa v textu/řeči, kterou zde budeme označovat jako množinu všech možných lexikálních forem, a množinu lexikálních jednotek (LU jako ,lexical unit‘), které reprezentují jeho významové složky, v české terminologii obvykle označované jako jednotlivé lexie či základní lexikální jednotky, viz terminologickou poznámku níže. Lexikální formy jsou tedy všechny morfematické formy slovesa (celé jeho paradigma), viz odd. 2, zatímco lexikální jednotky zhruba odpovídají lexému v jednom určitém významu a nesou informaci o syntaktických a syntakticko-sémantických rysech slovesa v tomto významu, viz odd. 3. Terminologická poznámka: Zde se odchylujeme od (ne zcela jednotné) české terminologie, kde se obvykle termíny lexém a lexikální jednotka užívají víceméně synonymně, viz Filipec – Čermák (1985), str. 28: „Tento termín [lexém] je tedy synonymní s termínem LJ [= lexikální jednotka], ale je ještě dále diferencován.“ Každému významu (polysémického) lexému odpovídá jedna základní lexikální jednotka (tamtéž): „Lexikální jednotka jako polysémický lexém je ... útvar zahrnující tolik různých monosémických základních lexikálních jednotek, lexií (...), kolik má různých významů.“ Ve VALLEXu se přikláníme k terminologii, která je běžná v anglicky psané odborné literatuře, kde je termínem ,lexical unit‘ označován koncept odpovídající základní lexikální jednotce (viz Cruse, 1986, Ruppenhofer et al., 2006). 2 Lexikální formy a lemmata Množiny všech možných lexikálních forem tvořících formální složku jednotlivých lexémů jsou reprezentovány infinitivními tvary slovesa obvykle nazývanými lemmata. Slovníkové heslo je ve VALLEXu uvedeno lemmatem, případně seznamem lemmat vztahujících se k danému lexému (včetně příp. morfému se/si, viz odd. 2.1). Jednotlivá lemmata jsou doplněna o další informace: • informace o vidu v horním indexu, viz odd. 2.2; • římská číslice v dolním indexu rozlišující homografy (viz odd. 2.4). Slovník VALLEX (v návaznosti na teorii FGP) zachycuje valenční chování vidových protějšků v rámci jediného lexému. Proto je slovníkové heslo typicky uvedeno dvěma (příp. více) slovesnými lemmaty, nedokonavým a dokonavým infinitivním tvarem slovesa, viz odd. 2.2. Dalším důvodem, proč se v záhlaví slovníkového hesla může vyskytnout více lemmat, jsou pravopisné varianty slovesa, viz odd. 2.3. 14 2.1 Reflexivní lemmata Z hlediska zachycení reflexivity ve slovníku jsou ve VALLEXu rozlišovány dva základní typy reflexivních konstrukcí (viz též Karlík et al., 2002): • Reflexivní lexémy. Jako reflexivní lexémy jsou označována inherentně reflexivní slovesa, reflexiva tantum, u nichž je morfém se/si považován za součást lemmatu. Řadí se k nim: – primární reflexiva tantum (v Karlík et al., 2002 označovaná jako inherentně reflexivní slovesa), tedy slovesa, která se v nereflexivní formě vůbec nevyskytují (např. bát se, smát se), či slovesa, která nereflexivní formy sice mají, lexikální jednotky odpovídající reflexivním a nereflexivním formám si jsou však natolik významově vzdáleny, že jsou obvykle vyčleňovány do dvou lexémů (např. chovat se vs. chovat); – tzv. odvozená/sekundární reflexiva (v Karlík et al., 2002 též inherentně reflexivní varianta slovesa), tedy slovesa, kde se/si je slovotvorně motivovaným morfémem, reflexivní forma je tudíž v nějakém významovém vztahu k nereflexivní formě, např. vyjadřuje samovolnou či bezděčnou činnost (např. šířit se, vrátit se). Reflexivní lexémy jsou ve VALLEXu zachyceny v samostatných slovníkových heslech. • Reflexivní užití nereflexivních lexémů. Pokud reflexivní morfém se/si nese syntaktickou funkci, jsou reflexivní formy sloves zachyceny v rámci nereflexivního lexému, kde je též specifikována jejich syntaktická funkce (viz oddíly 5.2 a 5.3): – se může být součástí tvaru tzv. reflexivního pasiva (např. pátrá se po zloději); – se/si může označovat doplnění obsazující valenční pozici řídícího slovesa u tzv. vlastního reflexiva (kde se/si lze nahradit silnou podobou zájmena sebe/sobě, např. vidět se (= sebe), darovat si (= sobě) dort, kde se/si je PAT (patient), resp. ADDR (adresát) koreferující s ACT (aktorem) řídícího slovesa); – se/si může mít reciproční funkci (např. kopat se v kopou se vzájemně do nohou). Poznámka: Některé lexikální jednotky mají reflexivní i nereflexivní podobu lemmatu beze změny významu, např. myslím (si), že to tak není (někdy se označuje se jako volné se/si). Tento typ se/si bývá zaznamenán pouze jako jeden z příkladů u nereflexivní lexikální jednotky. 2.2 Vid a vidové protějšky V češtině se pro kategorii vidu rozlišují dvě základní hodnoty, nedokonavost a dokonavost. Vedle toho se vyčleňují též iterativa jako specifická podtřída nedokonavých sloves a slovesa obouvidová (slovesa, která se v určitých kontextech chovají jako dokonavá, v jiných kontextech jako nedokonavá). Ve VALLEXu jsou do jediného lexému spojeny tzv. pravé vidové dvojice tvořené sufixálně – nedokonavé sloveso je utvořeno od dokonavé formy slovesa např. příponou -va(t) (např. ochutnat → ochutnávat), příponou -ova(t) (např. dokončit → dokončovat), příponou -a(t) (např. vyrůst → vyrůstat) či příponou -ě/e(t) (např. otočit → otáčet). Dále jsou v jednom lexému zachyceny i supletivní páry (např. vzít – brát, najít – nacházet).6 Pokud existuje i běžně užívaná iterativní podoba, je rovněž zahrnuta do příslušného lexému (např. slovesa nasedatimp f , nasednout p f a nasedávatiter jsou popsány v jednom slovníkovém hesle odpovídajícím jednomu lexému). 6 Dokonavé protějšky nedokonavých sloves tvořené prefixálně v rámci stejného lexému zachyceny nejsou. K tomuto rozhodnutí vedly praktické důvody, nebot’ ne vždy je zcela jednoznačné, které z více možných prefigovaných lemmat považovat za vidový protějšek. 15 Ve VALLEXu se informace o vidu zachycuje u každého lemmatu jako horní index, který může nabývat následujících hodnot: • impf • • pf • biasp pro nedokonavá slovesa; pro dokonavá slovesa; iter pro iterativa (násobená slovesa); pro obouvidová slovesa. V rámci jediného slovníkového hesla je v některých případech zachyceno více podob jednoho ze členů vidové dvojice (aniž by šlo o varianty, viz odd. 2.3), a to v případech, kdy jednomu lemmatu jedné vidové hodnoty odpovídají různá lemmata s druhou hodnotou (např. dokonavá slovesa dohonit p f i dohnat p f mají nedokonavý protějšek dohánětimp f , naopak dokonavé sloveso odvinout p f má dva nedokonavé protějšky odvinovatimp f a odvíjetimp f – každá tato trojice lemmat reprezentuje jediný lexém, odpovídá jí tedy jediné slovníkové heslo). Při stanovování vidových protějšků se VALLEX přidržuje vztahů stanovených ve slovníku SSJČ. Typicky taková lemmata sdílejí (alespoň jednu) lexikální jednotku, viz odd. 3, i když u nich může docházet k modifikaci významu (spočívající zejména ve změně ,způsobu slovesného děje‘, např. u některých sloves pohybu, u sloves distributivních či u sloves momentálních s příponou -nou(t)). Např. lemmata odříznout p f a odřezat p f jsou zahrnuta spolu s lemmatem odřezávatimp f do jediného lexému. Poznámka k notaci: V seznamu lemmat reprezentujících lexém se tedy může vyskytnout více lemmat se stejnou vidovou charakteristikou. V takovém případě je tato charakteristika doplněna arabskou číslicí tak, aby index s vidovou charakteristikou mohl sloužit jako jednoznačný identifikátor lemmatu ve slovníkovém hesle. Tento identifikátor uvádí glosy a příklady, případně další údaje, které se vztahují pouze k některým z lemmat reprezentujících lexém. Ve VALLEXu se to týká např. sloves dohánětimp f , dohnat p f 1 dohonit p f 2 ; odvinovatimp f 1 , odvíjetimp f 2 , odvinout p f ; odřezávatimp f , odříznout p f 1 , odřezat p f 2 . Lexikální jednotka se typicky vztahuje ke všem lemmatům daného lexému, která jsou uvedena v záhlaví slovníkového hesla. Toto obecné pravidlo má však řadu výjimek, konkrétní lexikální jednotky (viz odd. 3) se mohou vztahovat jen k některým z uvedených lemmat. Například sloveso odpovědět p f je dokonavým protějškem slovesa odpovídatimp f ve smyslu ,dávat odpověd’‘, ale již ne ve smyslu ,reagovat‘, ,mít odpovědnost‘ či ,být ve shodě/v souladu; korespondovat‘ (v těchto významech jde o imperfektum tantum). V takovém případě jsou za arabskou číslicí uvádějící příslušnou lexikální jednotku uvedena za značkou jen všechna lemmata, ke kterým se tato lexikální jednotka vztahuje (s vyznačeným videm a případnými variantami a indexem pro homografy, viz níže); toto omezení se neuvádí pro iterativa. Ve třídě nedokonavých sloves se dále vyčleňuje skupina sloves násobených (iterativní slovesa, iterativa) označujících opakovaný děj. V češtině je tvoření iterativ velmi produktivní a do značné míry pravidelné, tvoří se od nedokonavých sloves příponou -va(t) s kvantitativní či kvalitativní změnou vokálu před příponou (např. volat→ volávat, křičet→ křičívat, být→ bývat), příp. příponou -a(t) (např. jíst→ jídat). Vzhledem k vysoké produktivitě při tvorbě iterativ nejsou ve VALLEXu iterativa zachycena vyčerpávajícím způsobem: iterativa s rozšířenou variantou přípony -váva(t) (např. chodívávat) nejsou uváděna vůbec, z ostatních iterativ jsou uváděna pouze ta, která se ve sledovaných textech a zdrojových slovnících vyskytovala pravidelněji. Lemmata iterativních sloves jsou součástí záhlaví slovníkového hesla, neuvádějí se však pro ně glosy a příklady ani se nezaznamenává omezení u lexikálních jednotek, pro které iterativum nelze užít. 2.3 Varianty lemmatu Varianty lemmatu (často ortografické alternativy) jsou chápány jako skupina dvou nebo více lemmat reprezentujících daný lexém, která jsou zaměnitelná v jakémkoliv kontextu beze změny významu, vztahují se k nim tedy stejné lexikální jednotky (např. dozvědět/dovědět se, dýchnout/dechnout). Obvykle se varianty 16 liší jen alternací v morfematickém kmenu slovesa, která je případně doprovázena stylistickým posunem (např. myslet/myslit), navíc někdy mohou mít obě lemmata společné některé tvary paradigmatu (např. mysli (imperativ) je společným tvarem pro myslet i myslit). Všechny varianty lemmatu jsou popsány společně v jednom lexému. Varianty jsou uvedeny v záhlaví hesla, jsou oddělené lomítkem, např. dovědět/dozvědět se, dýchnout/dechnout, myslet/myslit. Přes toto základní vymezení variant VALLEX obsahuje řídké výjimky, kdy lze užít pouze jedno z lemmat. Např. lemmata plavat a plovat jsou tradičně považována za varianty (viz SSJČ), přestože v některých kontextech lze užít jen plavat, např. plavat při zkoušce vs. *plovat při zkoušce. V případě, že lze v daném významu užít pouze jednu z variant, jsou za arabskou číslicí uvádějící příslušnou lexikální jednotku za značkou jen uvedena ta lemmata a jejich varianty, ke kterým se tato lexikální jednotka vztahuje (s vyznačeným videm a indexem pro homografy, viz níže). 2.4 Homografy (homonyma) Jako homografy jsou ve VALLEXu označována lemmata s identickou grafickou podobou, ale bez zřejmého sémantického vztahu. Jde tedy o různé lexémy, jejichž lemmata jsou reprezentována stejnou kombinací morfémů, tj. mají stejné grafématické vyjádření. Často se též liší jejich etymologie (např. nakupovatI jako nakupovat dětem oblečení vs. nakupovatII imp f jako nakupovat kolem sebe hromady věcí), vid (např. stačitI jako stačí mu to ke štěstí či Petr stačí pf Pavlovi v běhu vs. stačitII jako stačí dorazit do školy včas) nebo některé tvary paradigmatu (např. infinitiv žít je homograf, který má pro 3. osobu singuláru minulého času formu žil pro význam ,být naživu; trávit čas‘, např. Jan žil v Praze, ale formu žal pro význam ,kosit; sekat‘, např. Jan žal trávu). Ve VALLEXu jsou homografy rozlišovány římskou číslicí v dolním indexu (v případě reflexivních lemmat před morfémem se/si, např. dítI , dítII se). Terminologická poznámka: Zde se držíme terminologie běžné v anglicky psané literatuře, která rozlišuje homografy jako jednotky se stejnou psanou podobou (bez ohledu na podobu zvukovou) a homofony jako jednotky se zvukově stejnou podobou. Termín homograf užívaný ve VALLEXu tedy zahrnuje termíny homonymum (jednotka se stejnou psanou i zvukovou podobou) i homograf (jednotka se stejnou psanou, ale odlišnou zvukovou podobou), jak je užívá česky psaná literatura. 3 Lexikální jednotky V koncepci slovníku VALLEX reprezentují lexikální jednotky významovou složku, která spolu se složkou formální (s možnými lexikálními formami) vytváří lexém. Každý lexém je tedy tvořen množinou lexikálních jednotek (LU), kterým jsou přiřazeny příslušné lexikální formy (reprezentované lemmaty). V souladu s D. A. Crusem (viz Cruse, 1986) považujeme lexikální jednotky za „komplexní jednotky s (relativně) stálými, diskrétními sémantickými vlastnostmi.“7 Stručně řečeno, jde zhruba o ,dané slovo v daném významu‘. Poznámka k vyčleňování jednotlivých LU: Pro vyčleňování jednotlivých významů daného lexému neexistují všeobecně přijatá testovatelná kritéria, přechod od jednoho významu k druhému je v řadě případů pozvolný. Ve VALLEXu je při rozlišování jednotlivých LU kladen důraz na syntaktická kritéria, zejména na podobu valenčního rámce, včetně povrchové realizace jednotlivých valenčních doplnění (viz odd. 4). Přitom se ovšem přihlíží též k sémantice. • Změny ve valenčním rámci (s výjimkou morfematických variant) vedou k vyčlenění více LU, i když je význam těchto LU blízký (např. následující užití slovesa poslat bude popsáno dvěma LU: poslat peníze do banky/na účet.DIR3 vs. poslat peníze dětem.ADDR ). 7 Cruse (1986): “form-meaning complexes with (relatively) stable and discrete semantic properties”. 17 • Podobně vede k vyčlenění různých LU i různá syntaktická strukturace (např. naložit vůz.PAT senem.EFF vs. naložit seno.PAT na vůz.DIR3 ; žnout louku.PAT vs. žnout trávu.PAT na louce.LOC ). Systematické provázání těchto blízkých LU pomocí tzv. alternačního modelu navrženého ve studiích Žabokrtský (2005) a Lopatková et al. (2006) není v současné verzi slovníku uplatněno. • Jednotlivé valenční členy jsou specifikovány syntakticko-sémantickým vztahem k řídícímu slovesu, odlišnost tohoto vztahu opět vede k různým LU (např. tři LU pro lexém pocházet: rukopis pochází ze 14. stol.TFRWH vs. pochází z venkova.DIR1 vs. všechno zlo pochází z bídy a neznalosti.PAT ). • Pokud má sloveso dva (či více) zřetelně odlišné významy, jsou tyto významy popsány různými LU i v případech, kdy se valenční rámec neliší (např. dvě LU pro sloveso chovat: chovat dítě.PAT v náručí.LOC vs. chovat prasata.PAT na farmě.LOC ). Terminologická poznámka: Lexikální jednotka spolu se svými lexikálními formami, jak je chápána ve VALLEXu, odpovídá jednotce v české tradici označované jako monosémní/monosémický lexém, lexie nebo též základní lexikální jednotka (viz Filipec – Čermák, 1985, Karlík et al., 2002), zde též odd. 1. Lexikální jednotky jsou ve VALLEXu číslovány arabskými číslicemi – pokud má lexém více významů popsaných několika lexikálními jednotkami, je každá lexikální jednotka uvozena touto číslicí. Pořadí lexikálních jednotek není zcela arbitrární, není ale přísně systematické. V této podobě slovníku je dáno intuicí autorů (s přihlédnutím ke vzorku korpusového materiálu) – primární a/nebo velmi frekventované významy jsou uváděny na prvních místech, zatímco řídké a idiomatické významy jsou řazeny na konec slovníkového hesla. Pokud není specifikováno jinak, vztahuje se lexikální jednotka ke všem lemmatům reprezentujícím daný lexém (uvedeným v záhlaví slovníkového hesla). V případech, kdy se daná lexikální jednotka vztahuje jen k některým lemmatům ze seznamu v záhlaví, jsou za značkou jen uvedena všechna lemmata, ke kterým se tato lexikální jednotka vztahuje (s vyznačeným videm a případnými variantami a indexem pro homografy).8 Lexikální jednotky zhruba odpovídají lexému v určitém významu a nesou informaci o syntaktických a sémantických rysech slovesa v daném významu. Příslušné informace jsou ve VALLEXu zachyceny jako povinné a nepovinné atributy lexikální jednotky. Povinné atributy musí být vyplněny pro každou lexikální jednotku. Nepovinné atributy mohou být nevyplněny, bud’protože se u dané lexikální jednotky nevyskytují (např. kontrola se uvádí jen u sloves s touto vlastností, viz odd. 5.1), nebo protože dané informace nejsou v současné podobě dostupné (např. určení syntakticko-sémantické třídy slovesa, viz odd. 5.4). Povinné atributy lexikální jednotky: • valenční rámec, viz odd. 4; • glosa – sloveso nebo parafráze charakterizující daný význam slovesa; glosy nelze pokládat za synonyma nebo dokonce za lexikografické definice, slouží pouze pro orientaci ve slovníkovém hesle; • příklad – věty nebo fragmenty vět obsahujících dané sloveso v daném významu, případně s označením zdroje příkladu, např. ČNK, SSJČ apod. Nepovinné atributy lexikální jednotky: • kontrola, viz odd. 5.1; • možný typ reflexivních konstrukcí, viz odd. 5.2; • možný typ recipročních konstrukcí, viz odd. 5.3; • příslušnost k syntakticko-sémantické třídě, viz odd. 5.4; • označení idiomu, viz odd. 5.5. 8 Pokud se daná lexikální jednotka vztahuje ke všem lemmatům uvedeným v záhlaví slovníkového hesla s výjimkou iterativa, žádné omezení se neuvádí. 18 4 Valenční rámce Nejdůležitější sémanticko-syntaktická charakteristika slovesa je zachycena ve formě valenčního rámce. Valenční rámec (v užším smyslu) ve FGP sestává z aktantů (obligatorních i fakultativních) a z obligatorních volných doplnění, v novějších studiích je pak obohacen o tzv. kvazivalenční doplnění. Ve VALLEXu se kromě členů takto pojímaného valenčního rámce uvádí i nevelké množství fakultativních volných doplnění (dále typická doplnění). S daným slovesem se mohou vyskytovat též ostatní volná doplnění, ta však nejsou ve valenčním rámci uváděna, nebot’ jejich výskyt není podle FGP podmíněn syntakticky. Klasifikaci valenčních doplnění tvořících obohacený valenční rámec ve VALLEXu je zde věnován oddíl 4.1. Ve VALLEXu jsou valenční rámce modelovány jako posloupnosti valenčních a nevalenčních pozic, kde každá pozice odpovídá jednomu valenčnímu, příp. typickému doplnění daného slovesa. Každá pozice je charakterizována: • funktorem, viz odd. 4.1; • seznamem možných morfematických forem, viz odd. 4.2; • informací o obligatornosti, viz odd. 4.3. Jistá volná doplnění se systematicky objevují společně. Tato pravidelnost je zachycena pomocí mechanismu expanze valenční či nevalenční pozice, viz odd. 4.4; plný valenční rámec se získá expanzí pozice uváděné ve slovníku. 4.1 Aktanty a volná doplnění Ve valenční teorii FGP se slovesná doplnění dělí na aktanty (vnitřní doplnění ve všech svých výskytech) a volná doplnění (viz zejména Panevová, 1974, 1980, 1994). Zkratky pro jednotlivé aktanty a volná doplnění se dále souhrnně označují jako funktory. Jednotlivé funktory ve VALLEXu tedy označují typ sémantickosyntaktického vztahu mezi slovesem a jeho doplněním. Aktanty jsou určovány převážně na základě syntaktických pravidel: • počet pozic pro aktanty je charakteristický pro každé sloveso a pro každé sloveso tedy musí být vymezen ve slovníku; • jako rozvití nějakého konkrétního slovesa se daný aktant vyskytuje nejvýše jednou (vyjma případů souřadnosti a apozice). Doplňme, že aktanty jsou doplnění typicky rekční. Empiricky bylo stanoveno pět aktantů: aktor (ACT), patient (PAT), výsledek děje (EFF), adresát (ADDR) a původ (ORIG). Zásady pro určování jednotlivých aktantů lze nalézt např. v Panevová – Skoumalová (1992), nově v Mikulová et al. (2005), kde je i jejich (zatím nejpodrobnější) charakteristika; zde je krátká charakteristika aktantů uvedena níže. Volná doplnění jsou na rozdíl od aktantů sémanticky distinktivní. Charakterizují je následující vlastnosti: • omezení na slučitelnost slovesa s volnými doplněními nemají podle FGP z velké části syntaktický charakter; • dané sloveso může být rozvíjeno jedním typem volného doplnění i více než jedenkrát. Volná doplnění (včetně typických forem) jsou popsána v Mikulová et al. (2005), níže uvádíme typické příklady. Dichotomie aktant – volné doplnění byla v novějších studiích obohacena o třetí typ tzv. kvazivalenčních doplnění (viz Panevová, 2003, Lopatková – Panevová, 2006), která jsou na hranici mezi aktanty 19 a volnými doplněními. Jde o doplnění rozvíjející relativně uzavřenou (sémanticky homogenní) třídu sloves, jsou to doplnění rekční a dané doplnění nelze u jednoho řídícího slovesa opakovat. Podobně jako volná doplnění jsou však sémanticky distinktivní a typicky se nejedná o doplnění obligatorní. Jde např. o záměr INTT u sloves pohybu (třídy motion a transport, odd. 5.4, např. Petr jel nakoupit, Maruška šla na jahody) či o překážku OBST (třída contact, např. zakopl o kořen, zachytil šálou o hřebík). Dále se ve VALLEXu uvádí nevelké množství fakultativních volných doplnění, která obvykle nespecifikují význam slovesa, ale typicky se vztahují k celé syntakticko-sémantické třídě sloves. Pro některá doplnění mají prototypickou formu (např. instrumentál pro způsob, psal perem, jel vlakem, či předložková skupina pro+4 pro benefaktiv, dělal to pro děti), jindy je jejich forma dána sémantikou příslušného doplnění (např. směrová doplnění DIR1, DIR2 a DIR3 u sloves pohybu, více viz odd. 4.2). Takováto doplnění se obvykle chápou jako doplnění nevalenční, ve VALLEXu se však uvádějí, protože tato informace může být s úspěchem využita při automatické analýze češtiny. Terminologická poznámka: Aktanty a obligatorní volná doplnění ve FGP víceméně odpovídají konstitutivním větným členům (obligatorním i potenciálním), typická a kvazivalenční doplnění odpovídají větným členům nekonstitutivním (viz Daneš, 1971, Daneš – Hlavsa, 1987, Grepl – Karlík, 1998). V termínech Mluvnice češtiny 3 (Daneš et al., 1987) odpovídají aktanty a obligatorní volná doplnění participantům intenčního pole. Dělení na aktanty a volná doplnění se také víceméně shoduje s dělením na argumenty a adjunkty podle Grepl – Karlík (1998), Karlík et al. (2002). Funktory označující typ sémanticko-syntaktického vztahu jsou blízké tzv. hloubkovým pádům/rolím C. J. Fillmora (např. Fillmore, 1969) či theta rolím podle N. Chomského (viz např. Chomsky, 1981, Jackendoff, 1990). Charakteristika aktantů • Aktor/konatel (funktor ACT). Valenční doplnění aktor je (levovalenční) aktant, který je vymezen jako první aktant slovesa – označuje doplnění zaplňující první syntaktickou pozici slovesa (např. maminka.ACT upekla koláč, voda.ACT naplnila jámu, kniha.ACT vyšla). V zásadě je to doplnění v pozici syntaktického subjektu u aktivní konstrukce (v případě pasivní konstrukce se jedná o doplnění se stejným sémantickým vztahem ke slovesu, např. nakladatelství.ACT Odeon vydalo knihu i kniha byla vydána nakladatelstvím.ACT Odeon). Jde o rozšířené pojetí konatele děje zahrnující jak činitele, tak i nositele stavu/děje a příbuzné sémantické role. Je-li jeden z aktantů vyjádřen dativní formou (a druhý nominativní formou), přihlíží se též k sémantice aktantu. Vyjadřuje-li aktant s dativní formou proživatele, hodnotí se tento aktant jako aktor (a aktant v nominativu jako patient) (např. kniha se mi.ACT líbila). • Patient (funktor PAT). Valenční doplnění patient je (pravovalenční) aktant, který je vymezen jako druhý aktant slovesa – označuje doplnění zaplňující druhou syntaktickou pozici slovesa (např. Marie postavila vázu.PAT na stůl, maminka upekla koláč.PAT, kniha patří Janovi.PAT, obraz.PAT se mi nelíbil, vzdal se odměny.PAT, učil se zahradníkem.PAT, vyprávěl nám o dovolené.PAT ). V zásadě je to doplnění v pozici přímého (syntaktického) objektu u aktivní konstrukce (v případě pasivní konstrukce se jedná o doplnění se stejným sémantickým vztahem, např. nakladatelství Odeon vydalo knihu.PAT, kniha.PAT byla vydána nakladatelstvím Odeon). Jde o rozšířené pojetí předmětu zasaženého dějem. • Výsledek děje, efekt (funktor EFF). Valenční doplnění efekt je (pravovalenční) aktant, který se uplatňuje u sloves se třemi (a více) syntaktickými pozicemi. Funktor EFF je přiřazován zejména doplněním obsazujícím třetí syntaktickou pozici u sloves, která odpovídá jednak tzv. doplňku u sloves neplnovýznamových (viz též Šmilauer, 1966),9 jednak jde o druhý věcný předmět sémanticky se blížící výsledku děje. Obecně vyjadřuje vlastnost nebo stav, které má doplnění s funktorem PAT za 9 Doplněk doplňovací v prvním vydání Novočeské skladby (Šmilauer, 1947). 20 jistého děje nebo které se mu jistým dějem přisuzují (např. považoval Pavla za odborníka.EFF, jmenovali ho ředitelem.EFF, my tomu říkáme efekt.EFF sněhové koule, Petr přeložil knihu do češtiny.EFF, svazovali kmeny do voru.EFF ). • Adresát (funktor ADDR). Valenční doplnění adresát je (pravovalenční) aktant, který je vymezen jako aktant slovesa typicky vyjadřující roli příjemce děje (např. dal dceři.ADDR k narozeninám knížku, řekl synovi.ADDR pravdu, bratrovi.ADDR nezaplatili dohodnutou mzdu, celé dětství soupeřil o matčinu přízeň s bratrem.ADDR ). Funktor ADDR se uplatňuje u sloves se třemi (a více) syntaktickými pozicemi. Jeho typickým rysem je životnost. Prototypicky jde o doplnění v pozici nepřímého objektu (např. předal knihu Janovi.ADDR, kniha byla předána Janovi.ADDR ). • Původ (funktor ORIG). Valenční doplnění původu je (pravovalenční) aktant, který je vymezen jako aktant slovesa vyjadřující roli původu (např. vyrábějí ze dřeva.ORIG stoly i židle, slyšel o neštěstí od sousedů.ORIG, nevzal od něj.ORIG za práci peníze). Funktor ORIG se uplatňuje u sloves se třemi (a více) syntaktickými pozicemi. Poznámka: Podle valenční teorie FGP, viz zejména Panevová (1974, 1980), platí pro určování funktorů následující princip, který je označován jako princip posouvání (shifting): pokud má sloveso jediný aktant, jde o aktor, sloveso se dvěma aktanty má vždy aktor a patient; teprve u sloves se třemi a více aktanty přistupují při výběru funktoru sémantická kritéria. Funktory ve VALLEXu. V následujícím výčtu jsou shrnuty funktory, které se v tomto slovníku vyskytují. Pro úplnost zde uvádíme všechny funktory pro volná doplnění s alespoň jedním výskytem ve VALLEXu bez ohledu na to, zda jsou v konkrétních příkladových větách příslušná doplnění valenční, nebo zda jde pouze o doplnění typická, tedy nevalenční. Aktanty: (aktor): Petr čte dopis. PAT (patient): Potkal jsem bratra. • • ACT • • (výsledek děje, efekt): Jmenovali ho ředitelem. ADDR (adresát): Petr dal Marii knihu. • ORIG EFF (původ): Upekla z jablek koláč. Kvazivalenční doplnění: (rozdíl): Hodnota akcií stoupla o 100 %. INTT (záměr): Přišel navštívit Janu. • • DIFF • OBST (překážka): Chlapec zakopl o kořen. Volná doplnění (abecedně): (doprovod): Matka tam šla s dětmi. • ACMP • • AIM • • (příčina): Petr pro nemoc končí s prací. COMPL (doplněk): Pracoval jako učitel. • • (kritérium): Třídili diamanty podle velikosti. DIR1 (směr – odkud): Přišel z lesa promočený. • DIR2 (účel): Jan šel do pekárny pro chléb. BEN (benefaktiv): Připravila snídani pro děti. CAUS CRIT (směr – kudy): Vydal se do sousední vesnice přes les. 21 (směr – kam): Vydal se do sousední vesnice přes les. • DIR3 • • DPHR • • (dědictví): Pojmenovali nejstaršího syna po otci. LOC (místo): Narodil se v Itálii. • • MANN • • RCMP • • (substituce): Startoval za Slávii. TFHL (čas – na jak dlouho): Přerušil studium na rok. • • TFRWH • • (čas – na kdy): Odložili zkoušku z pondělka na úterý. TSIN (čas – od kdy): Lhůtu počítáme od okamžiku dodání. • TTIL • TWHEN (závislá část frazému): Novináři ho neustále chytali za slovo. EXT (míra): Tatínek měřil 2 metry. HER (způsob): Choval se k ní laskavě. MEANS (prostředek): Napsal dopis rukou. (náhrada): Koupila si nové tričko za 350 Kč. REG (zřetel): Situace se v tomto ohledu výrazně zlepšila. SUBS (čas – ze kdy): Jeho špatné vzpomínky pocházejí právě z tohoto období. THL (čas – jak dlouho): Strávili jsme tam tři týdny. TOWH (čas – do kdy): Potrvá to do večera. (čas – kdy): Babička přijde zítra. Poznámka: Kromě těchto funktorů se ve VALLEXu vyskytuje ještě hodnota DIR. Ta je však užívána jen v souvislosti s expanzí pozice valenčního rámce, viz odd. 4.4. Množina funktorů, se kterými se pracuje ve FGP a která je využita v PDT, je bohatší, viz např. Mikulová et al. (2005). Některé z těchto funktorů se však nevyskytují u slovesných doplnění (např. MAT – partitiv, jako ve spojení sklenice piva.MAT ), jiné funktory specifikují vztahy, které nejsou závislostní (např. koordinaci, Petr nebo.DISJ Marie). Další funktory reprezentují závislostní vztahy u sloves, nemají však nikdy valenční povahu (např. ATT – postoj, udělal to dobrovolně.ATT ). 4.2 Morfematické vyjádření Každá valenční i nevalenční pozice může být ve větě vyjádřena omezenou množinou výrazových prostředků, morfematických forem. Ve VALLEXu je množina možných forem specifikována bud’ explicitně, nebo implicitně. U explicitně zachycených forem jsou možné morfematické formy dány výčtem u dané pozice valenčního rámce (dolní index u příslušného funktoru). U aktantů a kvazivalenčních doplnění je tento seznam forem úplný (udávají se formy pro užití slovesa v aktivním tvaru) – jiné prostředky nelze pro vyjádření těchto valenčních doplnění užít.10 V případě volných doplnění jsou explicitně uvedené formy pro dané sloveso pouze typické, lze užít i další formy dané sémantikou doplnění. U implicitně zachycených forem se předpokládá, že množina možných forem je dána sémantikou doplnění, tedy vyplývá z příslušného funktoru. Jinými slovy, doplnění se může realizovat jakoukoliv formou vyjadřující daný typ doplnění; její výběr je ovšem závislý na lexikálním obsazení a kontextových podmínkách, např. bydlí na kopci vs. ve vesnici, napsal dopis rukou vs. na počítači. Explicitně zachycené formy. Seznamy morfematických forem, které se mohou vyskytnout u jednotlivých valenčních pozic, sestávají z následujících typů hodnot: 10 Zcela stranou jsou však ponechány formy, které jsou dány gramatickými pravidly, např. pasivizací nebo reciproční konstrukcí, a dále formy pro partitiv (dodat sůl – dodat soli), distributivnost (rozdal jim jablíčka – rozdal jim po jablíčku) či méně přesnou kvantifikaci (přišlo padesát lidí – přišlo na padesát lidí, přišlo okolo padesáti lidí). 22 • Bezpředložkové pády. Jednotlivé pády jsou označeny příslušnými číslicemi: 1 – nominativ, 2 – genitiv, 3 – dativ, 4 – akuzativ, 5 – vokativ, 7 – instrumentál. • Předložkové skupiny. Jsou určeny lemmatem předložky (v její nevokalizované podobě) a číslem pádu (např. z+2, na+4, o+6, . . . ). Ve VALLEXu se vyskytují následující předložky: bez, do, jako,11 k, kolem, mezi, místo, na, nad, o, od, po, pod, podle, pro, proti, před, přes, při, s, u, v, z, za. • Infinitivní konstrukce. Značka inf reprezentuje valenční doplnění ve formě infinitivu slovesa (ve vzácných případech též se spojkou než+inf). • Závislé věty. Závislé věty obsahové uvozené podřadicí spojkou jsou reprezentovány lemmatem této spojky; ve VALLEXu se vyskytují následujícíci spojky: aby, at’, až, jak, zda,12 že. Závislé věty obsahové, které nejsou uvozeny spojkami (např. nepřímé otázky uvozené tázacím zájmenem nebo adverbiem), jsou reprezentovány zkratkou cont. • Konstrukce s adjektivy. Zkratka adj-číslice specifikuje doplnění ve formě přídavného jména v příslušném pádu (např. adj-1 pro cítím se slabý). • Konstrukce s být. Infinitiv slovesa být se může vyskytnout v konstrukci s adjektivem či v bezpředložkovém pádu (např. být+adj-1 pro zdá se to být dostatečné). • Část frazému. U frazeologických jednotek platí, že pokud je množina lexikálních forem, které naplňují určitou valenční pozici, omezená (často jednočlenná), jsou ve VALLEXu uvedeny přímo tyto lexikální formy (např. napospas pro frazém ponechat napospas). Implicitně zachycené formy. Pokud není pro valenční pozici explicitně určena možná forma doplnění, potom množina možných forem vyplývá z funktoru pro toto doplnění. Následující výčet udává formy obvyklé pro dané funktory (seznam vychází z nejčastějších forem pro jednotlivé funktory v PDT). • • ACMP: bez+2, s+7, společně s+7, spolu s+7, v čele s+7, v souvislosti s+7, ve spojení s+7, včetně+2, . . . ; • • BEN: 3, na+4, na účet+2, na úkor+2, na vrub+2, pro+4, proti+3, v+4, ve prospěch+2, v rozporu s+7, v zájmu+2, . . . ; AIM: aby, at’, do+2, k+3, na+4, o+4, pro+4, pro případ+2, proti+3, v zájmu+2, za+4, za+7, že, . . . ; CAUS: 7, aby, adverb, díky+3, jelikož, ježto, kvůli+3, na+4, na+6, na základě+2, nad+7, následkem+2, od+2, pod+7, pod náporem+2, pod tíhou+2, pod váhou+2, poněvadž, pro+4, protože, v+6, v důsledku+2, v souvislosti s+7, vinou+2, vlivem+2, vzhledem k+3, z+2, z důvodu+2, za+4, za+7, zásluhou+2, že, . . . ; • CRIT: 2, 7, dle+2, na+6, na základě+2, po vzoru+2, podle+2, přiměřeně+3, v+6, v duchu+2, v rozporu s+7, v souladu s+7, v souhlase s+7, v závislosti na+6, ve shodě s+7, ve smyslu+2, ve světle+2, z titulu+2, . . . ; • DIR1: adverb, od+2, s+2, z+2, ze strany+2, zpod+2, zpoza+2, zpřed+2, . . . ; • • DIR2: 7, adverb, cestou+2, kolem+2, mezi+7, napříč+7, po+6, podél+2, přes+4, skrz+4, v+6, . . . ; DIR3: 7, adverb, do+2, do čela+2, k+3, kolem+2, mezi+4, mimo+4, na+4, na+6, nad+4, naproti+3, okolo+2, po+4, po+6, pod+4, proti+3, před+4, přes+4, směrem do+2, směrem k+3, směrem na+4, v+4, vedle+2, za+4, za+7, . . . ; • • EXT: 2, 4, 7, adverb, do+2, k+3, kolem+2, na+4, na+6, nad+4, okolo+2, po+6, pod+7, přes+4, v+4, z+2, za+4, . . . ; LOC: adverb, blízko+2, blízko+3, daleko+2, do+2, kolem+2, mezi+7, mimo+4, na+4, na+6, na úroveň+2, nad+7, naproti+3, nedaleko+2, okolo+2, po+6, poblíž+2, pod+7, podél+2, proti+3, před+7, přes+4, při+6, stranou+2, u+2, uprostřed+2, uvnitř+2, v+6, v čele+2, v oblasti+2, v rámci+2, v řadě+2, vedle+2, za+4, za+7, . . . ; • MANN: 7, adverb, do+2, formou+2, na+4, na+6, nad+4, o+4, po+6, pod+7, proti+3, před+7, při+6, přes+4, s+7, v+4, v+6, v podobě+2, ve formě+2, vedle+2, z+2, za+4, za+7, jak, že, . . . ; • MEANS: 7, adverb, cestou+2, díky+3, do+2, na+4, na+6, o+6, po+6, pod+7, pomocí+2, prostřednictvím+2, přes+4, s+7, s pomocí+2, skrz+2, v+6, z+2, za+4, za pomoci+2, že, . . . ; 11 Slovo jako je sice tradičně považováno za spojku, zde je však zahrnuto mezi předložkami, nebot’ konkrétní valenční doplnění uvozené touto spojkou vyžaduje vždy určitý pád substantiva. 12 Spojka zda reprezentuje též spojku jestli. 23 • REG: 7, adverb, bez ohledu na+4, bez zřetele k+3, k+3, kolem+2, na+4, na+6, na téma+2, nad+7, nezávisle na+6, o+6, ohledně+2, po+6, pro+4, před+7, při+6, s+7, s ohledem na+4, se zřetelem k+3, se zřetelem na+4, u+2, v+6, v otázce+2, v případě+2, v rámci+2, v souvislosti s+7, ve věci+2, ve vztahu k+3, vůči+3, vzhledem k+3, z+2, z hlediska+2, za+4, . . . ; • SUBS: jménem+2, místo+2, namísto+2, výměnou za+4, za+4, . . . ; • • TFHL: adverb, do+2, na+4, po+2, pro+4, . . . ; TFRWH: od+2, z+2, . . . ; THL: 2, 4, 7, adverb, až, dokud, do+2, na+4, po+4, po dobu+2, přes+4, v+2, za+4, . . . ; • • TOWH: adverb, do+2, k+3, na+4, pro+4, . . . ; • TSIN: adverb, od+2, počínaje+7, z+2, . . . ; • • TTILL: adverb, do+2, dokud, k+3, než, po+4, . . . ; TWHEN: 2, 4, 7, adverb, až, do+2, jakmile, k+3, když, kolem+2, koncem+2, mezi+7, na+4, na+6, na závěr+2, než, o+6, okolo+2, po+6, počátkem+2, postupem+2, poté co, před+7, předtím než, při+6, s+7, u příležitosti+2, v+4, v+6, v době+2, v období+2, v průběhu+2, v závěru+2, z+2, za+2, za+4, začátkem+2, . . . 4.3 Atribut obligatornosti slovesného doplnění Ve VALLEXu se v souladu s valenční teorií FGP slovesná doplnění dělí na obligatorní a fakultativní. Obligatorností se rozumí povinná přítomnost daného doplnění v hloubkové (tektogramatické) struktuře, a to bez ohledu na jeho možnou povrchovou vypustitelnost ve větě, viz poznámku níže. Jako kritérium obligatornosti byl stanoven dialogový test (viz Panevová, 1974, Sgall et al., 1986). Tento test slouží pro určení obligatornosti doplnění, je-li zkoumaný člen v povrchové větě vypuštěn – např. test obligatornosti doplnění směru-kam (funktor DIR3) pro sloveso přijít simuluje dialog mluvčího A a B: A: Přátelé už přišli. B: Kam? A: *Nevím. Odpověd’ mluvčího A činí dialog deviantní (A musí vědět, o jakém místě mluví) – sloveso přijít má tedy obligatorní doplnění DIR3. Opozice obligatornosti a fakultativnosti se týká aktantů, kvazivalenčních doplnění i volných doplnění. Poznámka: Některá doplnění obligatorní na rovině významové stavby mohou být vypuštěna (elidována) v povrchové realizaci věty, aniž dojde k porušení gramatičnosti věty (lze říci, že dané doplnění má nulovou lexikální realizaci). K takové elipse dochází tehdy, je-li možné příslušný aktant či volné doplnění snadno doplnit z kontextu, např. Děti už přišly (= na místo dané kontextem/sem.DIR3) a jsou celé promrzlé (= děti.ACT), případně pokud je daná pozice realizována nějakým typem všeobecného aktantu, např. Do této buchty se dává sůl, Psali to v novinách (= všeobecný aktor), viz Daneš (1971), Panevová – Řezníčková (2001). U každé pozice valenčního rámce je ve VALLEXu kódována informace o obligatornosti či fakultativnosti daného doplnění. Obligatorní doplnění (aktanty, kvazivalenční i volná doplnění) jsou tištěna zvýrazněným písmem. Stejným písmem jsou tištěny i fakultativní aktanty a kvazivalenční doplnění (patří též do úzce chápaného valenčního rámce), ty jsou navíc odlišeny značkou opt v horním indexu. Typická volná doplnění, která rozšiřují tradiční valenční rámec, jsou tištěna obyčejným písmem a označena horním indexem typ. 4.4 Expanze valenční pozice Jistá volná doplnění se systematicky objevují společně. Např. slovesa pohybu lze často rozvíjet všemi typy směrových doplnění, tedy DIR1 (směr-odkud), DIR2 (směr-kudy) a DIR3 (směr-kam). Tato pravidelnost je zachycena pomocí mechanismu expanze pozice valenčního rámce. Pokud je u některé pozice uveden symbol pro expanzi ↑ před funktorem, je plný valenční rámec získán expanzí dané pozice rámce. 24 Ve VALLEXu se symbol pro expanzi ↑ vyskytuje u funktorů popsána následujícími pravidly: DIR, DIR1, DIR2, DIR3 a THL, expanze je • ↑DIRtyp → DIR1typ DIR2typ DIR3typ Typické doplnění ↑DIR expanduje ve tři typická doplnění DIR1, DIR2 a DIR3; např. rámec pro sloveso jít vznikne následující expanzí: opt ACT1 INTTk+3,na+4,in f MANNtyp MEANStyp ↑DIRtyp → typ MEANStyp DIR1typ DIR2typ DIR3typ → ACT1 INTTopt k+3,na+4,in f MANN (Petr.ACT jel nakoupit.INTT autem.MEANS z domova.DIR1 přes celou Prahu.DIR2 do Makra.DIR3 ) Obdobně i pro další typy expanze: • ↑DIR1 → DIR1 DIR2typ DIR3typ Doplnění ↑DIR1 expanduje v obligatorní doplnění DIR1 a typická DIR2 a DIR3. • ↑DIR2 → DIR2 DIR1typ DIR3typ Doplnění ↑DIR2 expanduje v obligatorní doplnění DIR2 a typická DIR1 a DIR3. • ↑DIR3 → DIR3 DIR1typ DIR2typ Doplnění ↑DIR3 expanduje v obligatorní doplnění DIR3 a typická DIR1 a DIR2. • ↑THL→ TSINtyp THL TTILtyp Doplnění ↑THL expanduje ve tři typická doplnění TSIN, THL a TTILL; např. rámec pro sloveso trvat vznikne následující expanzí: opt opt ACT1 PAT3 ↑THL → ACT1 PAT3 THL TSINtyp TTILtyp (Práce na novém obraze.ACT mu.PAT trvala půl roku.THL od jara.TSIN až do konce října.TTILL) 5 Doplňující syntaktické informace Jednotlivé LU mohou být obohaceny o nepovinné, doplňující syntaktické, případně syntakticko-sémantické informace, které s valencí souvisejí jen volně. Ve VALLEXu je zachycena kontrola (odd. 5.1), reflexivita (odd. 5.2) a reciprocita (odd. 5.3) – jde o gramatické jevy, které přímo ovlivňují povrchové projevy valence. Dále se u vybraných LU uvádí jejich zařazení do syntakticko-sémantické třídy (odd. 5.4), které umožňuje zkoumat, jak se sémantická blízkost sloves odráží v jejich valenčních vlastnostech, a příznak pro idiom (odd. 5.5), nebot’ frazémy a idiomy často vykazují specifické valenční chování. 5.1 Kontrola Termínem kontrola (značka control) se v tomto kontextu rozumí vlastnost některých sloves (tzv. sloves kontroly) vyžadovat koreferenci mezi svým valenčním doplněním (,controller‘) a valenčním doplněním podřízeného slovesa (,controllee‘), viz Panevová (1996). Ve VALLEXu je tento vztah zaznamenán pouze pro slovesa, která mohou mít doplnění ve formě infinitivu (bez ohledu na jeho funktor). Za kontrolovaný člen (controllee) je pak považován subjekt tohoto infinitivu (který se v povrchové podobě věty v češtině nevyjadřuje), kontrolující člen (controller) je výraz s ním koreferenční, typicky člen valenčního rámce řídícího slovesa kontroly. Ve VALLEXu je kontrola zachycena v atributu control následujícím způsobem: • koreferenční vztah mezi (nevyjádřeným) subjektem infinitivu a jedním z členů valenčního rámce řídícího slovesa kontroly – atribut control má hodnotu funktoru tohoto valenčního doplnění; • ostatní případy (tj. pokud takový člen valenčního rámce řídícího slovesa neexistuje) – atribut control má hodnotu ex. Příklady: • pokusit se (např. Jiří.ACT se pokusí přijít) – control: ACT; 25 • slyšet (např. děti.ACT slyší někoho.PAT přicházet.EFF ) – control: PAT; • doporučit (např. doporučili mu.ADDR jít.PAT k lékaři) – control: ADDR; • jít (např. jde to udělat, ve smyslu lze to udělat) – control: ex. 5.2 Reflexivita Nepovinný atribut reflexivity (značka rfl) udává možnou syntaktickou funkci reflexivního morfému se/si, který je v češtině (kromě jiného, viz poznámku níže) formálním prostředkem pro vyjádření následujících syntaktických konstrukcí: • sekundární diateze: částice se je součástí reflexivní formy slovesné (viz Karlík et al., 2002), a tedy součástí tvaru tzv. reflexivního pasiva: – pro tranzitivní slovesa (slovesa s akuzativní vazbou) (např. připravovat – plány se připravují, bojovat – bojovala se těžká bitva); atribut rfl má hodnotu pass; – pro intranzitivní slovesa (např. pátrat – pátrá se po zloději, chodit – v neděli se chodí do kostela, bojovat – s nepřáteli se nakonec nebojovalo); atribut rfl má hodnotu pass0; • gramatická koreference: zájmeno se/si zaujímá pozici valenčního doplnění, které je koreferenční se jménem v subjektu a vyjadřuje, že subjekt vykonává děj sám na sobě; jde o tzv. vlastní reflexiva: – je-li příslušná valenční pozice zaplňovaná doplněním s akuzativní formou (a jde tedy o formu zájmena se), má atribut rfl hodnotu cor4 (např. mýt se (= sebe), vidět se (= sebe), darovat se (= sebe), kde se je patient (PAT) koreferující s aktorem (ACT) řídícího slovesa mýt, vidět a darovat); – pro valenční doplnění s dativní formou (a tedy formou zájmena si) má atribut rfl hodnotu cor3 (např. darovat si (dort) (= sám sobě), kde si je adresát (ADDR) řídícího slovesa darovat koreferující s aktorem (ACT) tohoto slovesa). VALLEX se omezuje na zachycení případů, kdy zájmeno se/si zaplňuje pozici aktantu s akuzativní nebo dativní formou.13 Poznámka: Atribut reflexivity se netýká případů, kdy je morfém se/si součástí slovesného lemmatu (tyto případy jsou popsány v odd. 2.1) nebo kdy je se/si příznakem reciprocity (těm je věnován následující odd. 5.3). 5.3 Reciprocita Reciprocitou se rozumí možnost vyjádření vztahu vzájemnosti mezi dvěma (či více) valenčními doplněními, přičemž vztah mezi těmito doplněními je symetrický (doplnění přitom splňují jisté sémantické podmínky), viz Karlík et al. (2002). Pokud je do vztahu reciprocity zapojen aktor (ACT), užívá se reflexivní (zvratné) sloveso, reciproční doplnění se potom vyjadřují jako koordinované členy podmětu (Petr a Marie se hádali) nebo podmět plurálový (přátelé se navštěvují); reciprocita může být zdůrazněna příslovci spolu, navzájem apod. Pokud do vztahu reciprocity není zapojen aktor (ACT), reciproční vztah typicky vyplývá z koordinace či plurálové formy doplnění (např. seznámil je, seznámil Jana a Marii), konstrukce může být opět zdůrazněna příslovci spolu, navzájem apod. Možnost recipročního užití je ve VALLEXu vyznačena v atributu reciprocity (značka rcp), jehož hodnotou jsou dvojice, příp. trojice funktorů identifikující doplnění, která mohou vstupovat do vztahu reciprocity 13 VALLEX tedy nepokrývá případy, kdy se zájmeno se/si může vyskytovat v jiném pádu (např. praštil sebou o postel) či v předložkové skupině (např. ode dneška děláme na sebe.PAT, nechali si to u sebe.LOC ). 26 (např. ACT-ADDR pro hádat se – neustále se spolu hádali, ACT-ADDR-PAT pro mluvit – mluví spolu o sobě (navzájem)). V případě odvozených reflexiv (viz odd. 2.1), která je možno klasifikovat jako inherentně reciproční varianty slovesa, typicky s obligatorním doplněním s formou s+7 (viz Panevová, 2007; Panevová – Mikulová, 2007), je ve VALLEXu uváděna reciprocita u nereflexivního i reflexivního lexému. VALLEX se omezuje na zachycení případů reciprocity, do které vstupují aktanty a obligatorní volná doplnění. 5.4 Syntakticko-sémantické třídy Část lexikálních jednotek (2 903 z celkového počtu 6 460, tedy přibližně 45 % všech lexikálních jednotek) má určenu syntakticko-sémantickou třídu (značka class). Tyto třídy byly budovány striktně ,zdola nahoru‘ – seskupováním lexikálních jednotek s podobnými syntaktickými vlastnostmi, přičemž se přihlíželo k jejich sémantice. Zdůrazněme zde, že syntakticko-sémantické třídy jsou tvořeny jednotlivými lexikálními jednotkami, nikoliv celými lexémy – víceznačný lexém se tedy může vyskytovat v několika třídách. Bylo vytvořeno následujících 22 syntakticko-sémantických tříd: (23 LU), např. nominovat, určovat (ve smyslu určovala své zástupce), ustanovovat, . . . ; • appoint verb • • (43 LU), např. hýbat (hýbat pravou rukou), mávat, vrhat, . . . ; combining (96 LU), např. míchat (míchat žloutky s moukou v těsto), přidávat, spojovat, . . . ; • • communication cause motion (364 LU), např. číst, hovořit, nařizovat, . . . ; contact (115 LU), např. dotýkat se, narážet, tisknout, . . . ; (22 LU), např. pouštět (ve smyslu tričko pouštělo barvu), vysílat (ve významu vysílat signály), . . . ; • exchange (177 LU), např. dávat, dostávat, měnit, platit, pronajímat, . . . ; 14 • emission • • expansion • • change • • location • • modal verb14 (15 LU), např. dovést (ve smyslu dovede plavat), chtít, moci, smět, . . . ; motion (309 LU), např. běžet, dorážet, hýbat se (Nehýbej se!), . . . ; • perception • • phase of action • • providing (19 LU), např. pronikat, šířit, . . . ; extent (20 LU), např. činit (ve smyslu činí to 30 Kč), dosahovat, vycházet (ve smyslu boty vycházejí na tisíc korun), . . . ; (318 LU), např. budovat, klesat (ve smyslu teplota prudce klesala), proměňovat, růst, . . . ; intervention (10 LU), např. zasahovat, mluvit (do toho nemůžu mluvit), . . . ; (399 LU), např. doplňovat (doplňovat zboží do regálu), nacházet, shromažd’ovat, . . . ; mental action (304 LU), např. cítit se (ve smyslu cítit se dobře), jásat, mrzet, . . . ; (104 LU), např. hledět, pamatovat, všímat si, . . . ; (80 LU), např. končit (přednáška končí v 5 hodin), vrcholit, vznikat, . . . ; phase verb (76 LU), např. iniciovat, končit (končit školu), najet (ve smyslu najeli aspoň 500 mil), . . . ; (51 LU), např. naplnit (ve smyslu naplnit vanu vodou), vybavovat, . . . ; psych verb (83 LU), např. klamat, potěšit, (ve smyslu potěšila ho dárkem, dárek ho potěšil), . . . ; Ve zpracování modálních sloves, která jsou na pomezí gramatiky a lexika, se VALLEX odchyluje od teorie FGP. Ve FGP jsou modální slovesa muset, mít, chtít, hodlat, moci, dát se, smět, dovést a umět zachycena pomocí gramatémů u významových sloves (nemají tedy valenční rámec). Naproti tomu ve VALLEXu jsou kvůli úplnosti a lexikální proměnlivosti pro modální význam těchto sloves vyčleněny LU, nejsou však zachyceny všechny jejich syntaktické zvláštnosti. Protože některá z těchto sloves jsou víceznačná (např. mít je modální v užití Jan má připravit večeři, ale plnovýznamové v užití Jan má spoustu peněz), mohou být popsána v několika LU. 27 (86 LU), např. potkávat se (potkává se s přáteli v baru), spojovat (spojím se s ním co nejdříve), souhlasit, . . . ; • transport (189 LU), např. donášet, přemist’ovat/přemíst’ovat, shrnovat, . . . • social interaction Upozorňujeme, že toto rozdělení lexikálních jednotek do syntakticko-sémantických tříd je pouze pracovní a nelze je považovat za klasifikaci splňující požadavky dobře definované ontologie. Je zřejmé, že takto hrubé rozdělení není syntakticky ani sémanticky homogenní, jde o základní vymezení skupin sloves, které je potřeba dále podrobně studovat. Motivací pro tuto předběžnou klasifikaci lexikálních jednotek byla skutečnost, že i takovéto pracovní třídění zachycuje vztahy mezi slovesy a díky tomu usnadňuje kontroly konzistence slovníku a dovoluje formulovat obecnější pozorování týkající se slovníkových dat. 5.5 Frazémy a idiomy Při vytváření slovníku VALLEX byl kladen důraz především na úplné pokrytí primárních a obvyklých významů sloves. Zároveň bylo zpracováno mnoho lexikálních jednotek popisujících okrajová a idiomatická užití sloves; jejich pokrytí však není (a nemůže být) úplné. Takové lexikální jednotky jsou odlišeny značkou idiom za číslem lexikální jednotky. Idiomatická užití sloves jsou taková ustálená užití, která jsou pracovně charakterizována bud’ podstatným posunem ve významu (vzhledem k primárnímu významu, např. přišel o hodinky), omezenou, obvykle velmi malou množinou možných lexikálních hodnot, kterých můžou jejich doplnění nabývat (např. brát roha, mráz mi z toho běhal po zádech), nebo jinými nepravidelnostmi a anomáliemi. Poznámka: Metaforické užití slovesa – pokud nedošlo k jeho výrazné lexikalizaci – je obvykle pokryto lexikální jednotkou pro primární význam slovesa (například po městě šla řeč, že se budeš stěhovat je řazeno do lexikální jednotky slovesa jít popisující význam ,pohybovat se po vlastních nohou; přemíst’ovat se chůzí‘). 29 Seznam značek biasp class cont control cor3 cor4 ČNK ex idiom impf inf iter jen opt pass pass0 PDT pf př. rcp rfl SSČ SSJČ typ obouvidové sloveso (viz odd. 2.2) syntakticko-sémantická třída (viz odd. 5.4) závislá věta obsahová (viz odd. 2) atribut kontroly (viz odd. 5.1) gramatická koreference s dativní formou (viz. odd. 5.2) gramatická koreference s akuzativní formou (viz. odd. 5.2) příklad pochází z Českého národního korpusu (Blatná – Čermák, 2005) hodnota atributu kontrola (viz odd. 5.1) idiomatická lexikální jednotka (viz odd. 5.5) nedokonavé sloveso (viz odd. 2.2) infinitiv (viz odd. 2) iterativní sloveso (viz odd. 2.2) omezení lemmat, která reprezentují lexikální jednotku (viz odd. 2.2, 2.3) fakultativní valenční nebo kvazivalenční doplnění (viz odd. 4.3) sekundární diateze u tranzitivního slovesa (viz. odd. 5.2) sekundární diateze u intranzitivního slovesa (viz. odd. 5.2) příklad pochází z Pražského závislostního korpusu (Hajič et al., 2006) dokonavé sloveso (viz 2.2) příklad užití lexikální jednotky možné typy recipročních konstrukcí (viz 5.3) možné typy reflexivních konstrukcí (viz 5.2) příklad pochází ze Slovníku spisovné češtiny pro školu a veřejnost (Mejstřík, 2003) příklad pochází ze Slovníku spisovného jazyka českého (Havránek, 1964) typické volné doplnění (viz odd. 4.3) Poznámka: Neopakujeme zde znovu výčty hodnot funktorů (uvedeno v odd. 4.1) a syntakticko-sémantických tříd (uvedeno v odd. 5.4). 31 Seznam literatury A PRESJAN, J. D. Eksperimental´noje issledovanije semantiki russkogo glagola. Moskva, Nauka, 1967. BABKO -M ALAYA, O. et al. Proposition Bank II: Delving Deeper. In M EYERS, A. (ed.) HLT-NAACL 2004 Workshop: Frontiers in Corpus Annotation, s. 17–23, Boston, USA, 2004. B LATNÁ, R. – Č ERMÁK, F. (ed.). Jak využívat Český národní korpus. Praha, Nakladatelství Lidové noviny, 2005. B OGUSLAVSKY, I. – I OMDIN, L. – S IZOV, V. Multilinguality in ETAP-3: Reuse of Lexical Resources. In Proceedings of PostCOLING Workshop on Multilingual Linguistic Resources, 2004. B OND, F. – S HIRAI, S. Practical and Efficient Organization of a Large Valency Dictionary. In Proceedings of the 4th Natural Language Processing Pacific, Phuket, Thailand, 1997. C HOMSKY, N. Lectures on Government and Binding. Dordrecht, Foris, 1981. C INKOVÁ, S. From PropBank to EngValLex. In Proceedings of the Fifth International Conference on Language Resources and Evaluation (LREC 2006), s. 2170–2175. ELRA, 2006. C RUSE, D. A. Lexical Semantics. Cambridge, Cambridge University Press, 1986. DANEŠ, F. Větné členy obligatorní, potenciální a fakultativní. Miscellanea Linguistica. 1971, s. 131–138. DANEŠ, F. Věta a text. Praha, Academia, 1985. DANEŠ, F. The Sentence-Pattern Model of Syntax. In L UELSDORFF, P. A. (ed.) The Prague School of Structural and Functional Linguistics, s. 197–221. Philadelphia, John Benjamins Publishing Company, 1994. DANEŠ, F. – H LAVSA, Z. Větné vzorce v češtině. Praha, Academia, 1987. DANEŠ, F. – G REPL, M. – H LAVSA, Z. (ed.). Mluvnice češtiny 3. Praha, Academia, 1987. D ORR, B. J. et al. LCS Verb Database, Online Software Database of Lexical Conceptual Structures and Documentation. Technical report, University of Maryland, 2001. D OWTY, D. Word meaning and Montague grammar. The semantics of verbs and times in Generative Semantics and in Montague’s PTQ: Synthese Language Library. Dordrecht, Reidel, 1979. E LLSWORTH, M. et al. PropBank, SALSA, and FrameNet: How Design Determines Product. In Proceedings of the Fourth International Conference on Language Resources and Evaluation (LREC 2004), Workshop on Building Lexical Resources from Semantically Annotated Corpora, Lisbon, 2004. E RK, K. et al. Towards a Resource for Lexical Semantics: A Large German Corpus with Extensive Semantic Annotation. In Proceedings of ACL-03, Sapporo, Japan, 2003. F ILIPEC, J. – Č ERMÁK, F. Česká lexikologie. Praha, Academia, 1985. F ILLMORE, C. J. The Case for Case. In BACH, E. – H ARMS, R. T. (ed.) Universals in Linguistic Theory, s. 1–88. New York, Holt, Rinehart and Winston, 1968. F ILLMORE, C. J. Types of lexical information. In K IEFER, F. (ed.) Studies in syntax and semantics, s. 109–137. New York, Kluwer Academic Publishers, 1969. F ILLMORE, C. J. FrameNet and the Linking between Semantic and Syntactic Relations. In T SENG, S.-C. (ed.) Proceedings of COLING 2002, s. xxviii–xxxvi. Howard International House, 2002. F ILLMORE, C. J. – BAKER, C. – S ATO, H. Seeing Argumens through Transparent Structures. In RODRÍGUEZ, M. G. – A RAUJO, C. P. S. (ed.) Proceedings of the Third International Conference on Language Resources and Evaluation (LREC 2002), s. 787–791. ELRA, 2002. G REPL, M. – K ARLÍK, P. Skladba češtiny. Olomouc, Votobia, 1998. H AJI Č, J. Complex Corpus Annotation: The Prague Dependency Treebank. In Š IMKOVÁ, M. (ed.) Insight into Slovak and Czech Corpus Linguistics, s. 54–73. Bratislava, Veda, 2005. H AJI Č, J. et al. PDT-VALLEX: Creating a Large-coverage Valency Lexicon for Treebank Annotation. In Proceedings of The Second Workshop on Treebanks and Linguistic Theories, 9, s. 57–68, 2003. H AJI Č, J. et al. Prague Dependency Treebank 2.0. Philadelphia, PA, USA, Linguistic Data Consortium, 2006. H AVRÁNEK, B. (ed.). Slovník spisovného jazyka českého. Praha, Academia, 1964. H ELBIG, G. – S CHENKEL, W. Wörterbuch zur Valenz und Distribution deutscher Verben. Leipzig, Bibliographisches Institut, 1969. 32 H LAVÁ ČKOVÁ, D. – H ORÁK, A. VerbaLex – New Comprehensive Lexicon of Verb Valencies for Czech. In Computer Treatment of Slavic and East European Languages, s. 107–115, Bratislava, 2006. JACKENDOFF, R. S. Semantic Structures. Cambridge, MIT Press, 1990. K ARLÍK, P. Hypotéza modifikované valenční teorie. Slovo a slovesnost. 2000, 61, s. 170–189. K ARLÍK, P. – N EKULA, M. – P LESKALOVÁ, J. (ed.). Encyklopedický slovník češtiny. Praha, Nakladatelství Lidové noviny, 2002. K ARLÍK, P. – N EKULA, M. – RUSÍNOVÁ, Z. (ed.). Příruční mluvnice češtiny. Praha, Nakladatelství Lidové noviny, 1996. K IPPER, K. – DANG, H. T. – PALMER, M. Class-Based Construction of a Verb Lexicon. In AAAI-2000 Seventeenth National Conference on Artificial Intelligence, Austin, TX, 2000. K IPPER -S CHULER, K. VerbNet: A broad-coverage, comprehensive verb lexicon. PhD thesis, Computer and Information Science Dept., University of Pennsylvania, Philadelphia, PA, 2005. K IRCHMEIER -A NDERSEN, S. Lexicon, Valency and the Pronominal Approach. An Application of the Pronominal Approach to Danish Verbs and Nouns. PhD thesis, Odense Universitet, 1997. KOMÁREK, M. et al. (ed.). Mluvnice češtiny 2. Praha, Academia, 1986. L EVIN, B. C. English Verb Classes and Alternations: A Preliminary Investigation. Chicago and London, The University of Chicago Press, 1993. L OPATKOVÁ, M. – PANEVOVÁ, J. Recent developments in the theory of valency in the light of the Prague Dependency Treebank. In Š IMKOVÁ, M. (ed.) Insight into Slovak and Czech Corpus Linguistics, s. 83–92. Bratislava, Veda, 2006. L OPATKOVÁ, M. – Ž ABOKRTSKÝ, Z. – S KWARSKA, K. Valency Lexicon of Czech Verbs: Alternation-Based Model. In Proceedings of the Fifth International Conference on Language Resources and Evaluation (LREC 2006), 3, s. 1728–1733. ELRA, 2006. M EJST ŘÍK, V. (ed.). Slovník spisovné češtiny pro školu a veřejnost. Praha, Academia, 2003. M EL’ ČUK, I. A. Dependency Syntax: Theory and Practice. Albany, State University of New York Press, 1988. M EL’ ČUK, I. A. Actants in semantics and syntax I: actants in semantics. Linguistics. 2004a, 42 (1), s. 1–66. M EL’ ČUK, I. A. Actants in semantics and syntax II: actants in syntax. Linguistics. 2004b, 42 (2), s. 247–291. M EL’ ČUK, I. A. – Z HOLKOVSKY, A. K. Explanatory Combinatorial Dictionary of Modern Russian. Vienna, Wiener Slawistischer Almanach, 1984. M IKULOVÁ, M. et al. Anotace na tektogramatické rovině Pražského závislostního korpusu. Anotátorská příručka. Technical Report TR-2005-28, ÚFAL MFF UK, Praha, 2005. N IŽNÍKOVÁ, J. – S OKOLOVÁ, M. Valenčný slovník slovenských slovies. Prešov, Filozofická fakulta Prešovskej univerzity, 1998. PALA, K. – Š EVE ČEK, P. Valence českých sloves. In Sborník prací FFBU, s. 41–54, Brno, 1997. PANEVOVÁ, J. On Verbal Frames in Functional Generative Description. The Prague Bulletin of Mathematical Linguistics. 1974, 22, s. 3–40. PANEVOVÁ, J. Formy a funkce ve stavbě české věty. Praha, Academia, 1980. PANEVOVÁ, J. More Remarks on Control. Prague Linguistic Circle Papers. 1996, 2, s. 101–120. PANEVOVÁ, J. Ještě k teorii valence. Slovo a slovesnost. 1998, 59, s. 1–13. PANEVOVÁ, J. Znovu o reciprocitě. Slovo a slovesnost. 2007, 68, s. 91–100. PANEVOVÁ, J. Some Issues of Syntax and Semantics of Verbal Modifications. In Proceedings of the First International Conference on Meaning-Text Theory (MTT 2003), s. 139–146, Paris, 2003. Ecole Normale Supérieure. PANEVOVÁ, J. Valency Frames and the Meaning of the Sentence. In L UELSDORFF, P. A. (ed.) The Prague School of Structural and Functional Linguistics, s. 223–243. Amsterdam, Philadelphia, John Benjamins Publishing Company, 1994. PANEVOVÁ, J. – M IKULOVÁ, M. On Reciprocity. The Prague Bulletin of Mathematical Linguistics. 2007, 87, s. 27–40. PANEVOVÁ, J. – Ř EZNÍ ČKOVÁ, V. K možnému pojetí všeobecnosti aktantu. In H LADKÁ, Z. – K ARLÍK, P. (ed.) Čeština - univerzália a specifika 3, s. 139–146, 2001. 33 PANEVOVÁ, J. – S KOUMALOVÁ, H. Surface and Deep Cases. In Proceedings of COLING 1992, s. 885–889, Nantes, France, 1992. PAULINY, E. Štruktúra slovenského slovesa. Bratislava, Slovenská akadémia vied a umení, 1943. P ETR, J. et al. (ed.). Mluvnice češtiny 1. Praha, Academia, 1986. P OLA ŃSKI, K. (ed.). Słownik syntaktyczno-generatywny czasowników polskich. Wrocław, Wydawnictwo Polskiej Akademii Nauk, 1980–1992. P OPOVA, M. Kratăk valenten rečnik na glagolite v săvremennia bălgarski knižoven ezik. Sofia, Bulgarian Academy of Sciences Publishing House, 1987. P USTEJOVSKY, J. The Generative Lexicon. Cambridge, MIT Press, 1995. RUPPENHOFER, J. et al. FrameNet II: Extended Theory and Practice (http://framenet.icsi.berkeley.edu/), 2006. S GALL, P. Valence jako jádro jazykového systému. Slovo a slovesnost. 2006, 67, s. 163–178. S GALL, P. Generativní popis jazyka a česká deklinace. Praha, Academia, 1967. S GALL, P. Teorie valence a její formální zpracování. Slovo a slovesnost. 1998, 59, s. 15–29. S GALL, P. – H AJI ČOVÁ, E. – PANEVOVÁ, J. The Meaning of the Sentence in Its Semantic and Pragmatic Aspects. Dordrecht, Reidel, 1986. S ILNICKIJ, G. Korreljacionnaja tipologija glagolnych sistem indoevropejskich i inostrukturnych jazykov. Smolensk, Russia, Rossijskaja akademija nauk, Institut lingvističeskich issledovanij, 1999. S KOUMALOVÁ, H. Czech syntactic lexicon. PhD thesis, Univerzita Karlova, Filozofická fakulta, 2001. Š MILAUER, V. Novočeská skladba. Praha, Nakladatel Ing. Mikuta, 1947. Š MILAUER, V. Novočeská skladba. Praha, SPN, 1966. S VOZILOVÁ, N. – P ROUZOVÁ, H. – J IRSOVÁ, A. Slovesa pro praxi. Praha, Academia, 1997. S VOZILOVÁ, N. – P ROUZOVÁ, H. – J IRSOVÁ, A. Slovník slovesných, substantivních a adjektivních vazeb a spojení. Praha, Academia, 2005. T ESNIÈRE, L. Eléments de syntaxe structurale. Paris, Librairie C. Klincksieck, 1959. E YNDE, K. – M ERTENS, P. La valence: l’approche pronominale et son application au lexique verbal. French Language Studies. 2003, s. 63–104. Ž ABOKRTSKÝ, Z. Valency Lexicon of Czech Verbs. PhD thesis, Charles University, Prague, 2005.

Log In

Türkçe Sıfatların İstem Bilgisi

Sign up for access to the world's latest research.

Related papers

Related topics