Jak na věc


concession preklad

Příklady překladu slova "concession" z webu:

    Kritériem pro zařazení komplexní formy konektoru (např. „přesto však“) pod určité užití základního slovníkového hesla (např. pod „opposition“ u základního slovníkového hesla „přesto“¨) je schopnost základního konektoru („přesto“) vyjádřit daný diskurzní vztah („opposition“) i samostatně. Automatický skript označil u základních konektorů ve slovníku všechna užití (diskurzní typy), které jsou v datech PDiT 2.0 vyjádřeny (v souvislosti s tímto konektorem) výhradně jeho komplexními formami – tedy případy, kdy samotný základní konektor tento význam vyjádřit neumí (resp. takový případ se nevyskytl v datech). Ve webovém rozhraní i v prostředí TrEdu jsou tato užití označena červeným vykřičníkem. Anotátor měl pak možnost zvážit, zda jde pouze o řídká data či zda samotný základní konektor daný diskurzní typ skutečně nevyjadřuje. Ve druhém případě bylo dané užití od daného základního konektoru odstraněno. Příslušné komplexní formy tak zůstanou reprezentovány u daného diskurzního typu jen u ostatn
    Základní verze slovníku byla poloautomaticky vyextrahována z anotovaných dat Pražského diskurzního korpusu 2.0, který představuje nejnovější diskurzní anotaci dat Pražského závislostního korpusu. Extrakce probíhala ve třech krocích (krok 2 byl proveden ručně, kroky 1 a 3 automaticky):
    Pro technické zpracování slovníku byl zvolen datový formát a skupina aplikací Prague Markup Language (PML). Jedná se o variantu formátu XML uzpůsobenou pro zachycení jazykových dat, zejména treebanků (řada treebanků vytvořených na ÚFALu používá tento formát, včetně PDiT 2.0). Užití datového formátu PML přináší tři základní výhody: (1) data je možno editovat v editoru TrEd, (2) data je možno dávkově zpracovat v programu btred a (3) data je možno prohledávat pomocí vyhledávacího nástroje PML-TQ (Prague Markup Language - Tree Query). Další potenciální výhodou je možnost snadného prolinkování slovníku se zdrojovým korpusem.


Extrakce základní verze slovníku

    Pro ruční kontroly dat bylo implementováno rozšíření editoru stromů TrEd. Je volně ke stažení z manažeru rozšíření z menu TrEdu a obsahuje definici struktury slovníku (tzv. schéma), definici způsobu zobrazení slovníkových dat (tzv. stylesheet) a rovněž makra usnadňující časté anotační úkony. Součástí ručních kontrol je jednak kontrola automaticky vyplněných hodnot, posouzení sporných významů konektoru (vzhledem ke komplexním formám – viz předchozí odstavec), doplnění atributů, které nebyly vyplněny automaticky, překlad hlavních slovníkových hesel do angličtiny, doplnění glos k jednotlivým užitím (a doplnění jejich překladů), překlad komplexních forem a modifikací, označní jejich typů, výběr nejvhodnějších příkladů a rovněž jejich překlad do angličtiny. Podstatné informace, které nemohly být přidány v rámci zmíněných strukturních atributů, byly dodány jako volný text v k tomu určeném atributu „note“ (anglicky).


Anglický slovník - překlad concession do češtiny

    Primární datový formát slovníku PML je vhodný pro počítačové zpracování a pro ruční úpravy slovníku. Pro snadnou prezentaci slovníku bez nutnosti instalace např. editoru TrEd byl vytvořen skript (programovací jazyk Perl, prostředí btred), pomocí něhož je možno slovník z primárního formátu PML vyexportovat do verze HTML. Ta je od října 2017 umístěna na webu a zpřístupňuje slovník v jeho aktuální pracovní verzi. V graficky přehledné formě představuje hlavní informace o jednotlivých slovníkových heslech. Pro lepší orientaci umožňuje filtrovat seznam slovníkových hesel podle tří kritérií (která zatím nelze kombinovat): základní filtr rozlišuje konektory primární a sekundární, další filtr rozlišuje konektory podle diskurzního typu, který jsou schopny vyjádřit, a poslední filtr třídí konektory podle slovního druhu. Barevně (a rovněž slovním upozorněním) jsou rozlišena ručně plně zpracovaná a zkontrolovaná hesla, hesla ručně zpracovaná a zkontrolovaná, ale bez překladů příkladů, a hesla zatím
    Během předchozího roku řešení (2016) byla na základě studií obdobných zdrojů navržena struktura slovníku českých diskurzních konektorů. Rok 2017 byl věnován praktické aplikaci tohoto návrhu. Z dat Pražského diskurzního korpusu 2.0 (Prague Discourse Treebank 2.0; PDiT 2.0) byla vyextrahována základní verze slovníku, následně byla prozatím nejfrekventovanější hesla ručně upravena a doplněna. Podrobnosti v následujících bodech.
    Takto vygenerovaná základní verze slovníku obsahuje všechny konektory anotované v PDiT 2.0, přičemž u každého je (díky ručnímu kroku 2) rozlišeno, zda se jedná o základní konektor (či jeho variantu) nebo zda jde o modifikaci či komplexní formu, které jsou v rámci jednotlivých diskurzních typů sdruženy pod příslušné základní konektory.

Copyright © Dossani milenium group 2000 - 2020
cache: 0000:00:00