The logo of the Faculty Faculty of Mathematics and Physics
Czech version ...

Change encoding
CU > MFF > Study > Bachelor and Master Study > Study programs > I3 Matematická lingvistika
The logo of the Faculty
The logo of the Faculty
linka

 I3 - Matematická lingvistika

Garantující pracoviště: Ústav formální a aplikované lingvistiky
Odpovědný učitel: Doc. RNDr. Jan Hajič, Dr.

Povinné předměty

kód Předmět Kredity ZS LS
NMAI059 Pravděpodobnost a statistika   6 2/2 Z+Zk
NPFL012 Úvod do počítačové lingvistiky   3 2/0 Zk
NPFL006 Úvod do formální lingvistiky   3 2/0 Zk
NPFL067 Statistické metody zpracování přirozených jazyků I   6 2/2 Z+Zk
NPFL068 Statistické metody zpracování přirozených jazyků II   6 2/2 Z+Zk
NPOZ009 Odborné vyjadřování a styl   3 0/2 Z
NTIN090 Základy složitosti a vyčíslitelnosti 1 5 2/1 Z+Zk
NTIN066 Datové struktury I   3 2/0 Zk
NSZZ023 Diplomová práce I   6 0/4 Z
NSZZ024 Diplomová práce II   9 0/6 Z
NSZZ025 Diplomová práce III   15 0/10 Z

1 Místo předmětu NTIN090 Základy složitosti a vyčíslitelnosti je možné absolvovat dvojici předmětů NTIN062 Složitost I, NTIN064 Vyčíslitelnost I. Předmět NTIN090 bude vyučován až od akademického roku 2009/2010.

Povinně volitelné předměty

Je požadováno splnění povinně volitelných předmětů z následujícího seznamu v rozsahu alespoň 45 kreditů:

- všechny odborné lingvistické předměty, tj. předměty s kódem PFL (s výjimkou výše uvedených povinných předmětů NPFL006, NPFL012, NPFL067 a NPFL068)

- a dále předměty z následující tabulky

kód Předmět Kredity ZS LS
NMAI060 Pravděpodobnostní metody   3 2/0 Zk
NMAI061 Metody matematické statistiky   5 2/1 Z+Zk
NAIL022 Metody logického programování   3 2/0 Zk
NAIL029 Strojové učení   3 2/0 Zk
NAIL072 Rozpoznávání vzorů   3 2/0 Zk
NDBI010 Dokumentografické informační systémy   3 2/0 Zk
NDBI029 Statistické aspekty dobývání znalostí z dat   3 1/1 Zk
NDBI031 Statistické metody v systémech pro dobývání znalostí z dat   3 0/2 Z
NDMI007 Kombinatorické algoritmy   6 2/2 Z+Zk
NDMI010 Grafové algoritmy   3 2/0 Zk
NOPT041 Úvod do matematického programování a polyedrální kombinatoriky   5 2/1 Z+Zk
NOPT042 Programování s omezujícími podmínkami   3 2/0 Zk
NTIN023 Dynamické grafové datové struktury   3 2/0 Zk
NTIN067 Datové struktury II   3 2/0 Zk

Pokud si posluchač zapíše předmět NPRG023 Softwarový projekt a téma vypracovaného projektu je lingvisticky zaměřeno, může požádat o uznání kreditů získaných za práci na softwarovém projektu do požadovaných 45 kreditů za povinně volitelné předměty. Započítání kreditů musí posoudit a doporučit odpovědný učitel oboru.

Obor I3 je tvořen jediným studijním plánem.

Zkušební okruhy

1. Základy formálního popisu přirozených jazyků
2. Jazykové korpusy, strojové učení a stochastické metody
3. Automatické zpracování přirozeného jazyka

Zkušební požadavky

1. Základy formálního popisu přirozených jazyků
Závislostní syntax. Formální definice a vlastnosti závislostních stromů (závislosti, koordinace, projektivita). Syntax bezprostředních složek a frázové gramatiky (základní principy, vývoj Chomského školy). Základy obecné lingvistiky (zdroje a přínosy strukturní lingvistiky, typologie jazyků, pojem funkce). Funkční generativní popis (základní charakteristika, struktura rovin, valenční teorie, zachycení významu, aktuální členění). Formální sémantika.

2. Jazykové korpusy, strojové učení a stochastické metody
Jazykové korpusy a lingvistická anotace (zdroje dat, anotace, datové formáty, typologie korpusů, počítačová lexikografie, wordnety). Metody strojového učení (učení založené na konceptu, rozhodovací stromy, neuronové sítě, učení založené na příkladech, vyhodnocování hypotéz, výpočetní aspekty strojového učení). Stochastické metody a jejich aplikace v počítačové lingvistice (Teorie informace, Bayesovské učení, HMM, algoritmy učení a zpracování, aplikace v lingvistice). Návrh a vyhodnocování lingvistických experimentů (příprava dat, standardní evaluační metriky, typy evaluace podle úloh).

3. Automatické zpracování přirozeného jazyka
Automatická analýza jazyka (morfologie, syntax povrchová a hloubková, aplikace). Generování přirozeného jazyka. Analýza a syntéza mluvené řeči (jazykové modely, kombinace modelů). Vyhledávání a extrakce informací. Strojový překlad (transfer, interlingua, metody překladu, systémy pro češtinu, počítačem podporovaný překlad).

Doporučené předměty

kód Předmět Kredity ZS LS
NPFL002 Úvodní seminář matematické lingvistiky I   3 0/2 Z
NPFL031 Úvodní seminář matematické lingvistiky II   3 0/2 Z
NPFL007 Počítačové zpracování přirozeného jazyka   3 2/0 Z
NPFL015 Nástroje pro automatický překlad   3 0/2 Z
NPFL026 Úvod do teoretické sémantiky   3 2/0 Zk
NPFL054 Úvod do strojového učení (v počítačové lingvistice)   6 2/2 Z+Zk
NPFL063 Úvod do obecné lingvistiky   3 2/0 Zk
NPFL070 Zdroje lingvistických dat I   3 0/2 Z
NPFL076 Zdroje lingvistických dat II   3 0/2 KZ
NPFL071 Vybrané problémy z lingvistiky I   3 0/2 Z
NPFL075 Pražský závislostní korpus   5 2/1 Zk
NPFL079 Algoritmy rozpoznávání mluvené řeči   6 2/2 Z+Zk
NPFL083 Lingvistická teorie a gramatické formalismy   5 2/1 Z+Zk
   Content responsibility: STUD
 0   0   0   9   9   2   7 
Last modification: September 1, 2008, http://www.mff.cuni.cz/toISO-8859-2.en/studium/bcmgr/ok/i3b53.htm?auth=yes