|
|
 |
.gif) |
I3 - Matematická lingvistika
Garantující pracoviště: Ústav formální a aplikované
lingvistiky Odpovědný učitel: Doc. RNDr. Jan Hajič, Dr.
Povinné předměty
| kód |
Předmět |
Kredity |
ZS |
LS |
| NMAI059 |
Pravděpodobnost a statistika |
|
6 |
2/2 Z+Zk |
— |
| NPFL012 |
Úvod do počítačové lingvistiky |
|
3 |
2/0 Zk |
— |
| NPFL006 |
Úvod do formální lingvistiky |
|
3 |
2/0 Zk |
— |
| NPFL067 |
Statistické metody zpracování přirozených
jazyků I |
|
6 |
2/2 Z+Zk |
— |
| NPFL068 |
Statistické metody zpracování přirozených
jazyků II |
|
6 |
— |
2/2 Z+Zk |
| NPOZ009 |
Odborné vyjadřování a styl |
|
3 |
— |
0/2 Z |
| NTIN090 |
Základy složitosti a vyčíslitelnosti |
1 |
5 |
2/1 Z+Zk |
— |
| NTIN066 |
Datové struktury I |
|
3 |
2/0 Zk |
— |
| NSZZ023 |
Diplomová práce I |
|
6 |
— |
0/4 Z |
| NSZZ024 |
Diplomová práce II |
|
9 |
0/6 Z |
— |
| NSZZ025 |
Diplomová práce III |
|
15 |
— |
0/10 Z |
1 Místo předmětu NTIN090 Základy složitosti
a vyčíslitelnosti je možné absolvovat dvojici předmětů NTIN062
Složitost I, NTIN064 Vyčíslitelnost I. Předmět NTIN090 bude
vyučován až od akademického roku 2009/2010.
Povinně volitelné předměty
Je požadováno splnění povinně volitelných předmětů z následujícího
seznamu v rozsahu alespoň 45 kreditů:
- všechny odborné lingvistické předměty, tj. předměty s kódem PFL
(s výjimkou výše uvedených povinných předmětů NPFL006, NPFL012,
NPFL067 a NPFL068)
- a dále předměty z následující tabulky
| kód |
Předmět |
Kredity |
ZS |
LS |
| NMAI060 |
Pravděpodobnostní metody |
|
3 |
2/0 Zk |
— |
| NMAI061 |
Metody matematické statistiky |
|
5 |
— |
2/1 Z+Zk |
| NAIL022 |
Metody logického programování |
|
3 |
2/0 Zk |
— |
| NAIL029 |
Strojové učení |
|
3 |
— |
2/0 Zk |
| NAIL072 |
Rozpoznávání vzorů |
|
3 |
— |
2/0 Zk |
| NDBI010 |
Dokumentografické informační systémy |
|
3 |
— |
2/0 Zk |
| NDBI029 |
Statistické aspekty dobývání znalostí z dat |
|
3 |
— |
1/1 Zk |
| NDBI031 |
Statistické metody v systémech pro dobývání
znalostí z dat |
|
3 |
0/2 Z |
— |
| NDMI007 |
Kombinatorické algoritmy |
|
6 |
2/2 Z+Zk |
— |
| NDMI010 |
Grafové algoritmy |
|
3 |
2/0 Zk |
— |
| NOPT041 |
Úvod do matematického programování a polyedrální
kombinatoriky |
|
5 |
— |
2/1 Z+Zk |
| NOPT042 |
Programování s omezujícími podmínkami |
|
3 |
2/0 Zk |
— |
| NTIN023 |
Dynamické grafové datové struktury |
|
3 |
2/0 Zk |
— |
| NTIN067 |
Datové struktury II |
|
3 |
— |
2/0 Zk |
Pokud si posluchač zapíše předmět NPRG023 Softwarový projekt
a téma vypracovaného projektu je lingvisticky zaměřeno, může požádat
o uznání kreditů získaných za práci na softwarovém projektu do
požadovaných 45 kreditů za povinně volitelné předměty. Započítání kreditů
musí posoudit a doporučit odpovědný učitel oboru.
Obor I3 je tvořen jediným studijním plánem.
Zkušební okruhy
- 1. Základy formálního popisu přirozených jazyků
- 2. Jazykové korpusy, strojové učení a stochastické
metody
- 3. Automatické zpracování přirozeného jazyka
Zkušební požadavky
1. Základy formálního popisu přirozených jazyků Závislostní
syntax. Formální definice a vlastnosti závislostních stromů
(závislosti, koordinace, projektivita). Syntax bezprostředních složek
a frázové gramatiky (základní principy, vývoj Chomského školy).
Základy obecné lingvistiky (zdroje a přínosy strukturní lingvistiky,
typologie jazyků, pojem funkce). Funkční generativní popis (základní
charakteristika, struktura rovin, valenční teorie, zachycení významu,
aktuální členění). Formální sémantika.
2. Jazykové korpusy, strojové učení a stochastické
metody Jazykové korpusy a lingvistická anotace (zdroje dat,
anotace, datové formáty, typologie korpusů, počítačová lexikografie,
wordnety). Metody strojového učení (učení založené na konceptu,
rozhodovací stromy, neuronové sítě, učení založené na příkladech,
vyhodnocování hypotéz, výpočetní aspekty strojového učení). Stochastické
metody a jejich aplikace v počítačové lingvistice (Teorie
informace, Bayesovské učení, HMM, algoritmy učení a zpracování,
aplikace v lingvistice). Návrh a vyhodnocování lingvistických
experimentů (příprava dat, standardní evaluační metriky, typy evaluace
podle úloh).
3. Automatické zpracování přirozeného jazyka Automatická
analýza jazyka (morfologie, syntax povrchová a hloubková, aplikace).
Generování přirozeného jazyka. Analýza a syntéza mluvené řeči
(jazykové modely, kombinace modelů). Vyhledávání a extrakce
informací. Strojový překlad (transfer, interlingua, metody překladu,
systémy pro češtinu, počítačem podporovaný překlad).
Doporučené předměty
| kód |
Předmět |
Kredity |
ZS |
LS |
| NPFL002 |
Úvodní seminář matematické lingvistiky I |
|
3 |
0/2 Z |
— |
| NPFL031 |
Úvodní seminář matematické lingvistiky II |
|
3 |
— |
0/2 Z |
| NPFL007 |
Počítačové zpracování přirozeného jazyka |
|
3 |
2/0 Z |
— |
| NPFL015 |
Nástroje pro automatický překlad |
|
3 |
0/2 Z |
— |
| NPFL026 |
Úvod do teoretické sémantiky |
|
3 |
— |
2/0 Zk |
| NPFL054 |
Úvod do strojového učení (v počítačové
lingvistice) |
|
6 |
2/2 Z+Zk |
— |
| NPFL063 |
Úvod do obecné lingvistiky |
|
3 |
2/0 Zk |
— |
| NPFL070 |
Zdroje lingvistických dat I |
|
3 |
0/2 Z |
— |
| NPFL076 |
Zdroje lingvistických dat II |
|
3 |
— |
0/2 KZ |
| NPFL071 |
Vybrané problémy z lingvistiky I |
|
3 |
0/2 Z |
— |
| NPFL075 |
Pražský závislostní korpus |
|
5 |
2/1 Zk |
— |
| NPFL079 |
Algoritmy rozpoznávání mluvené řeči |
|
6 |
— |
2/2 Z+Zk |
| NPFL083 |
Lingvistická teorie a gramatické formalismy |
|
5 |
— |
2/1 Z+Zk | |