Program přednášek

 1. Úvodní informace a přednáška na téma asociační pravidla
 2. Rozhodovací stromy I (ID3) a evaluace modelů
 3. Shlukování
 4. Regrese, logistická regrese, metoda největšího spádu
 5. Regex
 6. Rozhodovací stromy II (C4.5)
 7. Indexování textových dokumentů
 8. Vektorový a booleovský model vyhledávání
 9. PageRank a HITS
 10. Datové formáty
 11. Zvaná přednáška
 12. Příklady aplikací

Přednášející

Prof. Jan Rauch, Ing. Tomáš Kliegr

Přesný harmonogram pro aktuální semestr je zveřejněn v systému Insis.

Rozšiřující on-line materiály

 • Data minig (shlukování, asociační pravidla, rozhodovací stromy): on-line kurz s přednáškami na internetu Machine learning (Stanfordská univerzita), Data science (University Washington)
 • Analýza velkých dat (shlukování, asociační pravidla, Pagerank ): slidy a kniha ke kurzu Mining Massive Dataset (Stanfordská univerzita)
 • Information retrieval (vektorový model, invertovaný soubor, regulární výrazy): otevřený on-line kurz Information Retrieval (Stanfordská univerzita)

Obsah těchto webových stránek by neměl být interpretován jako doporučení konkrétních webových stránek, knihy nebo softwaru Vysokou školou ekonomickou v Praze.